Big Data, Analytics, Data Science e Data Scientist: soluzioni e skill della Data Driven Economy - Big Data 4Innovation
FacebookTwitterLinkedInWhatsApp

Big Data, Analytics, Data Science e Data Scientist: soluzioni e skill della Data Driven Economy

Mauro Bellini

La sfida più grande per la maggior parte delle aziende oggi è nella capacità di acquisire un vantaggio competitivo lavorando sui dati. Tutte le aziende e tutte le Pubbliche Amministrazioni stanno diventando grandi “fabbriche di dati”. Noi stessi contribuiamo costantemente, consapevolmente e spesso anche inconsapevolmente, alla “produzione di dati”.

Iscriviti all’evento
Effetto Big Data,  diventare Data Scientist è sempre più di moda

Se si guarda oggi ai principali fenomeni che caratterizzano lo sviluppo dell’economia e del sociale come l’Industria 4.0, l’Impresa 4.0, il Digital Banking, le Smart City, la Smart Agrifood e tantissimi altri, si deve osservare che la vera base di questi fenomeni è tutta chiaramente polarizzata sui dati e sulla capacità di lavorare su una visione che è nello stesso tempo più alta e ampia, ma anche più precisa, dei dati. Più cresce l’orientamento delle aziende a sviluppare e attuare forme di Data Driven Innovation più acquistano importanza le due parole chiave che accompagnano questo processo, parole potenti, che racchiudono da sole il vero significato di questa trasformazione digitale basata sui dati: Conoscenza e Precisione.

 

Il lavoro sui dati e in particolare sui Big Data allarga da una parte i confini della conoscenza delle imprese e delle Pubbliche Amministrazioni anche ad ambiti un tempo inesplorati o impraticabili. E sempre il lavoro sui Big Data permette contemporaneamente di aumentare esponenzialmente la precisione di questa conoscenza e la precisione delle decisioni e delle azioni che si appoggiano su questa conoscenza.

 

Oggi nelle imprese l’utilizzo dei dati è spesso parziale e contingente, utilissimo certamente per raggiungere determinati obiettivi, ma limitato. Mentre appare evidente che il vero valore di questo patrimonio e la vera ricchezza si possono esprimere nel momento in cui si mette in atto un processo di valorizzazione di tutti i dati aziendali partendo da una visione di insieme di tutte le fonti.

Indice dei contenuti:

I dati come asset, come leva per il business

In questo scenario il tema dei dati non deve più essere visto o letto come un tema solo tecnologico, ma come un vettore di business e per questo la definizione di una strategia aziendale legata a Big Data e Data Science non deve essere limitata ai soli “tavoli tecnici”.

Ecco che prende forma un profilo professionale nuovo, caratterizzato da una vocazione e una cultura fortemente interdisciplinare, un ruolo che è chiamato a svolgere un compito di altissima responsabilità: contribuire a trasformare i dati in conoscenza e la conoscenza in valore di business (nelle imprese) o di servizio (nelle Pubbliche Amministrazioni o nelle istituzioni). Il profilo è quello del Data Scientist (leggi il servizio su come si diventa Data Scientist). Una “etichetta” questa ancora poco diffusa in molte realtà, ma nella sostanza si vede crescere a vista d’occhio una “comunità” di professionisti che fanno crescere tanto la cultura del dato nelle imprese quanto la cultura di “nuovi sistemi di produzione pensati per lavorare sui dati”.

Il ruolo del Data Scientist

Per cogliere le opportunità dei Big Data, servono chiaramente nuove competenze, così come nuovi modelli di governance. Il Data Scientist è la figura che oggi meglio corrisponde al profilo di competenze e di esigenze di sviluppo che arriva dalle aziende che si collocano su un percorso di Data Driven Innovation. Nello stesso tempo il Chief data officer (CDO) appare come la figura manageriale che è chiamata ad assumere la responsabilità di definire lo sviluppo delle strategie per la valorizzazione dei dati e per la gestione del ciclo di vita del dato, dal momento della sua raccolta fino alla fase di distribuzione, di conservazione ed eventualmente di vendita o trasferimento.

I Data Scientist e i CDO per definizione sono figure con una fortissima vocazione multidisciplinare: matematica e tecnologia, statistica e sociologia, business e capacità di rappresentazione grafica sono alcuni dei requisiti di questa professione.

Data Science: un lavoro bellissimo

Stiamo parlando di un lavoro bellissimo, come ha anche autorevolmente ricordato l’Harward Business Review che, anticipando i tempi, già nel 2012, aveva titolato un proprio servizio su questa professione: Data Scientist: The Sexiest Job of the 21st Century. (Leggi a questo LINK il servizio completo)

Un lavoro appunto affascinante che si concentra sul valore della conoscenza per generare nuova conoscenza. Un lavoro che richiede una fortissima concentrazione sui dati per esercitare una grande capacità di intuizione, di immaginazione per sviluppare teorie, per una sfida costante alla ricerca di “schemi” che permettano di individuare, interpretare, capire e poi gestire comportamenti e fenomeni.

Un lavoro che chiede nello stesso tempo anche tantissima creatività, anche nella gestione degli strumenti di lavoro che il Data Scientist è chiamato a plasmare, adattare, sviluppare.

Difficile inquadrare questa professione, ancora così giovane se si pensa che la stessa definizione di Data Scientist è arrivata solo nel 2008 per opera di D.J. Patil, e di Jeff Hammerbacher, all’epoca responsabili di progetti di Data e Data Analytics a LinkedIn e Facebook.

Una professione ambita quella disegnata nel post dell’Harward Business Review, ma ancora per “persone rare”. Lo Scienziato dei Dati deve unire come abbiamo citato tante competenze e tante sensibilità: tecnica, informatica, matematica, ma anche una propensione da “hacker” ad aprire “porte” apparentemente chiuse o non praticabili per individuare nuovi percorsi di conoscenza. Il tutto con una capacità di analisi, di lettura dei fenomeni di business, e nello stesso tempo con una grande capacità di rappresentazione dei dati stessi: precisione nell’identificare il senso di un risultato e precisione nel rappresentarlo a colleghi o figure che devono essere in grado di comprenderlo per tradurlo in azioni di business o in servizi.

Il ruolo delle competenze è straordinariamente importante, ma non basta. Lo Scienziato dei Dati ha bisogno, costantemente, di affinare la propria capacità di analisi e di testing utilizzando strumenti che devono adeguarsi al contesto e agli obiettivi. Per il Data Science la dotazione di tool è straordinariamente importante ed è un fattore strategico di successo.

Big Data e Data Science: i componenti

Prima di entrare nel merito delle figure che sono chiamate a lavorare in tutte quelle imprese che sono destinate a diventare “fabbriche di dati” è utile vedere il concetto stesso di Big Data e Data Science.

I temi di riferimento per inquadrare le opportunità e le caratteristiche del tema Analytics si focalizzano su alcuni ambiti:

  • Big Data
  • Data Science
  • Business Intelligence
  • Real Time Analytics
  • Data Analytics
  • Data Mining
  • … in aggiornamento costante

Letteralmente con Big Data si vuole descrivere la capacità di sviluppare attività di calcolo e di intelligenza su grandissimi volumi di dati e di sviluppare più forme di lettura, di interpretazione e di conoscenza, sia quelle più contingenti, finalizzate a un utilizzo specifico e perimetrato (come ad esempio possono essere i dati relativi ai pagamenti digitali dei flussi di cassa di un supermercato), sia poi l’analisi di tutti i fenomeni che si possono individuare, leggere e schematizzare attraverso una lettura più “alta”, sempre di grandissimi volumi di dati (come ad esempio i riflessi a livello di customer experience legati alla introduzione di un nuovo sistema di pagamento digitale tanto a livello del singolo supermercato quanto a livello di area o di catena. O ancora, per fare un altro esempio, nella identificazione delle relazioni che questo tipo di servizi di payment ha saputo sviluppare in termini di percezione del brand nei social o in termini di maggiore utilizzo del proprio smartphone nel punto vendita).

Gli esempi sono probabilmente infiniti e con i Big Data li si affronta prestando attenzione alle 3 “V”chiave che vanno a comporre la carta d’identità dei dati. 3 “V” che nel corso del tempo sono poi diventate 5:

  1. Volume
  2. Velocità
  3. Varietà
  4. Valore
  5. Veridicità

Data Science come percorso per definire il futuro dei dati

In uno scenario che vede crescere intorno a noi organizzazioni, imprese, Pubbliche Amministrazioni che generano costantemente nuovi dati, che producono prima di tutto appare necessario pensare alla necessità di pensare e definire a tutti gli effetti il futuro dei dati. Alla Data Science è affidato anche questo compito e il video che segue aiuta a comprendere quanto sia rilevante e importante questa sfida. Ogni problema è un problema che fa riferimento a dei dati. La digitalizzazione permette di ricondurre ai dati l’analisi e la comprensione dei fenomeni così come la ricerca di soluzioni.

Guarda il video “Data science: Defining the future of data”

Il percorso Data Driven

Dietro a questi “segni particolari” ci sta la funzione centrale dei Big Data che è quella di fornire la miglior rappresentazione possibile della realtà attraverso i dati. Ma per rappresentare in modo verosimile prima e veritiero poi la realtà con i dati è necessario sviluppare metodiche e logiche di rappresentazione con processi di verifica e di controllo.

Con questo approccio si va a collocare l’impresa all’interno di uno scenario di tipo Data Driven costituito da 4 grandi tipologie di Data Analysis.

1 – Descriptive Analytics

Si parte dall’Analisi Descrittiva che è costituita da tutti i tool che permettono di rappresentare e descrivere anche in modo grafico la realtà di determinate situazioni o processi. Nel caso delle imprese parliamo ad esempio della rappresentazione di processi aziendali. La Descriptive Analytics permette la visualizzazione grafica dei livelli di performance.

2 – Predictive Analytics

Si passa poi all’Analisi Predittiva basata su soluzioni che permettono di effettuare l’analisi dei dati al fine di disegnare scenari di sviluppo nel futuro. Le Predictive Analytics si basano su modelli e tecniche matematiche come appunto i Modelli Predittivi, il Forecasting e altri.

3 – Prescriptive Analytics

Con le Analisi Prescrittive si entra nell’ambito di strumenti che associano l’analisi dei dati alla capacità di assumere e gestire processi decisionali. Le Prescriptive Analytics sono tool che mettono a disposizione delle indicazioni strategiche o delle soluzioni operative basate sia sull’Analisi Descrittiva sia sulle Analisi Predittive.

4 – Automated Analytics

Il quarto punto scenario è rappresentato dalle Automated Analytics che permettono di entrare nell’ambito dell’automazione con soluzioni di Analytics. A fronte dei risultati delle analisi descrittive e predittive le Automated Analytics sono nella condizione di attivare delle azioni definite sulla base di regole. Regole che possono essere a loro volta il frutto di un processo di analisi, come ad esempio lo studio dei comportamenti di una determinata macchina a fronte di determinate condizioni oggetto di analisi.

La situazione Data Analytics in Italia nel 2016

Le Descriptive Analytics sono oggi una realtà. I dati dell’Osservatorio Big Data del Politecnico di Milano del 2016 indicano che la diffusione di soluzioni per l’Analisi Descrittiva arriva quasi al 90% del campione coinvolto nella ricerca.

Decisamente più ridotta la diffusione delle Predictive Analytics che con una presenza vicina al 30% hanno guadagnato consensi in alcuni specifici ambiti applicativi. Scenario che esce decisamente rafforzato se si guarda anche ai progetti pilota che sfiorano a loro volta il 30% portando nel complesso a un 60% il peso delle Predictive Analytics.

La Prescriptive Analytics è presente in modo importante, ma ancora limitato a un 23%, mentre le Automated Analytics con il 10% di diffusione stanno a dimostrare che per quanto ancora limitato e prevalentemente in chiave di progetti pilota questo tipo di Analytics ha già iniziato a svolgere un ruolo importante.

La visione d’insieme di tutte queste piattaforme di Analytics permette di dire che il tema dei dati e della Data Analytics è entrato a far parte in modo strutturale e organico nei processi aziendali e rappresenta un veicolo fondamentale per le imprese per “estrarre valore” dai dati.

Un altro dato importante che arriva dall’Osservatorio Big Data riguarda la diffusione dei Big Data nel nostro paese con la possibilità di disegnare una geografia di diffusione dell’approccio Data Driven in diversi settori. In termini di valore di business il mercato Big Data è cresciuto del 15% nel corso del 2016 con un valore di 905 milioni di euro. Ma al di là dei valori assoluti (leggi i dati aggiornati dell’Osservatorio Big Data 2017) è utile vedere la composizione del business Big Data nel nostro paese. Dai dati emerge che il mercato è ancora indirizzato verso la Business Intelligence che nel 2016 valeva qualcosa come 722 milioni di euro mentre la componente Big Data ha generato un valore di 183 milioni di euro. La prospettiva cambia se si guarda alle dinamiche dei trend: la Business Intelligence è cresciuta con un tasso del 9% mentre i Big Data hanno segnato una accelerazione del 44%.

I settori più “attenti” ai Big Data nel 2016

Molto interessante la visione dei mercati di destinazione dei Big Data dove si possono intravedere alcune conferme, sia nella quota di mercato sia nei trend di crescita rispetto all’anno precedente:

  • Banche: 29%, con tassi di crescita sul 2015 tra il 15% e il 25%
  • Manifatturiero: 22%, con tassi di crescita sul 2015 tra il 15% e il 25%
  • Telco e Media: 14%, con tassi di crescita sul 2015 tra il 10% e il 15%
  • PA e Sanità: 8%
  • Servizi: 8%, con tassi di crescita sul 2015 tra il 10% e il 15%
  • Grande Distribuzione Organizzata (7%)
  • Utility: 6%, con tassi di crescita sul 2015 tra il 15% e il 25%
  • Assicurazioni: 6%, con tassi di crescita sul 2015 del 25%

Se si guarda anche alle dimensioni delle imprese, le stime dell’Osservatorio ci dicono che il ruolo delle piccole e medie imprese nel mercato degli Analytics in Italia è ancora marginale. I 905 milioni complessivi generati dai Big Data arrivano solo nel 13% dei casi dalle PMI, che peraltro rappresentano il 98% delle imprese italiane.

La situazione Data Analytics in Italia nel 2017

Un preziosissimo aggiornamento sulla situazione Big data e Data Analytics nel nostro paese arriva dalla ricerca 2017 “Big Data is now: tomorrow is too late”, condotta dall’Osservatorio Big Data Analytics & Business Intelligence della School of Management del Politecnico di Milano.

La ricerca mostra un settore in ottima salute che con una crescita del 22% arriva a 1.103 milioni di Euro con una progressione rispetto ai 905 milioni di euro del 2016 quando era cresciuto del 15% evidenziando già un miglioramento rispetto al 14% di crescita del 2015. Il 2017 appare come un anno che abilita a nuovi sviluppi nel 2018 con aziende sempre più orientate verso l”estrazione di valore” dai dati.

L’utilizzo di Big Data Analytics appare come una leva di sviluppo che sostiene fenomeni importanti come Industry 4.0, Digital Banking, Smart retail, o per supportare processi di adempimento a normative come GDPR e, nel caso delle banche, come tutti gli adempimenti dell’Open banking legati alla normativa PSD2. Il tutto con il fine di individuare nuove forme di generazione di valore basate sui dati anche in termini di Data Monetization.

I settori più “attenti” ai Big Data nel 2017

Dal punto di vista dei mercati di destinazione la ricerca dell’Osservatorio mette in evidenza come il mondo delle banche e della finanza è uno dei settori più attenti a questo tipo di investimenti con una quota che nel 2017 arriva al 28%. L’Industria 4.0 con il Manifatturiero arriva al 24% e seguono poi Telco e i Media con una quota del 14%, la PA e tutto il mondo della Smart Health al 7%. Grande Distribuzione Organizzata e dl Retail ce con il 7% mostrano un interesse crescente per i Big Data così come pure le Utility (6%) e le Assicurazioni (6%). Assicurazioni, Manifatturiero e Servizi crescono con tassi superiori al 25%, Banche, Grande Distribuzione Organizzata e Telco e Media esprimono  tassi di crescita tra il 15% ed il 25%.

Le tipologie di Data Analytics adottate in Italia nel 2017

Interessante vedere la diffusione degli Analytics nel corso del 2017 con le

  • Le Descriptive Analytics presenti nel 100% del campione che ormai adottano in modo strutturale  gli strumenti di Analytics orientati a descrivere la situazione attuale/passata dei processi aziendali e/o aree funzionali. Possiamo definire questa tipologia di strumenti come la “base” dei Big Data e sono costituiti da strumenti permettono di accedere e analizzare i dati e permettono una visualizzazione degli indicatori di prestazione.
  • Le Predictive Analytics sono arrivate nel corso del 2017 al 73% con la diffusione di strumenti avanzati per l’analisi dei dati in particolare grazie a strumenti di forecasting e a soluzioni per la gestione di modelli predittivi.
  • Le Prescriptive Analytics rappresentano una quota del 33% e vedono la diffusione di strumenti che permettono alle imprese di disporre di soluzioni operative e strategiche basati sulle analisi dei dati
  • Le Automated Analytics, ovvero gli strumenti che permettono di automatizzare le azioni collegate all’analisi dei dati rappresentano nel 2017 una quota dell’11%. 

La Data Science è una “partita” che si gioca in team

Nelle imprese che scelgono un approccio Data Driven la Data Science è prima di tutto e soprattutto da vivere in team. Una delle domande da porsi è proprio quella di valutare se si hanno le competenze, gli skill, le motivazioni giuste per “giocare” in un Data Science team.

Sul tema arriva il contributo di analisi di IBM che si pone l’obiettivo di individuare e comprendere le competenze necessarie per svolgere al meglio le attività di Data Science e per capire in quale modo i professionisti dei Big Data interagiscono tra loro, lavorando in team, al fine di investire nelle personalità più idonee a questo “sport” e nelle tipologie di formazione e di training più adatte.

Il documento Data science is a team sport. Do you have the skills to be a team player? (per saperne di più e per scaricarlo vai a questo LINK ) definisce le caratteristiche dei team di lavoro che si occupano di Data Science, ponendo una particolare attenzione ai compiti, alle abilità e alle competenze tecniche delle professioni del Data Scientist, data engineer, developer e del business analyst e sottolineando l’importanza di costruire e potenziare conoscenze e competenze per il futuro della scienza dei Big Data attraverso piani di supporto per i lavoratori come quelli che offre IBM.

Il white paper è diviso in sei parti (1. Introduction; 2. The data scientist; 3. The data engineer; 4. The developer; 5. The business analyst; 6. Data science teams: The new agents of change); la sezione finale (7. Resources) mette a disposizione una serie di risorse sul tema.

Il Data science is a team sport. Do you have the skills to be a team player? accenna al cambiamento portato dalla Big Data Revolution nell’ambito della Digital Economy e alle implicazioni che comporta l’interazione con i Big Data (come si fa a dare valore a questa grande massa di informazioni? perché è importante saper analizzare i dati in modo intelligente e veloce?). Partendo dal presupposto che la maggior parte delle persone che producono dati lavorano in team, vengono introdotte le qualità richieste ai team di Data Science. Per ognuna delle figure sono indicate le attività di competenza, le caratteristiche, le abilità e viene presentata una sintesi delle top skill.

Quella del Data Scientist è una professione in continua evoluzione, che richiede competenze in svariati ambiti disciplinari. Un esperto Data Scientist è in grado di esaminare dati che provengono da fonti multiple e disparate, guardandoli da diverse angolazioni. L’attività di analisi svolta dal Data Scientist, attraverso il collegamento di nuove informazioni a dati storici, ha lo scopo di individuare una relazione o una linea di tendenza che può indirizzare il lavoro del team. Le competenze tecniche spaziano dalla conoscenza dei linguaggi di programmazione alla capacità di utilizzo di strumenti di analisi come Hadoop e Spark. Il data engineer a sua volta aiuta a raccogliere, organizzare e riordinare i dati che il Data Scientist utilizza per costruire le analisi. I data engineer hanno familiarità con le tecnologie di base di Hadoop come MapReduce, Apache Hive e Apache Pig. Hanno inoltre esperienza nell’utilizzo degli strumenti di base di SQL e NoSQL e nelle attività di data wharehousing ed ETL.

Nel team la figura del developer entra in gioco tipicamente in una seconda fase dell’attività del Data Scientist. A lui è affidato il compito di trasformare l’operato del team Data Science in un prodotto o in un servizio. I developer devono ovviamente avere forti competenze nell’ambito della programmazione. Il business analyst, infine, ha il compito di comprendere le esigenze del business; non deve avere necessariamente forti competenze tecniche ma necessita di un background tecnologico che gli permette di sviluppare analisi dettagliate, usando le tecnologie disponibili senza dover necessariamente svolgere attività di coding.

Quelle della Data Science sono professioni in continua evoluzione che, completandosi l’un l’altra, costituiscono il «cuore pulsante» della Big Data Economy. Per costruire un team di lavoro valido e solido è necessario prevedere dei percorsi di formazione e aggiornamento continui per i professionisti della Data Science.

Alle basi dei Big Data e della Data Science

Per comprendere lo sviluppo dei Big Data occorre anche saper individuare i modelli di utilizzo degli Analytics nelle imprese e ancora una volta è necessaria una distinzione duale nelle tipologie di dati:

  • dati strutturati
  • dati destrutturati

Nel caso dei dati destrutturati si tratta poi tipicamente di

  • testo
  • immagini
  • video
  • audio
  • elementi di calcolo

Richiamando ancora i dati dell’Osservatorio Big Data del Politecnico di Milano si vede che le imprese italiane nel 2016 hanno lavorato prevalentemente sui dati strutturati che rappresentano ancora l’83% dei volumi legati ai sistemi di Analytics. I dati destrutturati, con un +31% rispetto al 2015, crescono il doppio rispetto ai dati strutturati (15%).

Dato destrutturato vuol dire dato eterogeneo, che significa, banalizzando un po’, dati che rispecchiano la “eterogeneità” della realtà. In altre parole si sentono gli effetti dell’Internet of Things che si aggancia ai fenomeni già più consolidati del Mobile e dei Social Media. Maggiore aderenza alla realtà vuol anche dire inoltre maggiore possibilità di trasformare i dati in conoscenza reale. Per le aziende questo significa maggiori capacità di rappresentare la realtà e dunque maggiori opportunità di agire sulle leve che permettono di ottenere un risparmio, di attuare efficienze, di ottimizzare processi interni e di sviluppare nuovi prodotti e servizi.

Un orientamento per i Data Scientist: il Magic Quadrant di Gartner

Se da una parte i Data Scientist sono un supporto per le imprese che devono orientarsi nell’ambito dei Big Data dall’altra i Data Scientist (e con loro le imprese impegnate in un percorso di Data Driven Innovation) hanno bisogno di orientarsi per capire come definire l’organizzazione dei team e le piattaforme di lavoro.

Ed è proprio quando emerge la necessità di orientarsi che è necessario guardare alle mappe che nel caso specifico dell’ICT possono essere i Magic Quadrant di Gartner dove sono rappresentati in modo visuale e facilmente comprensibile i player di riferimento per ciascun mercato, posizionandoli nell’uno o nell’altro quadrante, sulla base di una serie di valutazioni rigorose sulle strategie, le tendenze, il livello di maturità, la capacità di visione.
I quadranti vengono aggiornati con cadenza periodica e in genere tengono il polso degli scenari e delle tendenze più attuali.

E già l’evoluzione delle mappe è sintomatica di un trend che caratterizza il mercato. Proprio quest’anno Gartner ha deciso di sostituire il Quadrant, dedicato ai player nel mondo delle piattaforme di Advanced Analytics, con uno che si focalizza invece sulle piattaforme per la Data Science.
Il Magic Quadrant prende in esame 16 player, dai big del comparto fino alle startup. Una scelta che è naturale conseguenza della metodologia con la quale sono stati valutati i partecipanti.
In primo luogo, Gartner è partita dagli scenari d’uso, identificandone tre critici per chi si occupano di Data Science: in primo luogo il miglioramento della produzione, seguito dall’esplorazione di nuovi scenari di business, per approdare infine all’Advanced Prototyping, vale a dire tutte quelle situazioni nelle quali la Data Science e in particolare a supporto del Machine Learning possono migliorare gli approcci tradizionali.

I sedici player inclusi nel quadrante indirizzano tutti questi casi d’uso e sono stati misurati da Gartner sulla base di 15 funzionalità critiche delle loro soluzioni:

  1. capacità di accesso a dati da fonti multiple e destrutturate
  2. funzionalità di Data Preparation che consentono di filtrare e trasformare i dati per le fasi di modellazione, Data Exploration e Visualization
  3. funzionalità di automazione
  4. coerenza del look and feel e intuitività dell’interfaccia utente
  5. correlazione con strumenti di Machine Learning
  6. funzionalità di Advanced Analytics
  7. criteri di flessibilità, estensibilità e apertura
  8. performance
  9. scalabilità
  10. possibilità di utilizzo in scenari di Fast Deployment
  11. funzionalità di management
  12. sviluppo e gestione di modelli
  13. disponibilità di preconfigurazioni ad esempio per attività di cross selling o di analisi dei social media
  14. capacità di essere utilizzate in contesti di collaboration
  15. coerenza lungo tutta la pipeline

Nel quadrante in alto a sinistra, quello più ambito nel quale rientrano i leader di mercato, con massima capacità di visione, si colloca IBM cui Gartner riconosce completezza di visione e indica come punti di forza la capacità di portare innovazione continua a una base di clienti sempre più ampia, l’impegno sulle tecnologie open source, la capacità di supportare vaste basi di dati oltre alle funzionalità di modellazione e gestione.
Gartner sottolinea l’offering delle soluzioni SPSS, affiancate anche dalla piattaforma specifica per la Data Science IBM Data Science experience (DSX), auspicando una futura convergenza delle due a beneficio di una maggiore chiarezza per gli utenti finali. (Per scaricare la ricerca Gartner vai a questo LINK)

Big Data tema prioritario per il Top Management

Ma se tutte le aziende sono destinate a diventare “fabbriche di dati” la cultura del dato è destinata a entrare stabilmente nella cultura del Top Management. Lo stesso Osservatorio Big Data Analytics & Business Intelligence della School of Management del Politecnico di Milano mette in evidenza che quello dei Big Data è un tema prioritario per gli imprenditori e per il Top Management che si stanno ponendo nella condizione di affrontarlo sia in termini organizzativi sia sotto il profilo delle piattaforme, ovvero nella analisi e nella identificazione di soluzioni espressamente dedicate all’analisi di dati e allo sviluppo di azioni in grado di incidere sul business, sulla riduzione dei costi, sulla conoscenza dei clienti o sullo sviluppo di nuovi e servizi. O, tanto per citare un fenomeno di grande attualità nell’ambito dell’Industry 4.0, della trasformazione da prodotto a servizio. Il concetto stesso di “servitizzazione” passa attraverso la totale rappresentazione digitale di prodotti fisici, al punto da rendere fruibili in forma digitale i servizi resi disponibili dai prodotti fisici. Si tratta in questo caso di un passaggio che necessita del contributo fondamentale degli “Scienziati dei Dati”. E così pure uno degli esempi più concreti dell’Industry 4.0, quello della manutenzione predittiva, che ha saputo trasformare in risultati e azioni concrete le progettualità dell’Industria 4.0, è il frutto del lavoro dei Data Scientist.

Ma uno dei principali punti focali sulla Data Science, sui dati e sui servizi legati ai dati è oggi da individuare nel CRM e in tutte le progettualità che concorrono alla gestione dei rapporti con i clienti e alla customer experience. Si può certamente dire che oggi uno dei motori principali dell’attenzione sui temi degli Analytics e dei Big Data è rappresentato dal marketing e dalle vendite. A conferma che una delle principali spinte allo sviluppo di queste soluzioni e di questa professione arriva dalla capacità di mettere il più rapidamente possibile a terra i risultati di queste innovazioni: in termini di nuovi clienti o di migliori vendite sui clienti esistenti.

Un’altra grande area di sviluppo arriva dalla spinta dei social media o meglio ancora dalla “capacità di ascolto” dei social media. Ancora una volta sono i dati che si possono mettere in relazione con il CRM e che permettono leggere al di là dei dati più “superficiali” per estendere e approfondire la conoscenza della clientela.

Il rapporto tra Internet of Things, Big Data e Data Science

Un’area più recente di sviluppo, ma incredibilmente importante dal punto di vista dei volumi di dati generati è rappresentata dall’Internet of Things. Solo oggi si riesce ad apprezzare la ricchezza e la complessità di un fenomeno che non solo sa far “parlare le cose”, ma le sa mettere in relazione e, se accompagnato da una vera strategia di analisi e di interpretazione dei dati, consegna nuove forme di conoscenza attraverso lo sviluppo di ambienti intelligenti, di un nuovo rapporto uomo-macchina, di connected machine, di sistemi di produzione e di stabilimenti integrati, di nuove soluzioni di sicurezza e di nuove forme di prevenzione basate sullo studio dei comportamenti. Ambienti intelligenti nella forma di Building Automation che adattano la loro morfologia e i loro servizi in funzione del comportamento delle persone che frequentano gli ambienti e che lavorano in quelle aree aprono nuove prospettive tanto in termini di produttività quanto di rapporto tra persone e strumenti di produzione. Sono temi che attengono alla Data Science e ai Big Data che si concretizzano, ad esempio, in maggiore sicurezza per le persone e in forme di risparmio per il Facility Management.

Le direzioni aziendali hanno iniziato a intuire il valore di business di questi dati ed esprimono la necessità di trasformarlo in realtà. Appare a loro e a tutti chiaro che non è solo un tema di tecnologie, in molti casi pronte e consolidate. È un problema di organizzazione, che va indirizzata, modellata e costruita ed è un tema culturale, di consapevolezza dei propri dati, di costruzione di modelli in grado di “non farsi travolgere” dai dati selezionando esattamente ed effettivamente quello che serve. La sfida è nel passaggio da una situazione in cui prevale il tema della gestione della quantità di dati a una situazione in cui la centralità è nella qualità e nella precisione del dato.

Dalla Data Driven Innovation alla Data Monetization

Concepire e attuare una strategia Data Driven significa anche consegnare alla Data Science la responsabilità per ideare, individuare e attuare nuove forme di “monetizzazione” dei dati. Con questo approccio si entra nel campo della Data Monetization ovvero di studio di progettualità che riescono a estrarre un valore inedito e un tempo impensabile dai dati.

Mobile, Internet of Things, Social Media, apparati intelligenti nelle Smart City e nella Smart Home, solo per fermarci a questi esempi, mettono a disposizione delle aziende quantità enormi di dati. In buona misura vengono generati e utilizzati per uno o più finalità ben precise, espressamente legate ai servizi che hanno messo in moto il processo di sviluppo dei dati stessi. Ma quegli stessi dati, adeguatamente interpretati e analizzati, possono essere utilizzati e monetizzati anche per altri scopi che solo una visione di insieme dei comportamenti e delle criticità e opportunità legate a questi comportamenti permette di individuare.

La monetizzazione dei dati si può esprimere, semplificando molto, nella vendita o nello scambio dei dati o ancora nella capacità di sfruttare il valore dei dati per generare nuovi prodotti o nuovi servizi.

La Data Monetization è uno dei vettori di sviluppo nelle aziende che dopo aver scelto un approccio di tipo Data Driven si organizzano per sviluppare nuove forme di valore espressamente basate sui dati. Possono essere aziende di qualsiasi tipo e la Data Monetization può affiancare, complementare o assistere il contemporaneo sviluppo dei core business tradizionali.

Anche in ragione del posizionamento delle aziende la Data Monetization si esprime in diverse forme e modalità, ancora una volta per semplificare si può suddividere in

  • Data Monetization diretta
  • Data Monetization indiretta

Data Monetization Diretta

La Datamonetizzazione diretta si concretizza con la vendita o lo scambio di dati, come può accadere a un’azienda del retail che raccoglie dati dai propri clienti sulle preferenze di pagamento e trasferisce ad esempio a una società di digital payment, nel rispetto delle regole della privacy, i dati di coloro che possono essere potenzialmente interessanti a una proposta di servizi innovativi di payment.

A sua volta la monetizzazione diretta si può attuare con diversi livelli di sofisticazione.

Dalla vendita nuda e cruda dei daticosì come sono”, ma in questo caso il digitale potrebbe non essere un fattore discriminante.

Alla vendita di dati “trattati”, ovvero che sono in grado di esprimere una conoscenza, una forma di interpretazione della realtà sottostante e di chi li acquista. E l’acquisto stesso avviene sulla base del valore di conoscenza che questi dati sono già in grado di lasciare intuire. In questi casi il Data Scientist è la figura che con la sua capacità di lettura dei dati è in grado di incidere direttamente sulla loro “vendibilità”. Si può dire che la Data Monetization è una vendita che attiene tanto ai dati quanto alla capacità di lettura dei dati da parte del Data Scientist.

Data Monetization Indiretta

Con la Data Monetization indiretta ci si riferisce invece allo sfruttamento economico dei dati per altre attività. I dati legati al comportamento di un determinato tipo di gomma per pneumatici possono essere utilizzati per esplorare l’utilizzo della stessa tipologia di materie prime in altri ambiti. La vendita o il trasferimento di quei dati può da una parte aprire nuovi scenari applicativi e dall’altra accelerare il lavoro di chi intende sviluppare quella nuova forma di business. Ancora una volta la strategia è tutta nella capacità di contare su Data Scientist capaci di leggere al di là del valore “primario” del dato, ma di metterlo in relazione con altri dati e altri scenari. Il servizio che arriva dalla Data Monetization è il risultato di una sintesi tra le competenze legate al core business dell’impresa e la capacità di interpretazione dei dati e dei mercati possibili.

Data Monetization: chi vende e chi acquista

Se si guarda poi dal lato cliente la Data Monetization chiama ancora una volta in causa i Data Scientist. Chi acquista dati lo fa a sua volta per monetizzarli e quando in azienda arrivano dati esterni il processo è quello dell’integrazione con i dati già in possesso all’interno dell’azienda, di arricchimento del dataset a disposizione sia in termini di volume sia di qualità.

Se ci sono aziende espressamente e interamente dedicate a questa attività come i Data Provider ci sono anche organizzazioni che affiancano questa attività al core business, mettendo a valore gli investimenti in Data Driven Innovation primariamente indirizzati al core business, ma comunque in grado di attivare nuove forme di business. Ecco che in queste aziende prendono a loro volta forma attività di Data Providing.

Molti esempi di questa “diversificazione” del business arrivano dal mondo Telco e dal retail, imprese che,grazie ai loro business, hanno la possibilità di raccogliere elevate moli di dati sui comportamenti dei loro consumatori che se adeguatamente interpretati e messi in relazione con altri dati possono permettere anche ad altri attori di sviluppare nuove forme di business.

Il ruolo chiave della Privacy

Una importante competenza in capo al team Data Science è quella della privacy. Nel momento in cui si entra nell’ambito della Data Monetization ecco che occorre affrontare il tema normativo e nella fattispecie l’autorizzazione del trattamento per le finalità dichiarate. Stiamo parlando dell’Articolo 6 del General Data Protection Regulation (GDPR) che delibera proprio sulle condizioni che permettono o non permettono il trattamento. Non è questa la sede, ma il principio normativo in base al quale si lavora sui dati solo se l’interessato ha espresso il consenso al trattamento dei propri dati personali per una o più specifiche finalità è un vero e proprio “faro” nell’attività del Data Scientist. Questo significa che la definizione del trattamento dati rappresenta un momento chiave, durante il quale è necessario avere chiaro lo scopo per cui si andrà a realizzare analisi sui dati. Una volta iniziata la raccolta dei dati, non è possibile sottoporli ad analisi e utilizzi non specificati a priori. Ecco un altro tassello del mosaico del lavoro del Data Scientist che è bene sia chiamato a esprimere la sua visione e la sua competenza anche nella fase di sviluppo di tutte le azioni che portano alla raccolta dei dati, sia quando questi sono chiaramente dati legati al comportamento delle persone fisiche sia quando sono legati al comportamento di ambienti, vetture o sistemi di produzione che possono però comprendere anche dati legati, magari non consapevolmente, a persone coinvolte (perché presenti negli ambienti, perché alla guida delle vetture, perché operative accanto ai sistemi di produzione).

Una prima carta d’identità del Data Scientist

Se la figura del Data Scientist nasce, almeno come identità nel 2008, per opera di D.J.Patill e di Jeff Hammerbacher, è nel 2012 che inizia a essere oggetto di attenzione anche della pubblica opinione. Si è già detto dell’articolo Data Scientist: The sexiest job of 21Th Century di Harward Business Review, accanto a questa tappa va ricordato che nel 2015 Obama riconosce ufficialmente il ruolo e la figura del Data Scientist nominando DJ Patill come primo US Chief Data Scientist.

Il Data Scientist è a tutti gli effetti una figura professionale in via di definizione. Alcuni aspetti di questa professione appaiono già molto chiari e definiti, altri sono e saranno un derivato di esperienze e sperimentazioni. La certezza oggi più solida riguarda il fatto che il Data Scientist non può non avere forti competenze interdisciplinari, deve padroneggiare gli Advanced Analytics e i Big Data e dunque deve dimostrare solide competenze informatiche, ma deve saper leggere oltre il dato, individuare i pattern con competenze a livello di statistica e di matematica, deve poi saper dialogare con le aree di business e deve avere un quadro dei modelli di business attuali e potenziali che si “appoggiano” sui dati.

Le attività di base del Data Scientist

Partendo da una forte schematizzazione la giornata di lavoro del Data Scientist si sviluppa su queste tipologie di attività

  • Mappatura, organizzazione e controllo delle fonti di dati aziendali.
  • Creazione, organizzazione e verifica dei flussi dei dati aziendali.
  • Modellizzazione dei dati grazie allo sviluppo di algoritmi matematico-statistici –Trasformazione e traduzione dei dati raccolti in informazioni.
  • Studio e analisi del “valore dei dati” per ogni area di business.
  • Studio e analisi delle metodiche di “valorizzazione” dei dati per ogni area di business attuale o potenziale.
  • Capacità di analisi della customer experience e dei dati relativi ai clienti in funzione alle attività che costituiscono il core business dell’azienda.
  • Capacità di individuare, creare e sviluppare forme di interazione tra le varie linee di business aziendali allo scopo di individuare e creare nuove occasioni di sviluppo sia tattico (cross selling) sia strategico (nuovi prodotti).
  • Capacità di analisi dei dati relativi ai clienti in funzione dello sviluppo di nuovi servizi o nuovi prodotti.

Per svolgere queste attività le competenze specifiche richieste possono essere così articolate:

  • Informatica – conoscenza dei linguaggi di programmazione e conoscenza di strumenti per la gestione dei Big Data.
  • Project Management – capacità digestione dei progetti, di coordinamento e di controllo di tutte le attività finalizzate al raggiungimento di specifici obiettivi con determinate risorse
  • Matematica e analisi – capacità di analisi dei dati e di creazione di modelli unitamente alla capacità di interpretazione dei risultati.
  • Statistica – da intendere come attività di lavoro sui dati stessi, validazione e data cleaning, data profiling, utilizzo di strumenti e di linguaggi statistici e conoscenza delle tecniche statistiche come regressione, clustering, risoluzione di problemi di ottimizzazione.
  • Conoscenza di business – intesa come conoscenza del core business aziendale, dei mercati nei quali opera e delle criticità e opportunità che rappresentano le principali dinamiche dell’impresa.
  • Comunicazione e rappresentazione grafica – capacità di rappresentazione dei risultati in forma grafica, per favorire la comprensione e l’interpretazione dei risultati in particolare alle figure di business.
  • Soft skill – intesa come capacità di gestire le relazioni (molto importante soprattutto nella logica interdisciplinare del ruolo e delle competenze) e dunque anche di teamwork.

Anche dal punto di vista della “collocazione” in azienda il Data Scientist riflette il suo profilo“interdisciplinare”. Come “posizione” questa figura fa da ponte tra il mondo IT e le LOB (Line of business), ma con forme di collaborazione e con un dialogo costante anche con l’area R&D.

Il ruolo del Chief data officer (CDO)

Il Chief data officer (CDO) è una figura di tipo manageriale che è chiamata a guidare le risorse destinate al lavoro sulla Data Science e ha il compito di definire, presentare e attuare le strategie di Data Driven Innovation, Data Analytics e Big Data.

In concreto il CDO è la figura che ha la delega per gestire l’acquisizione, l’analisi, l’intelligenza e l’azione sui dati aziendali. In termini di skill si tratta di una figura che deve unire competenze tecniche, manageriali, di business, ma che nello stesso tempo deve possedere una serie di soft skill per dialogare, conoscere e interpretare le esigenze “Data Driven” di tutte le aree aziendali.

In termini di compiti e di attività il CDO si occupa di tutti gli aspetti che compongono la Data Driven Strategy aziendale. Si parte ovviamente dalla definizione della Data Driven Strategy aziendale che si attua mettendo a disposizione dell’azienda una visione globale e completa del patrimonio di dati aziendali con idee e progetti per sviluppare progetti e azioni volte alla valorizzazione di questo patrimonio. In uno scenario che vede sempre di più i dati come asset il CDO è colui che ha il compito di far crescere questo asset con una specifica strategia del dato, che si appoggia sulla organizzazione e gestione di un team (CDO Team) composto da diverse figure tra cui i Data Scientist.

Il CDO ha anche il compito strategico di sviluppare e attuare una strategia per il controllo e la verifica della Data Quality. Più cresce la quantità di dati presente nelle aziende più cresce l’esigenza di un controllo di qualità sui dati stessi. La Data Quality può incidere direttamente sull’azione di business e proprio per questo sono tante le imprese che stanno lavorando per assicurare e aumentare la qualità del dato. Sulla Data Quality insistono diversi fattori (controllo delle fonti, controllo dei flussi, aspetti tecnologici, metodiche di analisi e “qualità” delle tecnologie e altre ancora) che vanno gestite attraverso la definizione e lo sviluppo di standard sia metodologici sia di tipo tecnologico. Per la qualità del dato un tema fondamentale è rappresentato dalla responsabilità del CDO di estendere la propria responsabilità su tutto il ciclo di vita dei dati aziendali.

Data Science case history: AMC Networks punta sui Big Data per conoscere meglio il pubblico

Negli ultimi dieci anni il settore della TV via cavo negli Stati Uniti ha vissuto un periodo di forte crescita, una vera e propria «goldenage» che ha potato alla realizzazione di contenuti creativi di alta qualità. In questa fase AMC Networks ha prodotto alcuni show di grande successo come Breaking Bad, Mad Men e The Walking Dead. La compagnia, però, non ha voluto «adagiarsi sugli allori»: ha sentito il bisogno di sfruttare le potenzialità dei Big Data proprio per studiare i gusti dei propri utenti e per approfondire al meglio il comportamento dei propri clienti.

Un piano per organizzare le fonti di dati

AMC Networks ha prima di tutto sviluppato un piano per “ordinare” tutte le fonti di dati. A partire da veri e propri data provider come Nielsen e comScore, a dati che arrivano dai canali come AMC’s TV, e poi le piattaforme di vendita come iTunes e Amazon e dalle piattaforme di streaming on demand come Netflix e Hulu. Da tutte queste fonti arriva una grandissima quantità di informazioni, che è possibile sfruttare per capire più chiaramente chi sono i propri visualizzatori, cosa desiderano, come vivono e come usufruiscono dei programmi allo scopo di comprendere come si può catturare meglio loro attenzione e dunque come si può sviluppare meglio il core business dell’azienda.

Analisi e modellazione dei dati al servizio delle strategie di marketing

La decisione di AMC di utilizzare le soluzioni IBM è arrivata con la necessità di capire le esigenze del pubblico sfruttando l’analisi dei Big Data per programmazioni e decisioni di marketing e di creare una soluzione che fosse disegnata sulle specifiche esigenze e tipicità di mercato di AMC Networks. Per questo sono stati realizzati specifici modelli statistici che permettono all’azienda di raffinare le proprie strategie di marketing e di prendere decisioni più precise riguardo alla promozione dei propri programmi.

Da IBM Cognos a SPSS Modeler a InfoSphere

La tecnologia adottata per raggiungere questi obiettivi è composta dai software IBM® PureData® System for Analytics, IBM Cognos® Business Intelligence, IBM SPSS® Modeler, IBM InfoSphere® Master Data Management e IBM InfoSphereDataStage® e permette di focalizzare tutta l’attenzione e tutte le risorse sulla conoscenza con un metodo di lavoro che consente a AMC di “fare tutto internamente” riducendo drasticamente costi e tempi, e di disporre di una capacità di analisi in pochi minuti o persino secondi anche per attività che sino a poco tempo fa richiedevano giorni o settimane e il supporto di partner esterni.

Big Data al servizio di clienti e partner

A trarre beneficio dalla scelta di AMC saranno anche le compagnie pubblicitarie partner: il prossimo passo, infatti, sarà quello di fornire agli inserzionisti un accesso a questa ricca serie di dati e strumenti analitici, permettendo di ottimizzare le proprie campagne e di attirare un pubblico più ampio (sia attraverso canali lineari che digitali). La tecnologia dei Big Data IBM ha permesso dunque a AMC Networks di migliorare i propri rapporti con consumatori e inserzionisti, creare contenuti migliori, metterli sul mercato in modo più efficace raggiungendo un numero sempre maggiore di spettatori.

La case history Big Data completa

Per capire come la tecnologia dei Big Data può essere di aiuto nel mondo dei media e dell’entertainment si suggerisce la lettura del case AMC Networks (Leggi la storia completa a questo LINK ) con un dettaglio delle motivazioni che hanno guidato la scelta delle soluzioni IBM e una analisi delle caratteristiche e dei benefici. In particolare la partnership tra AMC e IBM è raccontata attraverso la testimonianza del SVP Business Intelligence di AMC Vitaly Tsivin, una overview degli obiettivi, un’indicazione dei componenti software della soluzione IBM, una rappresentazione di una dashboard di IBM Cognos utilizzata da AMC e un approfondimento sulle ragioni che hanno portato AMC a rivolgersi alla scienza dei Big Data e naturalmente i vantaggi ottenuti.

 

Servizio realizzato da Mauro Bellini il 10 Novembre 2017

Aggiornato da Mauro Bellini il 27 Novembre 2017

 

 

Immagine fornita da Shutterstock

Direttore responsabile delle testate "verticali" di Digital360: Blockchain4Innovation, PagamentiDigitali, Internet4Things, BigData4Innovation e Agrifood.Tech si occupa di innovazione digitale applicata alla realtà delle imprese, delle pubbliche amministrazioni e del sociale
FacebookTwitterLinkedInWhatsApp

Commenta per primo

Lascia un commento

L'indirizzo email non sarà pubblicato.


*


FacebookTwitterLinkedInWhatsApp

Utilizzando il sito, accetti l'utilizzo dei cookie da parte nostra. maggiori informazioni

Questo sito utilizza i cookie per fornire la migliore esperienza di navigazione possibile. Continuando a utilizzare questo sito senza modificare le impostazioni dei cookie o cliccando su "Accetta" permetti il loro utilizzo.

Chiudi