Nasce una nuova generazione di professionisti: il Data Scientist

di Alessandra Gualtieri

30 Gennaio 2012 07:30

logo PMI+ logo PMI+
Le aziende che saranno capaci di utilizzare e gestire al meglio i dati avranno un vantaggio competitivo sugli altri.
Articolo gentilmente concesso da Nicola Pozzati, HR Director, EMC Italia

 

 

Quante volte lo abbiamo sentito dire, il dato è al centro di tutto. Sui dati, disponibili in mille formati e modalità differenti, si basano le decisioni e le azioni delle aziende, come degli individui. E non possiamo nemmeno dire che il potenziale che i dati disponibili offrono sia sempre sfruttato al meglio.

Una banca specializzata in mutui potrebbe ad esempio utilizzare la tecnologia GPS tra gli strumenti di valutazione del rischio, monitorando con Google Maps le aree interessate, in modo da poter analizzare la propria attività in un contesto geospaziale. Oppure un’azienda retail potrebbe accedere alle informazioni relative a social network, contenuti blog e ricerche di analisti – o demografiche – al fine di incrociare tutti i dati e individuare tendenze e correlazioni significative per la fidelizzazione dei clienti.

Pensate se le aziende del mondo fossero veramente in grado, allo stesso modo, di accedere a dati – strutturati e no – e di poterli successivamente analizzare, da qualsiasi numero e tipologia di fonti essi provengano, per poi utilizzarli in modo intelligente per raggiungere i propri obiettivi e superare le proprie sfide …

Questo è il mondo dei Big Data, e chi saprà trovare il modo di utilizzare al meglio questo asset che tutte le aziende si trovano in casa, disporrà di un vantaggio competitivo significativo.

Se le organizzazioni di tutto il mondo stanno concentrando sempre più le loro attenzioni ed i loro investimenti in quest’area, qui non si parla solo di tecnologia. Oltre alle soluzioni in grado di gestire questa massa di dati, e di trasformarla in informazioni utili, servono anche persone in grado di seguire queste soluzioni, più dal punto di vista strategico che tecnico. In altre parole, serve una nuova generazione di professionisti in grado di trasformare una sempre maggiore quantità di dati in spunti che consentano alle aziende di competere e innovare al meglio. Occorrono figure professionali, forti di un range di competenze almeno parzialmente inedito.

 

Grandi quantità di dati, sfide ed opportunità

Secondo un recente studio, condotto da IDC e commissionato da EMC, nell’immediato futuro verranno creati 1,8 zettabyte di dati e le aziende avranno la responsabilità di archiviarne e gestirne circa l’80%. La ricerca prevede che, entro il 2020 – per gestire questa crescita imponente – le aziende avranno bisogno di 10 volte il numero di server che possiedono ora.

Tuttavia la maggior parte delle aziende non si sente pronta ad affrontare la sfida. Un’indagine di Gartner ha evidenziato come la crescita dei dati rappresenti la più grande sfida per i CIO (Chief Information Officer) legata alle infrastrutture hardware di data center, con un 47% di intervistati che la reputa uno dei loro primi tre elementi di criticità.

Questo ‘enigma’ rappresenta però sia una sfida sia una straordinaria opportunità. Dunque un nuovo approccio si rende necessario, sia nella gestione dei dati, sia nel cercare di migliorare la capacità collettiva di sfruttare l’IP aziendale che è a portata di mano. Questo approccio dovrebbe essere adottato sia in relazione alla tecnologia sia a coloro che lavorano con essa.

 

Nasce il Data Scientist

Quali caratteristiche e responsabilità deve avere un Data Scientist? Come e dove può fare la differenza quando si parla di gestione e sfruttamento ottimale delle opportunità generate dalle grandi quantità di dati eterogenei di cui le organizzazioni dispongono?

Ecco alcune delle responsabilità che un Data Scientist dovrebbe avere:

  • Identificare algoritmi specifici per il data mining
  • Decidere quali tra i possibili criteri di analisi siano i più importanti
  • Sviluppare modelli innovativi per migliorare qualità, gestione, estrazione, modellazione, consegna e creazione dei dati
  • Astrarre le informazioni ricevute, e su queste innestare una serie di indicazioni concrete, siano esse strategiche o operative.

L’elenco, come si può facilmente immaginare, potrebbe ancora continuare …

Oltre alla quantità di dati che le aziende devono conservare, il processo di data mining diventa sempre più complesso man mano che le aziende implementano risorse storage e infrastrutture aggiuntive, atte a soddisfare le sfide legate ai “grandi dati”.

I dati sono ovunque ed il Data Scientist dovrà vagliare una serie di diverse fonti prima di decidere quali possono essere utilizzate dalla sua organizzazione come fonte di informazioni utili. La maggior parte di questi “scienziati “dovrà andare ad incrociare tra loro informazioni o contenuti provenienti da più fonti, sia che si tratti di aggiornamenti di stato su siti di social network, log del web server o registrazioni delle transazioni online.

Dopo aver acquisito i dati, un scienziato dovrà eseguire il processo di conditioning (che utilizza tecniche di gestione e ottimizzazione dei dati che a loro volta portano ad un routing intelligente). Se un numero sempre maggiore di dati viene elaborato in formati facilmente utilizzabili, ne esistono altri difficili da analizzare, come quelli dei dati geospaziali. Dato che le fonti di dati misurabili in giga o terabyte sono sempre più comuni, gli scienziati dovranno inevitabilmente impiegare nuove tipologie di database analitici. Greenplum, per esempio, possiede veloci algoritmi di data mining in grado di elaborare grandi quantità di dati in tempi molto rapidi.

La scelta dello strumento di analisi dei dati dipende dal tipo di data mining richiesto. Alcuni strumenti di business intelligence presenti sul mercato, come Cognos o Siebel, consentono agli utenti di analizzare i dati storici in modo che le aziende possano migliorare i loro prodotti. Al tempo stesso, strumenti di analisi high-end come SAS, sono più predittivi e le aziende possono utilizzarli per scopi quali prevenzione delle frodi e previsioni sull’andamento della concorrenza.

Naturalmente, per affrontare le complessità del data mining, dovranno affrontare questa sfida tenendo conto di tutti gli aspetti informatici. Hanno anche bisogno di una presa di coscienza dei problemi legali, legati al fatto di trattare dati privati ??o protetti  provenienti da fonti esterne. Per il Data Scientist è inoltre essenziale possedere competenze statistiche, se deve ricercare modelli nei dati, così come è indispensabile la conoscenza di altre aree della matematica, quali metodi di calcolo, probabilità, numerici e digital sign processing .

Stiamo sorprendentemente scoprendo che gli “scienziati “non solo necessitano di competenze tecniche e scientifiche, ma è altresì importante che abbiano interesse per le arti e creatività in modo che possano produrre visualizzazioni intelligenti dei dati e quindi operare opportune correlazioni e relazioni tra le diverse parti. Questo lato creativo della scienza richiede un innato interesse, quasi infantile, verso l’esplorazione. Pensate ai ragazzi che smontano giochi o vecchi computer portatili e cercano di vedere ciò che li fa funzionare. Questo è il tipo di mentalità di cui il Data Scientist di successo necessita.

Le ricerche di questi professionisti popolano spesso i siti specializzati e mostrano che le aziende ripongono grandi aspettative quando si tratta di trovare una figura professionale dotata di tali abilità. Le aziende desiderano che queste nuove figure mescolino magia informatica con caratteristiche che potrebbero essere associate ad un moderno Leonardo Da Vinci. Così come la necessità di consulenti di social media è cresciuta con la nascita dell’era del social network, così sono sempre più numerose le ricerche di questi Data Scientist che vengono avviate per gestire l’esplosione dei dati. L’antropologo culturale e futurista Thornton May, descrive la nuova figura professionale come “l’eroe dei tempi futuri”.

Tuttavia, rimane ancora moltissima ambiguità su quali mansioni questi scienziati siano chiamati a svolgere e quali siano gli skill-set di cui hanno bisogno. A quanto pare deve essere dotato di punti di forza in una serie di discipline informatiche, eccellere nelle capacità di analisi del business e possedere una mente creativa, curiosa e legale.