Come diventare data scientist: studi e possibilità
13 Ottobre ore 12.20
Il data scientist è un professionista con una specializzazione nell’ambito della raccolta e dell’analisi dei big data, una grande quantità di dati. Il data scientist ha competenze di tipo informatico, matematico e statistico, utili all’elaborazione e all’interpretazione dei dati al fine di ricavare informazioni e indicazioni di natura strategica per orientare l’operato del soggetto per il quale lavora.
Data scientist: cosa fa?
Quotidianamente lo specialista data scientist utilizza strumenti e software avanzati per analizzare in modo dettagliato i dati, all’interno dei quali cerca schemi e pattern funzionali alla comprensione di alcuni aspetti cruciali per l’attività di un’aziende, ente o organizzazione.
Generalmente si occupa anche della restituzione di questi dati, che devono essere comunicati alle posizioni apicali dell’azienda o organizzazione. Per questa ragione sono richieste anche doti comunicative all’interno delle skills del data scientist.
Prima di proseguire con l’approfondimento delle mansioni del data scientist, dei percorsi per diventarlo e di altri aspetti pertinenti alla professione vogliamo chiarire la differenza tra data scientist e data analyst, che spesso confonde le idee. Il Data scientist e il data Analyst sono due figure cruciali nell’analisi dei dati. Mentre il primo si concentra sulla fase di raccolta e interpretazione, il secondo utilizza tecniche avanzate di analisi per sviluppare soluzioni innovative.
In questo articolo stiamo approfondendo la prima figura. Entriamo ancora più nel dettaglio nell’esplorazione delle azioni quotidiane del data scientist.
Le attività principali di un data scientist sono:
- raccogliere enormi volumi di dati strutturati e non strutturati
- pulire i dati per eliminare le informazioni irrilevanti e preparare i dati per la pre-elaborazione e la modellazione
- eseguire analisi esplorative dei dati (EDA, Exploratory Data Analysis) per determinare come gestire i dati mancanti e per cercare tendenze e opportunità
- codificare nuovi algoritmi per la raccolta e l’elaborazione dei data set
- comunicare previsioni e risultati agli stakeholder attraverso report e data visualization
- raccomandare modifiche a procedure e strategie esistenti
Come diventare data scientist
Per formarsi adeguatamente in Data Science, la scienza di pertinenza dei professionisti di cui ci stiamo occupando è necessario essere in possesso di una laurea.
Chiunque abbia conseguito un diploma presso un istituto secondario di secondo grado generalmente non possiede sufficienti competenze e conoscenze nelle materie utili per affrontare questa professione.
Tendenzialmente le lauree per diventare data scientist sono quelle di tipo scientifico, matematico e statistico come: Matematica, Ingegneria, Fisica, Informatica, Statistica, Economia. Ci riferiamo soprattutto a lauree specialistiche, poiché è richiesto in massimo grado di specializzazione per prepararsi all’inserimento concreto in questo ambito lavorativo.
La preparazione va completata con la competenza nella programmazione con linguaggi orientati all’analisi statistica dei dati, a partire da R e Python, e conoscenze di Analytics e Machine Learning.
Stiamo comprendendo che si tratta di discipline, materie e studi molto approfonditi e che richiedono costante aggiornamento e uno studio che poggia su basi solidissime. Infatti, non di rado è richiesta anche una specializzazione di livello superiore, come un Master in Data Science e AI e/o percorsi di formazione attraverso i MOOC, i Massive Open Online Courses (formazione a distanza) come quelli di EMMA, un’iniziativa dell’Unione europea.
Una parte importante della formazione e preparazione riguarda l’esperienza sul campo. Avere alle spalle tirocini e stage, o in generale progetti concreti ai quali si è preso parte contribuisce all’ottenimento di posizioni e ruolo da data scientist all’interno delle aziende, come professionisti riconosciuti.
Le competenze del data scientist
La scienza dei dati, o Data Science, è comunque una disciplina piuttosto recente e in piena evoluzione. La formazione in Big Data Analytics, in Machine Learning e in tutte le materie che si sono sviluppate per analizzare i dati è un mondo vasto, pieno di opportunità e percorsi da intraprendere, anche a seconda delle preferenze e inclinazioni personale.
Qualsiasi sia il percorso scelto però, le competenze del data scientist sono tendenzialmente le seguenti:
- architettura e modellazione di dati
- strumenti e tecniche di business intelligence (BI) e data warehouse (DW)
- linguaggi di programmazione (come Python, SQL, Scala, Java, R, MATLAB)
- piattaforme di big data (come MongoDB, Oracle, Microsoft Azure, Cloudera)
- tecniche di machine learning (natural language processing, classification, clustering, ensemble methods, deep learning)
- estrazione di dati (data mining), pulizia dei dati (data cleaning) e data wrangling / data munging
- cloud computing
Lavorare come data scientist
Lavorare come data scientist non è semplice, la dimensione innovativa del lavoro e il fatto che si tratta di una disciplina poco conosciuta e applicata soprattutto nelle grandi aziende non la rendono una realtà professionale diffusa.
Allo stesso tempo, questo status di eccezionalità del lavoro di data scientist fa sì che ci sia poca concorrenza e molta richiesta nelle aziende che scelgono di inserire all’interno dei propri team questa figura di riferimento per lo studio e l’analisi dei dati.
I professionisti che vogliono iniziare una carriera nella data science solitamente accumulano esperienza e competenze lavorando con ruoli entry level nell’ambito data analysis o business intelligence. Non si inizia quasi mai maneggiando in autonomia progetti interi, ma si parte affiancando altre figure che hanno già acquisito esperienza pregressa e che necessitano di collaboratori.
Si dice che nei prossimi anni queste figure saranno ancora più rilevanti e richieste, se nel corso dell’ultimo decennio si sono ritagliati una fetta consistente del mercato del lavoro nel settore tecnologico, nel prossimo decennio avranno uno spazio ancora più ampio. La maggiore disponibilità di dati, l’avanzamento delle capacità di elaborazione degli hardware, la creazione di software e tool innovativi, stanno trainando e continueranno a trainare le aziende verso la ricerca di personale in grado di promuovere scelte strategiche basandosi sui dati.
Annunci di lavoro data scientist
Chi si trova alla prese con la ricerca di un’occupazione in questo settore si sarà reso conto di quanto sia fumoso il mondo degli annunci per data scientist.
È difficile individuare job description esattamente per questa tipologia di professione, e gli annunci di lavoro sono spesso diversi l’uno dall’altro.
Ci sono realtà, anche in Italia, che meritano la presenza dei Data Scientist all’interno delle grandi aziende italiane negli ultimi dieci anni, e sicuramente quanto emerso può essere di incoraggiamento per chi cerca inserimento lavorativo nel data analytics e nella scienza dei dati. Ad esempio, nel 2017 è stato registrato un aumento della ricerca di professionisti in data scientist pari al 48% in più rispetto all’anno precedente.
Anche se non sono dati aggiornati agli ultimi anni sono numeri che fanno ben sperare. Purtroppo ci sono anche aspetti meno positivi, e dobbiamo sottolineare che molte aziende in ambito nazionale sono ancora legate a un modello tradizionale che non contempla tutto il settore e l’ambito del business analytics. Molte di questo, però, sostengono che nei prossimi anni vorrebbero inserire una figura specializzata proprio in questo campo.
Quanto guadagna il Data Scientist?
Ma se il data scientist trova lavoro quale stipendio si deve aspettare? Questa è una domanda che interessa tutti, ma proprio tutti gli aspiranti professionisti nell’ambito dell’analisi dei big data.
Abbiamo delle risposte più preciso per quanto riguarda altre aree geografiche in cui questa professione è maggiormente frequente e conosciuta nei contesti aziendali.
Alcuni anni fa, cercando in rete, era possibile entrare in contatto con l’informazione che riportava che i Data Scientist mediamente ricevessero una retribuzione annuale superiore ai 100.000 dollari l’anno negli USA. Stiamo parlando di cifre esorbitanti.
Non per tutti i paesi è così, probabilmente negli Stati Uniti sono stati rilevati i dati soprattutto dei professionisti con una seniority molto alta, magari impiegati in una delle tante grandi aziende della Silicon Valley, in cui il volume di affari è più consistente e queste professioni più riconosciute.
In Italia, un Data Scientist guadagna in media circa 30.000 euro annui. Questo è un dato sintetico, che potrebbe prestarsi a maggiori approfondimenti, ma non abbiamo molti dati a riguardo.
Crediti foto in evidenza: Depositphotos.com – DragonImages