Quella del data scientist è una professione in declino?
“Data scientist: la professione più sexy del XXI secolo”, recitava la didascalia di un post della Harvard Business Review nel 2012. Nel post, si glorificava il modo in cui questa professione consistesse nel ricavare diamanti a partire da dati disordinati e non strutturati.
Questa opinione, all’epoca, era condivisa da molti esperti. Eppure, appena un decennio dopo, il web è pieno di articoli che cercano di spiegare perché non abbiamo più bisogno dei data scientist. Da dove viene questo pessimismo? Il lavoro dei data scientist ha davvero smesso di essere rilevante? Valutiamo i fatti.
La delusione degli imprenditori
La scienza dei dati è diventata un settore saturo grazie al clamore che lo ha circondato nell’ultimo decennio, insieme agli esorbitanti stipendi medi mostrati dai report di Glassdoor e McKinsey. Nel frattempo, tutto questo clamore ha indotto molti imprenditori e funzionari di alto livello a pensare che l’intelligenza artificiale e l’analisi dei dati fossero una bacchetta magica per le loro aziende, quindi hanno continuato ad assumere data scientist. Alcuni per favorire la crescita e incrementare le vendite, altri per dimostrare che la loro azienda fosse al passo con gli ultimi progressi tecnologici.
Purtroppo, l’analisi dei dati non fornisce necessariamente soluzioni in tempi rapidissimi, anche assumendo i professionisti giusti. Spesso sono necessari molti esperimenti, una miriade di iterazioni, prove ed errori per arrivare a un risultato significativo. E per svolgere queste analisi servono mesi, a volte anche anni.
Quindi, i datori di lavoro che si aspettavano soluzioni rapide sono rimasti delusi e hanno cominciato a fare pressioni sugli specialisti da loro assunti, che a loro volta si sentivano frustrati. Anche la mancanza di esperienza nella gestione dei data scientist non ha aiutato, con conseguenti problemi di comunicazione e riluttanza ad approvare i budget. E non è tutto: in alcune aziende, i data scientist erano percepiti come dei tecnici intelligenti in grado di fare tante cose, e diventavano le persone di riferimento per risolvere problemi vari, compresi quelli di cui avrebbero dovuto occuparsi altri lavoratori.
Dopo un po’, le aziende organizzate in questo modo hanno smesso di vedere l’importanza dei data scientist. Alcune hanno rivoluzionato completamente i propri team, mentre altri hanno perso questi dipendenti, che si sentivano a disagio nell’avere un ruolo poco definito e, come se non bastasse, risentivano dei tagli di budget.
Ma i datori di lavoro avevano già investito molto in questi team data-oriented. Dal momento che non sono stati in grado di vedere alcun risultato nel ROI, si sono sentiti ingannati, quindi è abbastanza ovvio che siano stati tra i primi a screditare i professionisti della data science.
Somiglianza dei problemi e automazione delle soluzioni
A meno che un’azienda non si occupi esclusivamente di problemi relativi ai dati, avrà sempre problemi simili a quelli riscontrati da altre aziende. Il flusso di lavoro relativo ai dati è più o meno lo stesso in tutte le imprese, il che implica che la maggior parte delle aziende assume persone per risolvere ripetutamente gli stessi tipi di problemi. Significa anche che la maggior parte degli approcci adottati da un data scientist sono già stati utilizzati in precedenza.
Parliamo del settore del gioco d’azzardo, per esempio. I grandi casinò online fanno molto affidamento su informazioni basate sui dati per determinare i giochi, le probabilità, i bonus, i premi fedeltà e le strategie di marketing più adatte. Offrono varianti di prodotti e servizi sempre uguali, motivo per cui l’implementazione di software automatizzato è una soluzione più economica ed efficiente rispetto all’assunzione di data scientist. Questo discorso si può applicare a qualsiasi altro settore.
Le grandi aziende come Google e Amazon traggono grande vantaggio da questa uniformità di problemi tra le aziende. Sostenute da un esercito formato dai data scientist più qualificati a livello globale, stanno implementando sistemi di machine learning e piattaforme cloud pronti all’uso, come Google AutoML. Basta inserire i propri dati nel loro sistema e beneficiare della conoscenza di tutti quegli esperti di livello mondiale.
Naturalmente, un data scientist può utilizzare la piattaforma, ma lo stesso potrebbe fare qualsiasi team con una conoscenza di base dell’effetto degli iperparametri sugli algoritmi. Per prima cosa, un ingegnere esperto in machine learning (ML) andrebbe benissimo.
Le semplici lezioni e guide offerte dai fornitori di software ML automatico non aiutano molto, perché offuscano la necessità di una vasta conoscenza della scienza dei dati. Ad esempio, il corso di certificazione Professional Machine Learning Engineer di Google non ha molto a che fare con la scienza dei dati tradizionale, ma riguarda solo le basi della statistica. Eppure è tutto ciò che serve per iniziare a lavorare come specialista dei dati, con l’aiuto del loro software di automazione.
Quello della scienza dei dati è un settore in declino?
Molte persone credono che i progressi in AutoML, piattaforme di big data e strumenti low-code/no-code sostituiranno la maggior parte del lavoro di un data scientist. Sebbene la tecnologia sia sempre stata elemento di disturbo nella maggior parte dei settori, non ci sentiamo di emettere la condanna a morte sulla scienza dei dati. Dopotutto, abbiamo a disposizione eccellenti software di contabilità da anni, ma abbiamo ancora i contabili. Giusto?
C’è sempre bisogno del tocco umano, in ogni campo. Per quanto la maggior parte dei problemi possa essere risolta, ci sarà sempre un problema che gli strumenti automatizzati non riescono ad affrontare. Questi strumenti possono avere una serie di algoritmi tra cui scegliere ma, se si dovessero presentare problemi che richiedono una combinazione di approcci diversi per essere risolti, il lavoro umano, non automatizzato, è la soluzione migliore.
Qualsiasi specialista di dati sa che non esiste un problema risolto in modo definitivo. Il set di dati può essere lo stesso, ma spesso si avrà un obiettivo aziendale unico da raggiungere. Inoltre, i software di automazione come DataRobot non gestirebbero la pre-elaborazione e il resto del “lavoro sporco” che precede la costruzione del modello.
Non dimentichiamo che un data scientist non è solo prezioso per le proprie competenze tecniche o di modellazione, che un ingegnere ML può gestire. Una preparazione statistica e una conoscenza approfondita dei dati, che sono il fulcro della data science, saranno sempre necessari per stabilire collegamenti tra i numeri e i problemi in questione.
Ciò significa che i data scientist avranno sempre un ruolo, fintanto che potranno manipolare i dati e risolvere i problemi, ad esempio attraverso la creazione di sistemi di raccomandazione, modelli di segmentazione o la valutazione del potenziali prospettive e clienti. Ciò implica anche che un data scientist non ha alcun reale vantaggio per un’organizzazione, a meno che i risultati del loro lavoro non siano evidenti.
Tuttavia, non si può negare che l’automazione stia arrivando dopo la maggior parte delle attività svolte dai data scientist, quindi è fondamentale che i professionisti in questo campo continuino a espandere le proprie competenze, specialmente in aree che non possono essere automatizzate. L’esperienza applicata nel settore, la creazione di valore per le aziende in termini di entrate e le capacità comunicative sono ottimi punti di partenza.