• La matematica e la statistica per le pr...

La matematica e la statistica per le professioni data-orienteed

Digitalizzazione della società e dei processi.

Si stima che negli ultimi dieci anni della sua presenza sul pianeta Terra, l'umanità abbia prodotto più dati che in tutti gli anni precedenti. Questa tendenza non accenna a diminuire: la digitalizzazione e internet vanno diventando sempre più diffusi e pervasivi, e con essi la produzione sempre più massiccia di dati.

Infatti dopo che il personal computer è diventato indispensabile in molte attività lavorative, i dispositivi elettronici sono diventati onnipresenti e decisivi in ogni nostra attività quotidiana: basti pensare alla socialità mediata dagli smartphone o ai tablet, ormai ampiamente utilizzati anche come strumento didattico.

Il numero totale di questi strumenti è destinato ad aumentare, con stime che proiettano per il 2030 un numero di dispositivi connessi alla rete internet pari a circa cinquecento miliardi. Questi numeri, per quanto parziali, danno una idea dell'enorme impatto che la digitalizzazione ha sulle nostre vite e sulle noste attività.

Produzione sempre maggiore di dati grezzi.

Come accennato sopra, tutta questa attività digitale si accompagna ad una costante produzione di dati: le eleborazioni che produciamo su un foglio di calcolo, i messaggi che ci inviamo tramite app, i video che carichiamo e guardiamo sulle varie piattaforme, i cookies raccolti dai siti web durante la navigazione; tutti questi dati sono utilizzabili e, opportunamente elaborati e interpretati, possono fornire informazioni molto preziose.

A titolo di esempio, per avere un' idea di quante e quali attività vengono svolte su internet, basta googlare "quanti messaggi vengono inviati ogni minuto sui social network?" per essere travolti da numeri enormi che a stento riusciamo a immaginare. Da una semplice ispezione di queste statistiche, si capisce bene come la nostra società insieme con le nostre economie vada digitalizzandosi sempre di più. Forse la frase, ormai assurta a cliché, che sentenzia come "i dati sono il petrolio del XXI secolo" non è poi così errata.

Ciclo di vita del dato.

Come qualiasi altro bene economico, anche i dati hanno un loro ciclo di vita ben definito. Solitamente questo si può strutturare nei seguenti passaggi: produzione, conservazione, normalizzazione, analisi e infine produzione di insights. Tali insights permetteranno poi alle organizzazioni interessate di orientare le proprie scelte e strategie in direzione più data-driven. 

Tutti i passaggi di questa filiera richiedono il lavoro di professionisti con competenze e specializzazioni ben specifiche, tanto che il mercato del lavoro in questi ultimi anni è stato caratterizzato dal sorgere e dall' affermarsi di nuove professionalità. Tra tutte queste professioni non è possibile non citare il data analyst, il data scientist e il data engineer.  

Automazione e intervento umano.

Molti processi indispensabili all'attuazione della filiera del trattamento del dato vista sopra possono essere efficacemente ed efficientemente automatizzati. Basti pensare alle varie tecnologie che permettono di immagazzinare e processare le enormi moli di dati e quindi all' affermazione sempre più diffusa e decisa del paradigma dei Big Data.

L'uso di metodi automatici però è altrettanto in voga nelle attività di analisi e produzione di insight. Oramai gli algoritmi di Machine Learning sono ingegnerizzati al punto da essere integrati in qualsiasi libreria software per l'analisi dei dati. Sorge allora una domanda: se i computer fanno per noi tutta la fatica di portare a termine calcoli lunghi, difficili e, in tutta onestà, anche piuttosto tediosi, quale è il senso di studiare la matematica e la statistica al giorno d'oggi?

La matematica nelle professionalità data-orienteed.

La risposta si può articolare nel modo seguente usando una analogia con la vita quotidiana.

Immaginiamo di dover fare un lavoro in casa: dobbiamo piantare un chiodo su un muro per poi appendere una stampa di un quadro del nostro artista preferito. Come faremo a piantare il chiodo nel muro? Battendoci forte sopra con la mano (metodo utile per rompersi una mano, forse...) oppure adoperando un attrezzo appositamente scelto?  Alla stessa maniera, secondo quale criterio sceglieremo l'attrezzo per piantare il chiodo: userò un cacciavite, una livella o un martello?

Il lavoretto corrisponde ovviamente a uno dei mille problemi di fronte ai quali possiamo trovarci mentre svolgiamo una analisi dati; corrispondentemente, nella nostra analogia gli attrezzi da lavoro rappresentano i numerosi algoritmi di cui un data scientist dispone nella sua cassetta degli attrezzi algoritmica.

Si capisce allora come non può che essere una solida e approfondita formazione in matematica e statistica a fornire le basi teoriche e le chiavi interpretative indispensabili per riuscire ad avere contezza di quando e come usare uno strumento invece che un altro.

Fin troppo spesso vediamo tante persone improvvisarsi esperti di data science senza avere la minima cognizione delle basi teoriche dei modelli impiegati; così come si vede un uso quasi ossessivo di algoritmi e modelli cosìdetti "black box" a scapito di modelli altrettanto efficaci ma molto più facilmente interpretabili, anche se forse meno alla moda (ma questo sarà argomento di un altro articolo).

Il ruolo dei professionisti già impiegati sul campo.

Benché i concetti e le metodologie alla base della professione del data scientist possano rimanere stabili per molto tempo, al contrario le tecnologie e le skills necessarie variano con una certa cadenza: così rapidamente che se una persona non continuasse a studiare ed aggiornarsi anche durante la pratica lavorativa stessa, correrrebbe il rischio concreto di diventare lavorativamente obsoleta nel giro di pochissimo tempo. Per convincersi di ciò, basta pensare all'enorme impatto trasformativo determinato dall'arrivo di modelli generativi come ChatGPT. A causa dell'intrinseca dinamicità di questo ambito quindi, le università e i centri di formazione più tradizionali possono sperimentare una certa inerzia nell'aggiornare la loro offerta formativa e i relativi curricula.

Allora diventa importante rimanere a contatto con dei professionisti che già operano in questo campo e fare in modo che questi aiutino gli interessati a costruire delle competenze spendibili. Ancora più rilevante è che questi aiutino le persone a rimanere impiegabili nel mondo del lavoro impartendo loro non solo competenze spendibili, ma anche concetti e metodologie che mettano questi ultimi nella posizione di diventare capaci di continuare a formarsi autonomamente in futuro. Perchè ce ne sarà sicuramente bisogno.

Per tale motivo ho deciso di aprire un mio canale YouTube (link: il mio canale YouTube) di divulgazione su data science e matematica e di fare tutorial e lezioni online, anche qui su questo spazio.

Ti è piaciuto? Condividilo
Salvatore
Insegnante di a Trieste. Specializzato/a nell'offerta di lezioni di lezioni presenziali e lezioni online, adattate alle esigenze individuali di ogni studente. Le lezioni che tengo sono pensate per aiutarti a raggiungere i tuoi obiettivi e le tue mete.Contattare
Contattare
Usa il nostro Strumento di Ricerca Intelligente