copertina intervista top-ix

Il continuo interesse e la crescente applicazione di sistemi di Intelligenza Artificiale (IA) in diversi contesti lavorativi ha spostato l’attenzione su una nuova figura professionale altamente specializzata.

Chi sono i Data Scientists? Per quale motivo la loro capacità di analisi e interpretazione dei dati ha assunto un ruolo strategico all’interno delle aziende HR per cui operano?

Ne abbiamo parlato con Stefania Delprete e Christian Racca, Data Scientist e Project Manager di TOP-IX. Partendo dal loro intervento tenuto in occasione di HR Trend Talks, ci aiuteranno a far luce su alcuni aspetti legati a questo scenario ancora tutto da scoprire. 

Presentatevi ai lettori del blog di Inda. Chi siete e di cosa vi occupate?

Siamo Stefania Delprete e Christian Racca, rispettivamente Data Scientist e Project Manager in TOP-IX. 

TOP-IX è un consorzio non-profit nato nel 2002 con lo scopo di gestire l’Internet Exchange per il nord-ovest Italia e servizi di interconnessione. Dal 2006 è attivo con il Development Program su progetti di Innovazione fra cui: progetti locali ed europei di R&D e Corporate Innovation, supporto a Startup digitali; training su Data Science e Machine Learning per studenti e aziende, Civic Technologies ad impatto sociale.

Oggi sentiamo parlare spesso di Data Scientists, Data Engineers, Data Managers e di dipartimenti Data Science che vengono integrati all’interno di molte aziende. Spieghereste ai nostri lettori perché questa figura professionale sembra essere diventata strategica nel mondo delle Human Resources?

Prima di tutto facciamo chiarezza sui diversi ruoli di cui si sente spesso parlare. Il ruolo di Data Scientist nasce dalla necessità di portare le abilità consolidate nella statistica e nell’analisi dei dati in veste moderna facendo leva sulle risorse informatiche e computazionali a disposizione, nonché su librerie dedicate di linguaggi di programmazione che vanno dalla statistica descrittiva ai più complessi algoritmi predittivi di Machine Learning e Deep Learning. Data la crescente mole di dati a disposizione è poi spesso necessario abbinare competenze di Data Engineering mirate alla gestione dei flussi di dati (data pipelines) all’ingegnerizzazione dei modelli matematici in funzione delle performance hardware e delle risorse a disposizione.  Componente essenziale dei data team sono poi professionalità con una spiccata abilità nel visualizzare e comunicare i dati e la loro intrinseca complessità, permettendo al grande pubblico o a target mirati di interpretare i risultati ottenuti e gli insights.  Servono infine figure di coordinamento (Data Managers) e di relazione (Business Translator) con gli altri team e le varie figure complementari (ad esempio consulenti legali e Policy Maker).

Nel mondo delle risorse umane si è visto come i dati collezionati siano molto interessanti, spesso inerenti la profilazione dei dipendenti, nuovi CV, clienti/prospect, ma ancora oggi non vengono spesso pienamente utilizzati in modo strategico.  La maggior parte del personale nel settore HR ha infatti un background umanistico che porta a prendere scelte basate sull’esperienza e su modelli (attitudinali, psico-sociali) costruiti nel corso degli anni, purtroppo non sempre coadiuvati dall’evidenza dei dati a disposizione. Al netto di fenomeni di bias e alla gestione della privacy, cui è necessario prestare attenzione, il mancato utilizzo dei dati a supporto delle decisioni è ad oggi una grande opportunità persa.

Uno dei temi più attuali è quello relativo all’utilizzo dei Big Data. Che peso hanno i dati all’interno della Human Capital Management?  Se l’analisi dei dati è diventata fondamentale per guidare il lavoro di un HR, come raggiungere l’equilibrio tra la tecnologia e le risorse umane, o meglio, tra sistemi di intelligenza artificiale e risorse umane?

tecnologia e HR

Il bilanciamento fra le abilità tecniche/tecnologiche e quelle prettamente di HR avviene prima di tutto grazie allo scambio di informazioni specifiche del settore, ossia la conoscenza di dominio.

Ad ogni passo del processo di Data Science è essenziale mantenere la comunicazione aperta tra chi sta operando sui dati e chi ha esperienza reale sul campo.  Ogni buon progetto data-driven parte da domande ben chiare: è quindi altamente consigliabile discutere tali direzioni con un team con competenze diversificate in modo da non scoprire nel bel mezzo dell’analisi che alcuni dati non potevano essere usati, oppure che il target che si è scelto di studiare è troppo piccolo per significatività, o al contrario che sono necessarie risorse computazionali troppo ingenti, e soprattutto aver chiaro il valore potenziale che potrà portare all’azienda.

Alla fine del processo di analisi, ed eventualmente di predizione, è nuovamente fondamentale l’interazione intra-funzionale e inter-dominio così da essere certi di poter trasferire “in produzione” i risultati di un progetto di ricerca o di un PoC.

Mettere a punto una strategia di Data-driven recruiting permette alle aziende di valutare la performance e il potenziale delle risorse.  Oltre a questo, come emerso dall’intervento tenuto ad HRTT, i dati servono per monitorare il Churn dei dipendenti ai quali può essere attribuito un Risk Score.  Spiegheresti di cosa si tratta e come gestirlo con un algoritmo di analisi predittiva?

Gli esempi che abbiamo esposto trattavano dati simili con due diverse strategie di analisi per profilare dipendenti e prevenire o anticipare il churn all’interno dell’azienda.

In entrambi i casi la prima fase è la raccolta dei dati, o la selezione di dati storici. Tali valori possono includere la demografica anonimizzata dei dipendenti (età, genere, situazione familiare, distanza dal luogo di lavoro), metriche inerenti alle mansioni e performance durante il tempo trascorso in azienda (numero di progetti assegnati, trasferte, salario, promozioni, ruolo), e variabili riguardanti il mood/clima lavorativo e lo stile di vita (soddisfazione, bilanciamento vita-lavoro, incidenti e reclami). 

Un approccio supervisionato (ovvero basato su dati etichettati in cui sappiamo se il dipendente alla fine ha realmente lasciato l’azienda) alla classificazione avrà come variabile target un valore binario che ci permetterà di inferire il comportamento di un dipendente non incluso nel dataset di addestramento dell’algoritmo. 

A tale risultato possiamo arrivare solo dopo un’importante fase di analisi e studio delle correlazioni fra le variabili a disposizione (che già di per sé può generare un report d’interesse per l’azienda), quindi scegliendo l’algoritmo di machine learning più appropriato da allenare su una parte di questo dataset in modo da generare un modello atto a predire se un profilo è maggiormente o meno propenso ad andarsene dall’azienda.

Tale modello viene poi testato con la parte di dati che non è stata usata per il training così da valutare la bontà di generalizzare su un caso reale. Se le performance del modello non saranno ritenute ragionevoli, in funzione del fine ultimo, si tornerà ad esplorare le variabili e a raffinare l’algoritmo o a sceglierne di nuovi in un processo iterativo.

Parlando di intelligenza artificiale, si menzionano spesso tecnologie di Machine Learning. In che modo possono essere sfruttate per trasformare i semplici dati in strumenti di valore per i Data Scientists e per gli HR?  Che ruolo possono giocare all’interno dei processi decisionali?

Continuando a ragionare sull’esempio del churn sopra menzionato, l’analisi è guidata da ipotesi che devono essere validate.

Poniamo ad esempio che si noti una grande correlazione fra churn ed il tempo impiegato ad arrivare a lavoro per un determinato ruolo. Per incentivare tali dipendenti, si potranno strutturare parzialmente o totalmente sessioni di smart-working. I risultati dell’analisi hanno valore solo se poi è possibile attuare delle policy concrete.

Dall’altro lato, si possono utilizzare tali modelli per osservare come varia nel tempo il rischio/tasso di abbandono di un determinato dipendente o di gruppi lavorativi. Sfruttando ed abbinando la competenza di dominio e la conoscenza dei singoli casi, gli algoritmi possono essere utilizzati come warning per anticipare o risolvere contrasti e attriti.

Ricordiamo infine che particolare attenzione va posta nella fase di data preparation. E’ noto il caso di Amazon nell’uso di intelligenza artificiale per la selezione di nuovo personale: la tecnologia e gli algoritmi funzionarono a dovere, ma il dataset storico di partenza era colmo di bias di genere e come risultato portò ad escludere validi profili femminili anche quando il genere non era esplicitamente menzionato.

L’inserimento di figure come quelle sopracitate ha portato molte aziende ad interrogarsi in merito alla formazione, upskilling e reskilling delle competenze delle risorse interne.  Qual è stata la risposta di TOP-IX in merito a questa esigenza?

big dive
Momento di formazione all’interno del progetto BIG DIVE

Nel corso degli ultimi anni TOP-IX, tramite il progetto di formazione BIG DIVE, si è impegnata a formare, e presentare, il mondo e l’approccio ai dati sia internamente ad aziende sia, e soprattutto, con corsi pubblici per studenti, liberi professionisti ed istituzioni non profit.

Dal 2012, annualmente, organizziamo un corso completo sulle discipline di Data Science con Python, Machine e Deep Learning, Data Visualization e Data Engineering. Quest’anno, per andare incontro alle esigenze di studenti, dipendenti e freelancers, offriremo la possibilità di partecipare sia al percorso completo che ad uno solo dei moduli in calendario.

Ciascun modulo durerà cinque giorni con cadenza mensile a maggio, giugno, luglio e settembre (maggiori informazioni su ​https://www.bigdive.eu/becomedatascientist​). Consigliamo a chi è interessato di partecipare al webinar dell’8 aprile (iscrizioni qui http://eepurl.com/gr8qin ​) in modo da avere una visione completa di ognuno dei moduli, del livello di difficoltà e syllabus.

Dato che la salute e la prevenzione ci stanno particolarmente a cuore, il webinar sarà anche l’occasione per dare aggiornamenti tempestivi sullo stato della situazione italiana e la fruibilità dei corsi in funzione delle normative in vigore.

Recent Posts

intelligenza artificiale machine learning
modello semantico
word2vec
engagement sentiment analysis
computer vision

CONTATTI

+39 011 586 2407
Via Amedeo Avogadro, 20 – Torino

Copyright © 2020 Inda

Inda è una soluzione di Intervieweb S.r.l. Società del gruppo Zucchetti P.IVA: 10067590017

Privacy policy   Cookie policy