parsing cv e recruiting

Leggere un curriculum è un’attività all’ordine del giorno per chi si occupa di ricerca e selezione. Nulla di nuovo se parliamo di recruiter e addetti alle risorse umane, ma cosa succede quando è un computer a leggere un CV? Se da un lato il recruiter rintraccia subito e con facilità le informazioni che considera rilevanti e compatibili con un annuncio di lavoro, impiega comunque molto tempo per analizzare ogni singolo CV. Per questo motivo, la diffusione di sistemi di CV parsing gioca un ruolo fondamentale nel processo di recruiting o talent acquisition. Vediamo nel dettaglio di cosa si tratta.

Cosa si intende per CV/Resume Parsing?

Il Parsing dei CV, noto anche come Resume Parsing, è uno strumento estremamente vantaggioso per chi si occupa di ricerca e selezione. Si tratta di un processo di estrazione e conversione di dati non strutturati presenti su un documento – un curriculum – in informazioni di tipo strutturato, che vengono poi organizzate e archiviate in modo automatico all’interno del database. Il parsing e l’estrazione automatica delle informazioni si rivelano molto utili nelle attività di recruiting. Una funzionalità tipica del parser è quella di estrarre il contenuto di un CV in “testo semplice” che potrà essere utilizzato per fare una ricerca per parole chiave all’interno del documento. Superando i metodi tradizionali, il sistema di parsing consente anche la compilazione automatica dei form di candidatura e un inserimento più veloce dei dati dei candidati da parte dei recruiter, utile in caso di candidature numerose.

Parsing tradizionale VS Parsing intelligente

Rispetto al parsing tradizionale (semplice digitalizzazione, ovvero estrazione del testo), l’intelligenza artificiale ha reso più innovativo il processo favorendo l’estrazione di informazioni strutturate (information extraction). Un sistema di parsing “intelligente” consente:

  • l’estrazione di informazioni strutturate, che possono essere direttamente inserite in un database e usate per ricerche molto più precise, avanzate ed efficienti rispetto a quanto può essere fatto con il testo semplice:
  • il miglioramento e adattamento dell’analisi del layout (Document Layout Analysis) al caso specifico del CV che, rispetto ad altri documenti di testo, hanno una struttura e impaginazione molto complessa ed eterogenea.

Pensiamo all’analisi di un file CV, generalmente disposto su due o più colonne. Un parsing software generico, o di vecchia generazione,  effettua l’estrazione di testo semplice e ordinato seguendo la riga del documento: trattandosi di un testo disposto su 2 colonne, il risultato sarebbe una frase non coerente con il significato originale. Il senso del testo può essere ricostruito con analisi geometriche del documento, ma risulta poco utile nelle ricerche per keywords (al contrario di quanto avviene con i parser dotati di IA). Il nuovo parsing ha il vantaggio di offrire una comprensione completa del testo. Inoltre, è in grado di leggere il documento anche a partire da una scansione o fotografia, riconoscere e leggere sezioni e tabelle, oltre che comprendere il significato e le relazioni tra le varie parti del testo.

FUNZIONALITA’INDACV PARSER TRADIZIONALE
1. Digitalizza il CV
2. Accetta file in formato standard (pdf, doc, docx, txt)
3. Ammette qualunque formato testuale di file (inclusi odt, rtf, html, pptx)
4. Accetta file in formato immagine (jpeg, jpg, tif, tiff)
5. Processa in modo corretto i CV con layout complesso
6. Riconosce automaticamente le informazioni salienti all’interno del testo (skills, job title, livello di istruzione, etc.)
7. Organizza i dati in un formato strutturato adatto all’inserimento in un database

N.B. Per poter accettare qualunque tipo di file in formato testuale, il parser di Inda effettua uno step preliminare di conversione, riportandoli a formati standard [3]. Per processare anche file di tipo immagine, Inda prevede uno step di Optical Character recognition (OCR) [4]; per i CV con layout complesso (molte sezioni, organizzate su diversi numeri di colonne, eventuale presenza di grafici, etc.), ne comprende uno di Document Layout Analysis verticalizzato sui CV, considerando anche i formati più complessi [5]. Il parser di Inda include anche uno step di Named Entity Recognition (NER) che, tramite reti neurali appositamente addestrate e verticalizzate, è in grado di riconoscere in un CV tutte le informazioni salienti per un recruiter [6]. Infine, uno step di Relation Extraction (RE), mette in relazione le informazioni estratte dal CV e permette di ottenere in modo automatico dati strutturati [7].

Come funziona il parsing dei CV?

I nuovi sistemi di parsing si servono di specifiche tecniche dell’intelligenza artificiale (IA) per riconoscere ed estrarre testo e informazioni da un documento (CV). Per comprenderne meglio il funzionamento, consideriamo il caso specifico di Inda (Intelligent Data Analysis), la soluzione di IA per il mondo HR, dotata di un sistema di parsing pensato proprio per l’analisi dei CV. Questo sistema si avvale di tecniche di computer vision e Natural Language Processing (NLP) per riconoscere la struttura dei file, il layout grafico con cui è stato impostato, analizzare il linguaggio umano, estrarre il testo e, infine, mappare e archiviare i dati utili per trovare i candidati più qualificati per gli annunci.

Per dare inizio al processo di parsing, è necessario l’upload di un file: il CV. Come sappiamo, esistono diversi modelli e formati di CV. In genere, è il recruiter a leggere, analizzare e contestualizzare le informazioni contenute. Nel caso del parsing, anche grazie alla capacità dell’IA di autoapprendere (machine learning), il sistema è in grado di leggere e riconoscere i diversi modelli (oltre 12 estensioni di file CV per Inda) analizzandone layout, sezioni, strutture.

In seguito al riconoscimento di testo ed immagini presenti nel file, avviene la vera e propria analisi ed estrazione delle informazioni dal CV. Si tratta di informazioni personali, esperienze professionali ed educative, competenze (skills) etc. Queste saranno utilizzate per eseguire l’autocompletamento del form di candidatura o la compilazione automatica del profilo del candidato. Attualmente molte aziende chiedono ancora ai candidati di compilare lunghi form di candidatura, rischiando di perdere molti talenti lungo il processo. Il parser intelligente cerca proprio di evitare questo inconveniente con la compilazione automatica dei form.

CV Parsing Inda

Leggere un CV: una prova per l’intelligenza artificiale

L’introduzione dei parser nel processo di recruiting potrebbe sollevare dei dubbi a proposito del riconoscimento della struttura dei documenti e del linguaggio utilizzato. Pensiamo ai numerosi modelli di CV, alle lingue in cui può essere scritto e, addirittura, alle strutture linguistiche. Come distinguere il nome e cognome del candidato dal naming di un’azienda che riporta quello del suo proprietario? Come leggere una data a seconda della lingua in cui è compilato il CV? In definitiva, come interpretare le informazioni senza ricorrere al contesto? Si tratta di domande lecite alle quali l’intelligenza artificiale ha provato a dare risposta servendosi di tecniche (DLA, OCR, NER, etc.) in grado di raggiungere risultati validi e accurati.

Perchè è utile usarlo nel recruiting?

L’intelligenza artificiale applicata al settore delle risorse umane ha fornito al selezionatore strumenti e supporto necessari per perfezionare le attività di ricerca e selezione. Sempre più spesso, quindi, si sceglie di integrare l’intelligenza artificiale a recruiting software o Applicant Tracking System (ATS) già utilizzati per gestire il personale.

In questo senso, vengono semplificate alcune attività del candidato oltre che del recruiter. Con il CV Parsing, l’intelligenza artificiale legge il curriculum, individua le informazioni salienti e compila il form di candidatura in maniera automatica rendendo positiva l’esperienza di application. Inoltre, la capacità dell’IA di distinguere immagini dal testo, riconoscere ed estrarre le skills e compilare anche i menù a tendina, velocizza la creazione e l’inserimento di un nuovo profilo nel sistema migliorando la qualità del lavoro del recruiter.

I vantaggi del CV Parsing

I vantaggi dell’intelligenza artificiale sono numerosi e si applicano a diverse attività del processo di recruiting. Nello specifico, il resume parsing permette di:

  • Analizzare diverse tipologie di file CV, comprese scansioni o immagini del CV
  • Velocizzare l’attività di lettura e analisi delle informazioni
  • Raccogliere e organizzare grandi quantità di dati in forma digitale
  • Migliorare la ricerca di keyword contenute all’interno del CV
  • Dedicare meno tempo allo svolgimento di attività manuali
  • Accelerare la creazione e l’inserimento di nuovi profili nel database
  • Rendere più rapido il processo di selezione
  • Migliorare la qualità del lavoro del recruiter
  • Rendere positiva l’esperienza di application del candidato

Altri usi del CV Parsing

Capita spesso di avere archivi di CV composti solamente da file digitali, salvati in cartelle su pc o server aziendali, oppure in formato cartaceo. Questi documenti di per sé sono poco utilizzabili in quanto non hanno alcuna informazione strutturata (es. nome, cognome, email, etc.) loro associata. Se facessimo processare tutti questi CV da un apposito parser, per ogni file analizzato, si otterrebbe un elenco di informazioni strutturate di enorme valore. Questi dati, infatti, potrebbero essere importati all’interno di un Applicant Tracking System (ATS) o contribuire a creare un DB di candidati.

Visita il sito per avere maggiori dettagli sul parsing di Inda o approfondisci le sue applicazioni con il parsing documentale.

Recent Posts

parsing cv e recruiting
benefici dell'intelligenza artificiale nel recruiting
Application form intelligenza artificiale
ricerca e selezione
intelligenza artificiale machine learning

CONTATTI

+39 011 586 2407

Via Amedeo Avogadro, 20 – Torino

Copyright © 2020 Inda

Inda è una soluzione di Intervieweb S.r.l. Società del gruppo Zucchetti P.IVA: 10067590017

Privacy policy   Cookie policy