Autore: Francesca Greco
L’Emotional Text Mining (ETM) è un progetto innovativo, caratterizzato da un approccio multidisciplinare che nasce dall’unione di linguistica computazionale, metodi statistici avanzati e psicologia dinamica. Più in particolare, la psicologia dinamica è quella particolare branca della psicologia che si occupa dell’insieme di meccanismi e processi psichici sottesi al comportamento e più in generale alla personalità di un individuo, preso singolarmente o in relazione agli altri.
Il carattere particolarmente innovativo del progetto ETM ha richiesto fin dall’inizio un confronto serrato con operatori del settore, esperti nelle varie discipline e la comunità scientifica internazionale, al fine di individuare l’eventuale presenza di criticità e punti di debolezza dell’algoritmo e affinare la relativa metodologia su un piano teorico. Parallelamente, una parte importante della sperimentazione si è svolta testando l’ETM su una varietà di problemi applicati.
I principali risultati di questa intensa attività di sperimentazione sono stati presentati in occasione di convegni scientifici di rilevanza nazionale e internazionale, in primis lo JADT (la più importante riunione annuale in materia di analisi dei dati testuali) e la SUNBELT (uno dei più importanti eventi in tema di network analysis).
La presentazione del ETM alla comunità scientifica ha suscitato un forte interesse per le funzionalità e le specifiche dell’algoritmo, mentre la discussione dei risultati con gli altri ricercatori ha spesso consentito di apportare significativi miglioramenti a specifici step della procedura ed aprire nuovi fronti di sperimentazione.
Per esempio, si è preso in considerazione il problema della quantificazione del sentiment su un argomento specifico nel tempo, creando un indicatore real time calcolato a partire dal flusso temporale di produzione di specifici contenuti testuali. La principale difficoltà, in questo caso, è che può verificarsi una crescita esponenziale del flusso in un ristretto lasso di tempo in risposta a eventi specifici, fenomeno noto come hype comunicativo. Si è quindi proposto una misura di sentiment, il Greco-Polli Index, che nel calcolo dell’indicatore real time penalizza i cluster di contenuti testuali caratterizzati dalla maggiore volatilità.
È immediato intuire l’importanza di risultati come quello descritto, in quanto è stata dimostrata la fattibilità di misure del sentiment in tempo continuo non affette da hype comunicativi, che consentano di quantificare il sentiment stesso al netto di distorsioni e rumori. Tali funzionalità possono trovare utilizzo sulla piattaforma attualmente in fase di sviluppo, concorrendo a creare un prodotto attualmente non presente sul mercato.
In sintesi, in accordo con la filosofia Prisma, la fase di ricerca e sviluppo non prescinde mai dai futuri contesti applicativi, creando un circolo virtuoso.