Sembra semplicemente un gioco di parole. Eppure il titolo racconta bene qual è lo scopo dell’ultimo tool sviluppato da alcuni ricercatori dell’Università di Harvard e del MIT di Boston che potrebbe aiutare giornalisti e lettori a capire quando un testo è scritto da una mano non-umana.
Gli algoritmi che usano l’intelligenza artificiale sono in grado oggi di generare un testo abbastanza convincente e sensato da ingannare gran parte di noi. Uno strumento che potrebbe avere alcune alcune finalità poco etiche con la generazione e la diffusione di fake news e falsi profili social. Ma, come scrive il Mit Technological Review, l’AI può essere usata “per fortuna” anche per identificare questi testi nati artificialmente.
L’acronimo che identifica il tool è GLTR (Giant Language Model Test Room). Come un moderno Sherlock Holmes digitale recupera gli indizi lasciati in giro dalle Intelligenze artificiali e sfrutta il fatto che tali sistemi si basano su schemi statistici contrapponendosi al reale significato di parole e frasi.
Ovvero, GLTR riesce a capire se le parole di un articolo o di un libro sono troppo scontate e prevedibili per essere state scelte dal nostre cervello che ama, invece, la complessità e la variazione. Per arrivare a questo risultato, il team ha sviluppato una versione di un codice rilasciato pubblicamente da Open AI, l’organizzazione no-profit fondata da Elon Musk.
L’analisi del testo finale da parte di GLTR è molto semplice. Prendendo ad esempio una pagina di Infinite Jest, capolavoro di David Foster Wallace, è possibile vedere come:
- le parole verdi siano quelle più prevedibili e comuni
- le parole gialle e rosse siano meno comuni
- le parole viola sono quelle più originali, ricercate, meno prevedibili di tutte
In base al colore dominante del testo è più facile capire se un testo è frutto dell’immaginazione e della creatività umana o se c’è la possibilità che sia stata una macchina a realizzarlo.
Per capire l’efficacia di GLTR, i ricercatori di Harvard hanno condotto un piccolo esperimento con alcuni studenti. Hanno chiesto loro di identificare diversi elaborati scritti da una AI, prima senza usare il tool e poi con il tool. I tester sono riusciti ad individuare solo il 50% dei testi artificiali da soli. Una percentuale che sale al 72% grazie all’aiuto di GLTR.
Ah, siete curiosi? Potete testarlo anche voi direttamente qui direttamente qui