Le nostre foto Instagram hanno allenato l’intelligenza artificiale di Facebook

Se avete postato l’immagine del vostro gatto siamese su Instagram, inserendo anche un hashtag che lo descrive (preferibilmente in inglese) e magari anche un riferimento alla sua razza, avete contribuito ad addestrare gli algoritmi di Facebook. Il social network ha infatti usato miliardi di foto pubbliche di Instagram, già annotate dagli utenti con delle etichette, ovvero attraverso gli hashtag, per allenare i propri modelli di intelligenza artificiale usati per il riconoscimento di immagini. Per la precisione, si tratta di 3,5 miliardi di foto e 17mila hashtag. Lo ha comunicato l’azienda nel corso di F8, la sua conferenza per gli sviluppatori appena conclusasi in California. “Ci siamo basati interamente su set di dati etichettati da umani. Abbiamo usato gli hashtag di 3,5 miliardi di foto Instagram”, ha spiegato dal palco il direttore tecnico di Facebook, Mike Schroepfer.

Se foto ed etichette le mettono gli utenti

L’idea è tanto ovvia quanto ingegnosa. Le persone che pubblicano foto su Instagram usano taggarle con un hashtag; in alcuni casi queste parole possono essere generiche, astratte, casuali; ma altre volte sono precise, concrete: indicano gatti, cani, oggetti, andando anche nello specifico. Per tornare all’esempio iniziale, un gatto può essere etichettato come gatto ma anche come siamese. Immaginiamo l’operazione ripetuta su scala, ed ecco un enorme bacino di dati quasi pronti (il quasi, come vedremo, non è banale) per essere utilizzati per addestrare programmi di intelligenza artificiale. Nello specifico Facebook ha usato quelle foto già etichettate dagli utenti per allenare un software di riconoscimento immagini.

I sistemi di questo tipo hanno bisogno di imparare a riconoscere oggetti. Per farlo gli si mostra molte immagini già etichettate con quell’oggetto specifico finché non apprendono a identificarlo. Ma tali immagini vanno appunto annotate da umani prima, ed è un lavoro molto intensivo. Tanto più che i sistemi di intelligenza artificiale migliorano con la quantità di dati su cui sono allenati. Oltre alla quantità, conta la diversità dell’input. Se cioè una stessa scena o oggetto sono mostrati in tanti modi diversi.

Risultati competitivi

E qui entrano in scena gli utenti di Instagram, le loro foto e il loro lavoro gratuito di etichettatura. Siccome però non è stato fatto con lo scopo di allenare un software, le etichette sono spesso imperfette, i dati sono grezzi, da ridefinire. Pensiamo all’utente che per indicare scherzosamente un leone usi comunque la parola gatto. Per questo, la parte più difficile del progetto ha riguardato proprio l’individuazione di hashtag rilevanti; di quelli più precisi; e degli eventuali sinonimi, tagliando fuori il rumore. Facebook ha spiegato di aver raggiunto, grazie a questo metodo, un livello molto alto di accuratezza nel riconoscimento. “Se una persona non ha impiegato del tempo per etichettare qualcosa di specifico in una immagine, anche i sistemi di computer vision più avanzati non saranno in grado di identificarlo”, ha commentato Schroepfer. “Abbiamo prodotto dei risultati competitivi, che sono tra l’1 e il 2 per cento migliori di qualsiasi altro sistema testato su Imagenet (un dataset usato per la valutazione di questi software, ndr)”.

Per ora il riconoscimento si è concentrato soprattutto su semplici oggetti, animali, piante, cibo. Ma la tecnologia allenata su Instagram, e ricalibrata attraverso un processo noto come transfer learning (in cui si usa la conoscenza immagazzinata usando certi contenuti per applicarla al riconoscimento di contenuti diversi ma collegati) è già utilizzata anche per individuare oggetti controversi su Facebook. Non è un’operazione da tutti. Oltre a poter contare su un’ampia e impareggiabile disponibilità di dati (in questo caso miliardi di foto), Facebook ha allenato glii algoritmi attraverso 336 potenti processori grafici distribuiti su 42 server per tre settimane.

L’intelligenza artificiale è una parte sempre più preponderante di molte delle attività compiute da Facebook, che si tratti del riconoscimento facciale degli utenti per taggarli nelle foto o dell’individuazione di materiali estremisti o che violano i termini di servizio. Nel corso della conferenza F8, Facebook ha insistito sulla necessità di costruire algoritmi equi e non discriminatori. E ha assicurato di stare lavorando per fare in modo di aumentare il livello di diversità del proprio personale che si occupa di questa tecnologia; e di appoggiarsi anche a un processo di revisione esterno.