Meta e Microsoft annunciano che Llama 2, la nuova generazione del modello linguistico open source dell'azienda che possiede Facebook, Instagram e Whatsapp, sarà disponibile a titolo gratuito sia per la ricerca, sia per l'uso commerciale. L'accordo di cooperazione è stato dato insieme dai due leader, Mark Zuckerberg e Satya Nadella.
Sono inclusi i parametri “weight” del modello e il codice di partenza per le versioni pre-addestrate e perfezionate a livello conversazionale (parametri 7B, 13B e 70B). È possibile, dunque, accedere ai modelli di Llama 2 dal sito dedicato o tramite Microsoft Azure e Windows, Amazon Web Services e Hugging Face.
"Riteniamo che un approccio aperto con un'ampia accessibilità sia la strada giusta per sviluppare utilizzando le potenzialità offerte attualmente dai modelli di Intelligenza Artificiale", scrive Meta in un comunicato, spiegando che l'approccio riguarda "in particolare quelli come Llama 2, che operano nel settore dell’IA generativa, dove la tecnologia continua ad avanzare rapidamente grazie a progressi reali e qualitativi".
Il compiacimento di Zuckerberg per l'operazione
Visibile è stata la soddisfazione espressa da Zuckerberg durante l'annuncio: "Stiamo collaborando con Microsoft per presentare Llama 2, la nuova generazione del nostro modello linguistico open source. Llama 2 sarà disponibile a titolo gratuito per la ricerca e per l'uso commerciale".
E ancora: "Meta ha una lunga esperienza di open sourcing rispetto alla nostra infrastruttura e al nostro lavoro sull'intelligenza artificiale: da PyTorch, il più importante framework per l'apprendimento automatico, a modelli come Segment Anything, ImageBind e Dino, fino all'infrastruttura di base nell’ambito dell'Open Compute Project. Questo ci ha aiutato a costruire prodotti migliori, favorendo il progresso del settore".
L'open source, secondo il capo di Meta, "promuove l'innovazione perché consente a un numero maggiore di sviluppatori di lavorare con le nuove tecnologie. Inoltre, migliora la sicurezza perché quando i software sono aperti, più persone possono studiarli per identificare e risolvere potenziali problemi. In generale, credo che se l'ecosistema online fosse più aperto si otterrebbero maggiori progressi e questo è il motivo per cui stiamo rendendo Llama 2 open source".
"Oggi - spiega ancora - rilasciamo modelli pre-addestrati e perfezionati con i parametri 7B, 13B e 70B. Llama 2 è stato pre-addestrato su un volume di dati del 40% superiore rispetto a Llama 1 e sono stati apportati miglioramenti alla sua architettura. Per i modelli perfezionati, abbiamo raccolto più di 1 milione di annotazioni umane e abbiamo applicato il perfezionamento supervisionato e l'apprendimento rinforzato con il feedback umano (RLHF) con risultati eccellenti in termini di sicurezza e qualità". Infine l'invito a testare il tutto: "Non vedo l'ora di vedere cosa costruirete!".