AGI - OpenAI ha fatto un deciso scatto in avanti nella generazione di immagini tramite intelligenza artificiale. L'azienda guidata da Sam Altman ha infatti rilasciato un aggiornamento riguardo a una nuova funzione di ChatGPT rivolta agli utenti di tutti i piani, sia free che a pagamento. Disponibile come strumento predefinito del modello 4o, collocata all’interno di Sora, è in grado di produrre risultati di alta qualità, soprattutto davanti a prompt chiari e dettagliati.
Si tratta di funzionalità volte a rendere più facile "creare in maniera esatta l'immagine che avete immaginato" e che permettono di "comunicare in modo più efficace attraverso le immagini" e trasformare così la generazione di immagini "in uno strumento pratico, preciso e potente”. Per approfondire il tema ho "intervistato" direttamente ChatGPT
Cosa ChatGPT sa fare
Ma che cos’è cambiato di recente con le immagini?
Hai occhio! Sì, c’è stata una bella evoluzione. Ti spiego tutto.
Aspetta, le domande le faccio io. Partiamo dalla cosa più importante: ora riconosci meglio cosa c’è in una scena?
Assolutamente sì. Ora riesco a:
-
Capire la composizione complessiva della scena (gruppi, pose, oggetti, ambienti…).
-
Mantenere coerenza nei volti, nel colore dei capelli, nelle espressioni e perfino nell’età.
-
Posizionare i personaggi in modo fedele all’originale, se prendo spunto da una foto reale.
E per quanto riguarda lo stile? Posso scegliere come voglio che venga?
Al 100%. Ecco alcune possibilità:
-
Cartoon stile Pixar
-
Un tocco poetico alla Studio Ghibli
-
Una roba più fumetto francese
-
O magari un ritratto rinascimentale. Basta che me lo dici e lo trasformo nello stile che vuoi ✨
Posso farti modificare una scena? Tipo aggiungere qualcuno, cambiare un’espressione?
Sì, ora posso anche:
-
Aggiungere o togliere persone.
-
Cambiare espressioni, vestiti, oggetti sul tavolo.
-
Riambientare tutto: tipo far diventare una scena di giorno in una di notte, o da realistica a cartoon.
E se ti chiedo di mantenere le posizioni originali, come in una foto vera?
Eh, questa sì che è una bella novità, no? Ora riesco a mantenere:
-
Le posizioni esatte dei soggetti.
-
Le proporzioni corrette.
-
E tutti i dettagli ambientali (bicchieri, telefoni, piatti, sfondo urbano o verde…).
Cose che ChatGPT non sa (ancora) fare
Dimmi le cose che non riesci ancora a fare, ora. Giochiamo a carte scoperte
Certo, ecco le cose che non puoi chiedermi di fare.
- Riconoscere persone reali o dire chi sono in foto. Non posso dire "questo è Tizio" o "questa persona è famosa", per privacy e sicurezza. Anche se li riconosco, non posso dirtelo.
- Modificare una sola persona in una foto vera (per ora). Posso generare nuove versioni ma non posso ancora editare direttamente le foto originali realistiche, tipo cambiare un’espressione o un colore di capelli su quella stessa immagine.
- Dare il controllo completo sulla posizione di ogni persona. Posso seguire le pose e le composizioni abbastanza bene. Ma non posso ancora dirti: "metti questa persona qui, questa là, questa che guarda a destra", in modo preciso come fosse un editor fotografico avanzato.
- Continuare un’immagine generata come fosse un puzzle. Se un'immagine è tagliata, non riesco ancora a "completarla" perfettamente partendo da quella base. Meglio rigenerarla da zero, seguendo indicazioni più complete.
- Riprodurre esattamente lo stesso volto/personaggio più volte. Ogni generazione è un po’ unica. Quindi non riesco ancora a dire: “fammi questo stesso personaggio in tre pose diverse” e ottenere coerenza al 100% nei tratti del volto.
- Animare direttamente una scena generata. Posso creare immagini super dettagliate in stile animazione, ma non posso ancora creare GIF o video animati con quei personaggi che si muovono (tipo Pixar o Ghibli in movimento).
Clicca qui e iscriviti al nostro canale Whatsapp! Le notizie, in tempo reale, dell'Agenzia Italia ora anche sul tuo smartphone