Il nuovo generatore di immagini AI "allo stato dell'arte" di Meta potrebbe dare a DALL-E una corsa per i suoi soldi

Gli sforzi di intelligenza artificiale di Google e OpenAI hanno attirato molta attenzione negli ultimi mesi, ma Meta crede il suo nuovo modello potrebbe essere uno dei migliori disponibili, almeno quando si tratta di generazione artistica AI, comunque. L'azienda ha appena lanciato "CM3leon", che si pronuncia "camaleonte", un generatore di immagini in grado di trasformare i messaggi di testo in immagini e viceversa. Secondo una dichiarazione sul Metasito web, CM3leon è "il primo modello multimodale addestrato con una ricetta adattata da modelli linguistici di solo testo". Per questo motivo, Meta dice che il modello raggiunge "prestazioni all'avanguardia per la generazione di testo in immagine, nonostante sia stato addestrato con un calcolo cinque volte inferiore rispetto ai precedenti basati su trasformatore metodi”.

In termini semplici, puoi utilizzare il nuovo strumento per creare immagini nuove e complesse da zero o apportare modifiche a immagini esistenti. Le modifiche possono includere trasformare l'estate in inverno, cambiare il colore del cielo o qualsiasi altra cosa che puoi riassumere con un prompt. Per quanto riguarda le immagini generate, il limite è la tua immaginazione. Gli utenti possono anche aggiungere un'immagine e porre domande al modello AI al riguardo, indipendentemente dal fatto che si tratti di una richiesta aspetti specifici della foto, o anche chiedendo alla modella di creare una didascalia dettagliata dell'immagine domanda. Altre funzionalità supportate includono oggetto-immagine, segmentazione-immagine e l'aggiunta di una fase di "super risoluzione" che aumenta la risoluzione delle immagini create.

Il generatore di immagini di Meta è certamente unico e fa le cose molto bene, ma è ben lungi dall'essere l'unico gioco in città. Strumenti simili sono in circolazione da un po' di tempo e la maggior parte dei principali giocatori ne ha uno in qualche forma. DALL-E di OpenAI ha fatto notizia lo scorso anno, appare in diverse forme e ha un forte seguito. Il modello GPT-4 dell'azienda è anche in grado di generare immagini, sebbene sia necessario un plug-in se si utilizza lo strumento Web di OpenAI. Adobe è stata altrettanto rapida nell'aggiungere l'intelligenza artificiale alla sua suite di servizi. "Firefly", il modello di intelligenza artificiale generativa dell'azienda, è disponibile per l'uso gratuito, sebbene gli abbonati abbiano accesso alla libreria di foto d'archivio di Adobe e quindi a una versione più efficace dello strumento AI che si basa su di esso. Google Bard utilizza anche Firefly per la generazione di immagini. Quindi hai strumenti potenti che richiedono un po 'di lavoro per farli funzionare e suggerimenti decenti se desideri usarli in modo efficace. Questa categoria include artisti del calibro di Stable Diffusion e Midjourney.

Per quanto riguarda quando puoi provare il nuovo strumento di Meta, non lo sappiamo. La società non ha annunciato quando o se riceverà un rilascio pubblico. Meta ha già abbastanza da fare con il lancio di una nuova piattaforma di social media, Threads, e il costante collasso del "Metaverso" con cui fare i conti, ma speriamo che questo nuovo generatore di immagini AI venga rilasciato al pubblico nelle prossime settimane.