A poco più di un anno dal lancio di ChatGPT da parte di OpenAI, che ha reso “mainstream” il settore dell’intelligenza artificiale, Google ha presentato Gemini, l'attesissimo modello di intelligenza artificiale multimodale. “Gemini - spiega Demis Hassabis, CEO e Co-Founder di Google DeepMind sul Blog di Google - è stato costruito fin dalle sue fondamenta per essere multimodale, il che significa che può generalizzare, comprendere, operare e combinare senza discontinuità diversi tipi di informazioni, tra cui testo, immagini, audio, video e codice informatico”.
Annunciato alla conferenza degli sviluppatori I/O a maggio, Gemini è un modello linguistico di grandi dimensioni (LLM, Large Language Models) che, secondo Sundar Pichai, CEO di Google ed Alphabet, rivoluzionerà la tecnologia generativa per le aziende e la vita quotidiana. “Credo che la transizione a cui stiamo assistendo con l’intelligenza artificiale sarà la più profonda della nostra vita, molto più grande del passaggio allo smartphone o al web che lo ha preceduto”, ha riferito il manager.
La nuova tecnologia presentata da Google, che sarà progressivamente implementata nella suite di servizi fornita da Mountain View comprende tre diverse versioni di Gemini:
- Gemini Nano, destinato principalmente ai dispositivi mobili;
- Gemini Pro, l’offerta di medie dimensioni progettata per compiti più complessi;
- Gemini Ultra, la versione destinata ai data center e alle grandi aziende (che sarà lanciata l'anno prossimo).
Google Gemini: il confronto con ChatGPT di OpenAI
A differenza di Gemini, GPT-4 non è multimodale, ma è in grado di interagire con altri strumenti che gestiscono input multimodali.
Le valutazioni realizzate da Google hanno riguardato la comprensione naturale delle immagini, dell’audio e dei video, al ragionamento matematico: le prestazioni di Gemini Ultra hanno superato i migliori modelli oggi disponibili in 30 dei 32 benchmark accademici di settore utilizzati più comunemente nella ricerca e sviluppo dei grandi modelli linguistici (LLM).
“Questa nuova era -continua Pichai- rappresenta uno dei più grandi sforzi scientifici e ingegneristici che abbiamo intrapreso come azienda. Sono sinceramente entusiasta di ciò che ci aspetta e delle opportunità che Gemini sbloccherà per le persone in tutto il mondo”.
Con un punteggio del 90%, Gemini Ultra è il primo modello a ottenere risultati migliori delle prestazioni umane in ambito MMLU (massive multitask language understanding; comprensione linguistica multitasking su larga scala). Utilizza una combinazione di 57 materie tra cui matematica, fisica, storia, diritto, medicina ed etica, per valutare sia le conoscenze che le capacità di risoluzione dei problemi: risponde a domande, sintetizza il testo e traduce meglio degli umani.
“Il nostro nuovo approccio in MMLU - evidenzia Hassabis- permette a Gemini di utilizzare le sue capacità di ragionamento per valutare più attentamente prima di rispondere a domande difficili, con miglioramenti notevoli rispetto a una risposta più immediata”.
Azioni Alphabet in rialzo nel pre-market
Salite del 47,36% da inizio anno, nel pre-market di Wall Street le azioni Alphabet di classe A segnano un rialzo del 3,4%. Secondo le indicazioni che arrivano dal consenso Bloomberg, su 63 analisti, oltre l’85% (54 esperti) consigliano di acquistare le azioni GOOGL e 9 hanno una valutazione “hold” (zero “sell”). Il prezzo obiettivo medio a 12 mesi è fissato a 153,35 dollari, quasi 18 punti percentuali in più rispetto ai livelli attuali.
Azioni Alphabet classe A (GOOGL) e C (GOOG), quali devo comprare?