Come Google Gemini 1.5 Pro ha imparato a sentire e Vertex AI ha creato un progettista di bot
Google ha annunciato aggiornamenti significativi al suo linguaggio e ai suoi modelli generativi: Gemini 1.5 Pro sarà ora in grado di elaborare audio e video senza la necessità di trascrizione e Imagen 2 acquisirà funzionalità di modifica delle immagini e tagging invisibile capacità.
Google AI
Gemini 1.5 Pro
Il più grande modello linguistico di Google Gemini 1.5 Pro è stato aggiornato e ora in grado di riconoscere il parlato da audio e video senza scaricare trascrizioni di testo. Ciò consentirà agli utenti di comunicare direttamente con il modello e ricevere risposte basate su dati audio. Gemini 1.5 Pro è stato presentato a febbraio e ha prestazioni superiori rispetto ad altri modelli dell'azienda. Il suo vantaggio principale è la capacità di elaborare un'enorme quantità di contesto, da 128.000 a un milione di token, che è molte volte superiore rispetto a concorrenti come GPT-4 di OpenAI.
Imagen 2
Google ha anche migliorato il suo modello generativo Imagen, che è responsabile di creazione di immagini in base alle richieste di testo. La nuova versione di Imagen 2 ha ricevuto funzioni "inpainting" e "outpainting", che consentono di aggiungere o rimuovere elementi dalle immagini generate. Inoltre, tutte le immagini generate dal modello possono ora essere contrassegnate con una filigrana SynthID invisibile, che ne indica l'origine artificiale.
Vertex AI
I modelli aggiornati saranno disponibili sulla nuova piattaforma cloud Vertex AI progettata per i clienti aziendali di Google. Con il suo aiuto, le aziende potranno creare i propri chatbot e integrarli nei propri prodotti e servizi.
Glossario
- Google è la più grande azienda tecnologica, sviluppatrice di un motore di ricerca e di vari servizi
- Gemini: la linea di modelli linguistici di Google per l'elaborazione del linguaggio naturale
- Imagen: il modello generativo di Google per la creazione di immagini da descrizioni di testo
- Vertex AI: piattaforma cloud per la creazione e implementazione di modelli AI
Collegamenti
Risposte alle domande
Cosa c'è di nuovo in Gemini 1.5 Pro?
Quali miglioramenti ha ricevuto Imagen 2?
Dove saranno disponibili i modelli Gemini e Imagen aggiornati?
In cosa Gemini 1.5 Pro è diverso dagli altri modelli linguistici?
Quali sono i termini chiave associati ai nuovi modelli di Google?
Hashtags
Salva un link a questo articolo
Discussione sull'argomento – Come Google Gemini 1.5 Pro ha imparato a sentire e Vertex AI ha creato un progettista di bot
Alla conferenza Google Next, la società ha annunciato che Gemini 1.5 Pro ora supporta il riconoscimento vocale da chiamate audio, video e telefoniche senza trascrizione. È stata inoltre presentata la piattaforma Vertex AI per la creazione di bot.
Ultimi commenti
14 commenti
Scrivi un commento
Il tuo indirizzo e-mail non sarà pubblicato. I campi obbligatori sono spuntati *
Михаил
Gemini 1.5 Pro rappresenta un'altra svolta nel campo dell'elaborazione del linguaggio naturale. La capacità di comprendere l'audio senza bisogno di trascrizione apre nuovi orizzonti per assistenti vocali e chatbot. 🎉
Катя
Sì, è impressionante! Ma sono più interessato alla nuova funzionalità di inpainting in Imagen 2. Immagina, ora puoi facilmente rimuovere o aggiungere elementi alle immagini. Questo sarà utile per progetti creativi e fotoritocco. 🖼️
Ян
Grandi notizie per gli sviluppatori! Con la quantità di contesto che Gemini 1.5 Pro è in grado di gestire, la creazione di applicazioni più complesse e avanzate diventerà molto più semplice. Non vedo l'ora di provarlo nella pratica. 💻
Анна
La filigrana SynthID è una buona idea per le immagini AI generative. Ciò aiuterà a distinguerle dalle fotografie reali e a proteggere il copyright. Ma spero che non sia troppo evidente e non rovini l'impressione generale dell'immagine. 🖌️
Виктор
Questi aggiornamenti rappresentano un altro passo verso una maggiore integrazione dell’intelligenza artificiale nella nostra vita quotidiana. Non vedo l'ora di utilizzare Gemini 1.5 Pro e Imagen 2 per automatizzare le attività di routine e creare contenuti unici. 🚀
Ганс
Come un vecchio burbero, sono scettico nei confronti di tutte queste nuove tendenze. Perché abbiamo bisogno dell’intelligenza artificiale se abbiamo persone in grado di svolgere gli stessi compiti? È solo un altro giocattolo inutile per gli sviluppatori. 🙄
София
Hans, capisco la tua preoccupazione, ma il progresso non può essere fermato. Con strumenti come Gemini 1.5 Pro e Imagen 2, possiamo automatizzare le attività di routine e concentrarci su un lavoro più creativo e intelligente. Questa è un’opportunità per l’umanità, non una minaccia. 🌟
Лукаш
Posso già immaginare come verrà utilizzato Gemini 1.5 Pro nel servizio clienti. La capacità di comprendere le domande vocali e di fornire informazioni rilevanti in tempo reale è una vera svolta. I clienti saranno soddisfatti del servizio veloce ed efficiente. 🤖
Мария
Non vedo l'ora di utilizzare Imagen 2 per creare illustrazioni uniche per i miei progetti. Le funzioni di inpainting e outpainting aprono tantissime possibilità creative! 🎨
Давид
Non posso fare a meno di essere d'accordo con Mikhail. L'elaborazione dell'audio senza trascrizione è un enorme passo avanti. Immagina come ciò renderà più semplice l'interazione con gli assistenti vocali nelle auto o negli smartwatch. La tecnologia sta davvero cambiando le nostre vite! ⌚
Елена
Mi piace l'idea della filigrana SynthID. Ciò aiuterà a distinguere le immagini generative da quelle reali ed evitare confusione. Certo, sarebbe fantastico se fosse il più invisibile possibile agli occhi. 🔍
Якуб
Posso già vedere come Gemini 1.5 Pro e Imagen 2 verranno utilizzati nell'istruzione. Immagina quanto più interessanti saranno le tue lezioni con questi strumenti! Gli studenti potranno comprendere meglio il materiale grazie alla chiarezza e all'interattività. 👩🏫
Франческа
Come sviluppatore, non vedo l'ora di lavorare con Gemini 1.5 Pro e Imagen 2. Le loro potenti funzionalità consentiranno la creazione di applicazioni e servizi veramente innovativi. Questa è una vera svolta nella tecnologia! 💻🚀
Андрей
Non posso fare a meno di notare che tutti questi aggiornamenti sono solo la punta dell'iceberg. Google continua a sviluppare attivamente le sue tecnologie di intelligenza artificiale e sono fiducioso che nel prossimo futuro ci attendono annunci ancora più entusiasmanti. L’era dell’intelligenza artificiale è appena iniziata! ⚡