Comment Google Gemini 1.5 Pro a appris à entendre et Vertex AI a créé un concepteur de robots
Google a annoncé des mises à jour importantes de son langage et de ses modèles génératifs : Gemini 1.5 Pro sera désormais capable de traiter l'audio et la vidéo sans avoir besoin de transcription, et Imagen 2 bénéficiera de fonctionnalités d'édition d'images et de marquage invisible. capacités.
Google AI
Gemini 1.5 Pro
Le plus grand modèle linguistique de Google, Gemini 1.5 Pro, a été mis à jour et maintenant capable de reconnaître la parole à partir de l'audio et de la vidéo sans télécharger de transcriptions de texte. Cela permettra aux utilisateurs de communiquer directement avec le modèle et de recevoir des réponses basées sur des données audio. Gemini 1.5 Pro a été présenté en février et ses performances sont supérieures aux autres modèles de la société. Son principal avantage est la capacité de traiter une énorme quantité de contexte allant de 128 000 à un million de jetons, soit bien plus que des concurrents comme GPT-4 d'OpenAI.
Imagen 2
Google a également amélioré son modèle génératif Imagen, responsable de créer des images basées sur des demandes de texte. La nouvelle version d'Imagen 2 a reçu les fonctions "inpainting" et "outpainting", vous permettant d'ajouter ou de supprimer des éléments des images générées. De plus, toutes les images générées par le modèle peuvent désormais être marquées d'un filigrane SynthID invisible, indiquant leur origine artificielle.
Vertex AI
Des modèles mis à jour seront disponibles sur la nouvelle plate-forme cloud Vertex AI conçue pour les clients professionnels de Google. Avec son aide, les entreprises pourront créer leurs propres chatbots et les intégrer dans leurs produits et services.
Glossaire
- Google est la plus grande entreprise technologique, développeur d'un moteur de recherche et de divers services
- Gemini - la gamme de modèles linguistiques de Google pour le traitement du langage naturel
- Imagen - le modèle génératif de Google pour créer des images à partir de descriptions textuelles
- Vertex AI - plateforme cloud pour la création et déploiement de modèles d'IA
Liens
Réponses aux questions
Quoi de neuf dans Gemini 1.5 Pro ?
Quelles améliorations Imagen 2 a-t-il reçues ?
Où les modèles Gemini et Imagen mis à jour seront-ils disponibles ?
En quoi Gemini 1.5 Pro est-il différent des autres modèles linguistiques ?
Quels sont les termes clés associés aux nouveaux modèles de Google ?
Hashtags
Enregistrer un lien vers cet article
Discussion sur le sujet – Comment Google Gemini 1.5 Pro a appris à entendre et Vertex AI a créé un concepteur de robots
Lors de la conférence Google Next, la société a annoncé que Gemini 1.5 Pro prend désormais en charge la reconnaissance vocale des appels audio, vidéo et téléphoniques sans transcription. La plateforme Vertex AI de création de bots a également été présentée.
Derniers commentaires
14 commentaires
Écrire un commentaire
Votre adresse email ne sera pas publiée. Les champs obligatoires sont cochés *
Михаил
Gemini 1.5 Pro est une autre avancée dans le domaine du traitement du langage naturel. La capacité de comprendre l’audio sans avoir besoin de transcription ouvre de nouveaux horizons pour les assistants vocaux et les chatbots. 🎉
Катя
Oui, c'est impressionnant ! Mais je suis plus intéressé par la nouvelle fonctionnalité d'inpainting d'Imagen 2. Imaginez, vous pouvez désormais facilement supprimer ou ajouter des éléments aux images. Cela sera utile pour les projets créatifs et la retouche photo. 🖼️
Ян
Excellente nouvelle pour les développeurs ! Avec la quantité de contexte que Gemini 1.5 Pro peut gérer, la création d'applications plus complexes et avancées deviendra beaucoup plus facile. J'ai hâte de l'essayer en pratique. 💻
Анна
Le filigrane SynthID est une bonne idée pour les images génératives d’IA. Cela aidera à les distinguer des vraies photographies et à protéger les droits d'auteur. Mais j'espère que cela ne sera pas trop visible et ne gâchera pas l'impression générale de l'image. 🖌️
Виктор
Ces mises à jour constituent une nouvelle étape vers une plus grande intégration de l’intelligence artificielle dans notre vie quotidienne. J'ai hâte d'utiliser Gemini 1.5 Pro et Imagen 2 pour automatiser les tâches de routine et créer un contenu unique. 🚀
Ганс
Comme un vieux grincheux, je suis sceptique face à toutes ces nouvelles tendances. Pourquoi avons-nous besoin de l’intelligence artificielle si nous avons des personnes capables d’effectuer les mêmes tâches ? C'est juste un autre jouet inutile pour les développeurs. 🙄
София
Hans, je comprends votre inquiétude, mais les progrès ne peuvent pas être arrêtés. Avec des outils comme Gemini 1.5 Pro et Imagen 2, nous pouvons automatiser les tâches de routine et nous concentrer sur un travail plus créatif et intelligent. C’est une opportunité pour l’humanité, pas une menace. 🌟
Лукаш
Je peux déjà imaginer comment Gemini 1.5 Pro sera utilisé dans le service client. La capacité à comprendre les requêtes vocales et à fournir des informations pertinentes en temps réel constitue une véritable avancée. Les clients seront satisfaits du service rapide et efficace. 🤖
Мария
J'ai hâte d'utiliser Imagen 2 pour créer des illustrations uniques pour mes projets. Les fonctions d'inpainting et d'outpainting ouvrent de nombreuses possibilités créatives ! 🎨
Давид
Je ne peux m'empêcher d'être d'accord avec Mikhail. Le traitement de l'audio sans transcription est un énorme pas en avant. Imaginez à quel point cela facilitera l’interaction avec les assistants vocaux dans les voitures ou les montres intelligentes. La technologie change vraiment nos vies ! ⌚
Елена
J'aime l'idée du filigrane SynthID. Cela aidera à distinguer les images génératives des images réelles et à éviter toute confusion. Bien sûr, ce serait formidable s’il était aussi invisible que possible à l’œil nu. 🔍
Якуб
Je vois déjà comment Gemini 1.5 Pro et Imagen 2 seront utilisés dans l'éducation. Imaginez à quel point vos cours seront plus intéressants avec ces outils ! Les étudiants pourront mieux comprendre la matière grâce à la clarté et à l'interactivité. 👩🏫
Франческа
En tant que développeur, j'ai hâte de travailler avec Gemini 1.5 Pro et Imagen 2. Leurs puissantes capacités permettront la création d'applications et de services véritablement innovants. C’est une véritable avancée technologique ! 💻🚀
Андрей
Je ne peux m'empêcher de remarquer que toutes ces mises à jour ne sont que la pointe de l'iceberg. Google continue de développer activement ses technologies d'IA et je suis convaincu que des annonces encore plus passionnantes nous attendent dans un avenir proche. L’ère de l’intelligence artificielle ne fait que commencer ! ⚡