Google a dévoilé deux mises à jour majeures pour ses applications Gemini, élargissant leurs capacités grâce à des outils d’intelligence artificielle (IA) avancés. L’annonce, faite mercredi, introduit l’intégration de « Gems », un nouvel agent IA, et du modèle de génération d’images Imagen 3. Ces améliorations ont été initialement présentées lors de la Google I/O plus tôt cette année.
Gems : Fonctionnalité avancée de chatbot IA
Gems, la nouvelle fonctionnalité pour Gemini, représente une avancée notable dans la technologie des chatbots IA. Cet outil permet aux utilisateurs de créer des versions spécialisées du chatbot adaptées à des sujets ou des tâches spécifiques. Ces mini chatbots, avec un ensemble de données limité, sont conçus pour fournir des réponses plus précises et pertinentes.
Google a détaillé les avantages de Gems en déclarant : « Avec Gems, vous pouvez créer une équipe d’experts pour vous aider à réfléchir à un projet difficile, à générer des idées pour un événement à venir ou à rédiger la légende parfaite pour un post sur les réseaux sociaux. » Gems peuvent être personnalisés avec des instructions spécifiques pour améliorer leur efficacité. Les utilisateurs auront accès à une gamme de Gems préfabriqués, incluant des rôles tels que Coach d’apprentissage, Générateur d’idées, Guide de carrière, Éditeur de textes, et Partenaire de codage. Cette fonctionnalité sera disponible pour les utilisateurs payants, y compris ceux abonnés aux niveaux Gemini Advanced, Business, et Enterprise.
Imagen 3 : Génération d’images de pointe
Le modèle Imagen 3, le dernier outil d’IA de génération d’images de Google, sera intégré aux applications Gemini, offrant aux utilisateurs des capacités améliorées pour créer des images. Imagen 3 peut générer des visuels dans divers styles, tels que Nikon DSLR, GoPro, objectif grand angle, et plus encore. L’outil est conçu pour produire une large gamme de rendus, y compris des paysages photoréalistes, des peintures à l’huile texturées, et des scènes de claymation fantaisistes.
Une mise à jour notable avec Imagen 3 est sa capacité à générer des images de personnes. Cette fonctionnalité avait été précédemment retirée en raison de préoccupations concernant la génération de contenu biaisé ou nuisible. Pour résoudre ces problèmes, Google a mis en place des mesures de sécurité pour réduire le risque de deepfakes et a introduit SynthID pour le filigrane des images générées par l’IA.
Accès et limitations
Les capacités d’Imagen 3 seront déployées pour tous les utilisateurs de Gemini, y compris ceux du niveau gratuit, bien qu’ils puissent rencontrer certaines limitations par rapport aux utilisateurs payants. La société a laissé entendre la possibilité d’une édition en ligne des images générées à l’aide de prompts textuels, bien que les détails spécifiques sur cette fonctionnalité n’aient pas été fournis. De plus, Google a précisé qu’Imagen 3 ne prendra pas en charge la génération de personnes identifiables photoréalistes, de représentations de mineurs, ou de contenu excessivement sanglant, violent ou sexuel.
Ces mises à jour des applications Gemini devraient améliorer l’expérience utilisateur en fournissant des outils avancés pour les tâches de communication et de création. L’intégration de Gems et d’Imagen 3 reflète l’engagement continu de Google à faire progresser la technologie de l’IA et à élargir ses applications.