Google hat zwei bedeutende Upgrades für seine Gemini-Apps angekündigt, die deren Fähigkeiten mit fortschrittlichen Tools der künstlichen Intelligenz (KI) erweitern. Die am Mittwoch gemachte Ankündigung führt die Integration von „Gems“, einem neuen KI-Agenten, und dem Imagen 3 Bildgenerierungsmodell ein. Diese Verbesserungen wurden erstmals auf der Google I/O Anfang dieses Jahres vorgestellt.
Gems: Fortschrittliche KI-Chatbot-Funktionalität
Gems, die neue Funktion für Gemini, stellt einen bemerkenswerten Fortschritt in der KI-Chatbot-Technologie dar. Dieses Tool ermöglicht es Nutzern, spezialisierte Versionen des Chatbots zu erstellen, die auf bestimmte Themen oder Aufgaben zugeschnitten sind. Diese Mini-Chatbots, mit einem begrenzten Datensatz, sind darauf ausgelegt, präzisere und relevantere Antworten zu liefern.
Google erläuterte die Vorteile von Gems und sagte: „Mit Gems können Sie ein Expertenteam erstellen, das Ihnen hilft, ein herausforderndes Projekt zu durchdenken, Ideen für eine bevorstehende Veranstaltung zu entwickeln oder die perfekte Bildunterschrift für einen Social-Media-Post zu schreiben.“ Gems können mit spezifischen Anweisungen angepasst werden, um ihre Effektivität zu erhöhen. Nutzer erhalten Zugang zu einer Reihe vorgefertigter Gems, darunter Rollen wie Lerncoach, Brainstormer, Karriereberater, Schreibredakteur und Programmierpartner. Diese Funktion wird für zahlende Nutzer verfügbar sein, einschließlich derjenigen, die die Stufen Gemini Advanced, Business und Enterprise abonniert haben.
Imagen 3: Hochmoderne Bildgenerierung
Das Imagen 3 Modell, Googles neuestes KI-Tool zur Bildgenerierung, wird in die Gemini-Apps integriert und bietet den Nutzern erweiterte Möglichkeiten zur Erstellung von Bildern. Imagen 3 kann visuelle Elemente in verschiedenen Stilen erzeugen, wie z. B. Nikon DSLR, GoPro, Weitwinkelobjektiv und mehr. Das Tool ist darauf ausgelegt, eine breite Palette an Ausgaben zu erzeugen, darunter fotorealistische Landschaften, texturierte Ölgemälde und fantasievolle Knetanimationen.
Ein bemerkenswertes Upgrade bei Imagen 3 ist die Fähigkeit, Bilder von Menschen zu generieren. Diese Funktion wurde zuvor aufgrund von Bedenken hinsichtlich der Erzeugung von voreingenommenen oder schädlichen Inhalten entfernt. Um diese Probleme zu beheben, hat Google Sicherheitsmaßnahmen implementiert, um das Risiko von Deepfakes zu verringern, und SynthID zur Wasserzeichenmarkierung von KI-generierten Bildern eingeführt.
Zugang und Einschränkungen
Die Fähigkeiten von Imagen 3 werden für alle Gemini-Nutzer, einschließlich derjenigen auf der kostenlosen Stufe, eingeführt, obwohl sie im Vergleich zu zahlenden Nutzern auf bestimmte Einschränkungen stoßen könnten. Das Unternehmen deutete auf die Möglichkeit der Inline-Bearbeitung von generierten Bildern mit Textvorgaben hin, obwohl keine spezifischen Details zu dieser Funktion bereitgestellt wurden. Wichtig ist, dass Google erklärt hat, dass Imagen 3 keine Unterstützung für die Erstellung von fotorealistischen, identifizierbaren Personen, Darstellungen von Minderjährigen oder übermäßig blutigen, gewalttätigen oder sexuellen Inhalten bietet.
Diese Updates für die Gemini-Apps sollen die Benutzererfahrung durch die Bereitstellung fortschrittlicher Tools für Kommunikations- und kreative Aufgaben verbessern. Die Integration von Gems und Imagen 3 spiegelt Googles kontinuierliches Engagement zur Weiterentwicklung der KI-Technologie und zur Erweiterung ihrer Anwendungen wider.