Google ha presentado dos importantes mejoras para sus aplicaciones Gemini, ampliando sus capacidades con herramientas avanzadas de inteligencia artificial (IA). El anuncio, realizado el miércoles, introduce la integración de «Gems», un nuevo agente de IA, y el modelo de generación de imágenes Imagen 3. Estas mejoras se mostraron por primera vez en la Google I/O a principios de este año.
Gems: Funcionalidad Avanzada de Chatbot de IA
Gems, la nueva función para Gemini, representa un avance notable en la tecnología de chatbots de IA. Esta herramienta permite a los usuarios crear versiones especializadas del chatbot adaptadas a temas o tareas específicas. Estos mini chatbots, con un conjunto de datos limitado, están diseñados para ofrecer respuestas más precisas y relevantes.
Google detalló los beneficios de Gems, afirmando: «Con Gems, puedes crear un equipo de expertos que te ayuden a pensar en un proyecto desafiante, generar ideas para un próximo evento o escribir la leyenda perfecta para una publicación en redes sociales». Gems se puede personalizar con instrucciones específicas para mejorar su efectividad. Los usuarios tendrán acceso a una gama de Gems preconfigurados, incluyendo roles como Coach de Aprendizaje, Generador de Ideas, Guía de Carrera, Editor de Escritura y Socio de Codificación. Esta característica estará disponible para los usuarios de pago, incluidos aquellos suscritos a los niveles Gemini Advanced, Business y Enterprise.
Imagen 3: Generación de Imágenes de Última Generación
El modelo Imagen 3, la última herramienta de IA para la generación de imágenes de Google, se integrará en las aplicaciones Gemini, ofreciendo a los usuarios capacidades mejoradas para crear imágenes. Imagen 3 puede generar visuales en varios estilos, como Nikon DSLR, GoPro, lente gran angular, y más. La herramienta está diseñada para producir una amplia gama de salidas, incluyendo paisajes fotorrealistas, pinturas al óleo con textura, y escenas de animación en plastilina.
Una actualización notable con Imagen 3 es su capacidad para generar imágenes de personas. Esta función se había eliminado anteriormente debido a preocupaciones sobre la generación de contenido sesgado o dañino. Para abordar estos problemas, Google ha implementado salvaguardas para reducir el riesgo de deepfakes y ha introducido SynthID para marcar con agua las imágenes generadas por IA.
Acceso y Limitaciones
Las capacidades de Imagen 3 se implementarán para todos los usuarios de Gemini, incluidos aquellos en el nivel gratuito, aunque podrían encontrar ciertas limitaciones en comparación con los usuarios de pago. La empresa insinuó la posibilidad de edición en línea de las imágenes generadas mediante indicaciones de texto, aunque no se proporcionaron detalles específicos sobre esta funcionalidad. Es importante destacar que Google ha declarado que Imagen 3 no admitirá la generación de individuos fotorrealistas, identificables, representaciones de menores o contenido excesivamente sangriento, violento o sexual.
Se espera que estas actualizaciones a las aplicaciones Gemini mejoren la experiencia del usuario al proporcionar herramientas avanzadas tanto para la comunicación como para tareas creativas. La integración de Gems e Imagen 3 refleja el compromiso continuo de Google con el avance de la tecnología de IA y la expansión de sus aplicaciones.