Google представил два значительных обновления для своих приложений Gemini, расширяя их возможности с помощью передовых инструментов искусственного интеллекта (ИИ). Объявление, сделанное в среду, представляет интеграцию нового ИИ-агента «Gems» и модели генерации изображений Imagen 3. Эти улучшения были впервые продемонстрированы на Google I/O в начале этого года.
Gems: Расширенный функционал чат-ботов ИИ
Gems, новая функция для Gemini, представляет собой значительный прогресс в технологии чат-ботов ИИ. Этот инструмент позволяет пользователям создавать специализированные версии чат-ботов, адаптированные под конкретные темы или задачи. Эти мини-чат-боты с ограниченным набором данных предназначены для предоставления более точных и релевантных ответов.
Google подробно рассказал о преимуществах Gems, заявив: «С помощью Gems вы можете создать команду экспертов, чтобы помочь вам обдумать сложный проект, придумать идеи для предстоящего мероприятия или написать идеальную подпись для сообщения в социальной сети». Gems можно настроить с помощью специальных инструкций для повышения их эффективности. Пользователи смогут получить доступ к ряду заранее подготовленных Gems, включая такие роли, как учебный тренер, мозговой штурмовик, карьерный гид, редактор текстов и партнер по программированию. Эта функция будет доступна для платных пользователей, включая подписчиков Gemini Advanced, Business и Enterprise уровней.
Imagen 3: Современная генерация изображений
Модель Imagen 3, новейший инструмент ИИ для генерации изображений от Google, будет интегрирована в приложения Gemini, предоставляя пользователям расширенные возможности для создания изображений. Imagen 3 может генерировать визуальные материалы в различных стилях, таких как Nikon DSLR, GoPro, широкоугольный объектив и другие. Инструмент предназначен для создания широкого спектра выходных данных, включая фотореалистичные пейзажи, текстурированные масляные картины и сказочные сцены из пластилина.
Значительным обновлением Imagen 3 является его способность генерировать изображения людей. Эта функция была ранее удалена из-за опасений по поводу создания предвзятых или вредоносных материалов. Чтобы решить эти проблемы, Google внедрил меры безопасности для снижения риска дипфейков и представил SynthID для водяных знаков на изображениях, созданных ИИ.
Доступ и ограничения
Возможности Imagen 3 будут развернуты для всех пользователей Gemini, включая тех, кто находится на бесплатном уровне, хотя они могут столкнуться с определенными ограничениями по сравнению с платными пользователями. Компания намекнула на возможность редактирования сгенерированных изображений с помощью текстовых подсказок, хотя конкретные детали этой функции не были предоставлены. Важно отметить, что Google заявил, что Imagen 3 не поддерживает генерацию фотореалистичных, узнаваемых людей, изображений несовершеннолетних, а также чрезмерно кровавого, жестокого или сексуального контента.
Эти обновления приложений Gemini, как ожидается, улучшат пользовательский опыт за счет предоставления передовых инструментов для общения и творческих задач. Интеграция Gems и Imagen 3 отражает постоянное стремление Google к развитию технологий ИИ и расширению их применения.