Googleは、Geminiアプリの大幅なアップグレードを2つ発表し、高度な人工知能(AI)ツールを搭載した機能の拡張を行いました。水曜日に発表されたこのアップデートでは、新しいAIエージェント「Gems」とImagen 3画像生成モデルの統合が導入されます。これらの強化は、今年初めのGoogle I/Oで初めてプレビューされました。
Gems: 先進的なAIチャットボット機能
Geminiの新機能であるGemsは、AIチャットボット技術における著しい進歩を示しています。このツールにより、ユーザーは特定のトピックやタスクに合わせたチャットボットの特化バージョンを作成することができます。これらのミニチャットボットは、限定されたデータセットを使用して、より正確で関連性のある応答を提供するように設計されています。
GoogleはGemsの利点について次のように説明しました。「Gemsを使用すると、難しいプロジェクトを考える際に助けとなる専門家チームを作成したり、今後のイベントのアイデアをブレインストーミングしたり、ソーシャルメディア投稿の完璧なキャプションを書いたりすることができます。」Gemsは特定の指示でカスタマイズして、その有効性を高めることができます。ユーザーは、学習コーチ、ブレインストーマー、キャリアガイド、ライティングエディター、コーディングパートナーなどの役割を含む、事前に作成されたGemsの範囲にアクセスできます。この機能は、Gemini Advanced、Business、およびEnterprise層に加入している有料ユーザーに利用可能です。
Imagen 3: 最先端の画像生成
Imagen 3モデルは、Googleの最新の画像生成AIツールであり、Geminiアプリに統合され、ユーザーに画像作成のための強化された機能を提供します。Imagen 3は、Nikon DSLR、GoPro、広角レンズなど、さまざまなスタイルでビジュアルを生成することができます。このツールは、フォトリアルな風景、テクスチャのある油絵、ファンタジーなクレイアニメーションシーンなど、幅広い出力を生み出すように設計されています。
Imagen 3の注目すべきアップグレードは、人々の画像を生成する能力です。この機能は、以前には偏見のあるまたは有害なコンテンツの生成に関する懸念から削除されていました。これらの問題に対処するために、Googleはディープフェイクのリスクを軽減するための安全策を実装し、AI生成画像にウォーターマークを付けるためにSynthIDを導入しました。
アクセスと制限
Imagen 3の機能は、無料の層を含むすべてのGeminiユーザーに提供されますが、有料ユーザーと比較していくつかの制限に直面する可能性があります。同社は、テキストプロンプトを使用して生成された画像をインライン編集する可能性を示唆しましたが、この機能の具体的な詳細は提供されませんでした。重要なことは、GoogleがImagen 3ではフォトリアルで識別可能な人物、未成年の描写、過度に血まみれ、暴力的、または性的なコンテンツの生成をサポートしないと述べていることです。
これらのGeminiアプリのアップデートは、コミュニケーションおよびクリエイティブなタスクのための高度なツールを提供することで、ユーザー体験を向上させることが期待されています。GemsとImagen 3の統合は、AI技術を進化させ、その応用を拡大するというGoogleの継続的なコミットメントを反映しています。