先月、Googleは生成AIの最新実験であるWhiskを発表しました。これは従来のテキストから画像を生成する形式を超えたツールで、ユーザーが直接画像を使って創作することができます。画像をドラッグするだけで創作を開始できます。Whiskはあなたの画像から主要な特徴を抽出しますので、生成結果は予想と異なる場合があります。例えば、主題の身長、体型、髪型や肌の色などが変化することがあります。これらの詳細がプロジェクトにとって重要であることを理解しているため、Whiskではいつでも基本的なプロンプトを確認・編集できるようになっています。
Whiskのコア機能は以下の通りです:
主体、シーン、スタイルの3種類の画像入力方法を提供します; 再ミックスを通じてデジタルドール、エナメルバッジやステッカーなどのパーソナライズされたデジタル作品を生成します。
使用例
1. 奇幻なカワウソの生成画像
明るい黄色の背景を持つこの画像は、イチゴ模様の水着を着て花輪をつけた奇妙なカワウソを示しています。このユニークな画像を生成するために使用された入力には、カワウソの写真(主体)、花畑(シーン)、そしてアニメ調の雲模様(スタイル)が含まれています。
2. 砂糖まみれのドーナツエナメルバッジの生成
この画像は、Whiskがどのようにして画像をエナメルバッジに変換するかを示しています。それはカラフルで砂糖のかかったドーナツです。左側の入力画像には、実際のドーナツの写真と金属製の切り抜きシルエットが含まれており、これらが最終的にエナメルバッジデザインに組み合わされています。
3. 幻想的な一角猫の生成画像
この画像は、紫色に輝く角付きの幻想的な猫を描いています。その緑色の目が特に目を引きます。猫は水面にある大きな蓮の葉に横たわり、背景にはさらに蓮が散りばめられています。この幻想的なシーンを生成するために使用された入力には、光沢のある角付き猫(主体)、蓮を含む自然のシーン(シーン)、そして木々と雲の風景画(スタイル)が含まれています。
4. 奇幻な魚の生成画像
明るい黄色の背景を持つこの画像は、背中に都市が構築された夢幻的な魚を示しています。この奇妙なシーンを生成するために使用された入力には、潜水艦(主体)、浮遊島(シーン)、そして風景画(スタイル)が含まれています。
Whiskの技術
この方法により、Whiskは単なるコピーではなく、画像の本質を捉えることができます。ユーザーはこれに基づいて主体、シーン、スタイルを簡単に再ミックスし、新しい視覚体験を作り出すことができます。
試用
https://labs.google/whisk