これはAIの推論能力を向上させる実験的なモデルで、このモードは「思考プロセスを明示的に表示する」ことができ、ユーザーにGemini 2.0 Flashモデルよりも強力な推論能力を提供します。
o1とo1 Proは同じ質問に答えますが、より長い時間をかけて考えます。(Flash Thinkingは14.3秒、o1は1分42秒、o1 Proは2分18秒かかりました)
Gemini 2.0 Flash Thinking Modeの特徴
中で表示されます。
Thoughtsパネル機能
:Thoughtsパネルはデフォルトで折りたたまれており、Thoughtsタイトルバーをクリックすることで展開できます。 :主要な回答とは異なり、Thoughtsパネル内の内容はGoogle AI Studioでは編集できません。
ユーザーはGoogle AI Studioでこの機能を利用でき、モデルが回答を生成する際の論理的推論プロセスを直感的に理解できます。
機能の制限
現在、Flash Thinking Modeは実験的なモデルであり、いくつかの制限があります:
:32kトークンまでの入力をサポートし、テキストと画像形式のみを受け付けます。 :最大8kトークンまでの出力をサポートし、テキスト出力のみ対応しています。 :このモードでは検索機能やコード実行機能などの組み込みツールを使用することはできません。
Chatbot Arena LLM Leaderboard
一位に急上昇しました。。
The leap from Gemini-2.0-Flash:
Overall: #3 → #1 Overall (Style Control): #4 → #1 Math: #2 → #1 Creative Writing: #2 → #1 Hard Prompts: #1 → #1 (+14 pts) Vision: #1 → #1 (+16 pts)

ChatGPT o1 / ChatGPT o1 Pro / Gemini-2.0-Flash 比較分析
チャレンジ1: Zebra Problemの解決
モデル | 表現 |
---|---|
ChatGPT o1 | ✅ |
ChatGPT o1 Pro | ❌ |
Gemini-2.0-Flash-Thinking | ❌ |
Solve this Zebra Puzzle:
まず私は人間の知能を使って自分で一度やりました。。。これが標準答案です。
o1
思考プロセス
出力された答え
正解です!
o1 Pro
思考プロセス
出力された答え
評価:彼も自分の答えに問題があることを知っていましたが、彼は問題にタイプミスがあると考えていました。外部問題への帰因の这种方式は、私たち平凡な人間に非常に似ています。
Flash Thining
思考プロセス
出力された答え
評価:まだ少し合いません。
モデル | 表現 |
---|---|
ChatGPT o1 | ❌ |
ChatGPT o1 Pro | ✅ |
Gemini-2.0-Flash-Thinking | ❌ |
draw an ASCII Art Paint of a unicorn
o1
思考プロセス
出力された答え

評価:これも魂の画家ですね!
o1 Pro
思考プロセス
出力された答え

とても気に入りました。しかし、思考プロセスを見ると、ネットで画像を探したようです。。これはチートではないでしょうか。
Flash Thining
思考プロセス
出力された答え

えぇん...一言で尽くせません
チャレンジ3: 読解
o1
思考プロセス
出力された答え
評価:これも魂の画家ですね!
o1 Pro
思考プロセス
出力された答え
とても気に入りました。しかし、思考プロセスを見ると、ネットで画像を探したようです。。これはチートではないでしょうか。
Flash Thining
思考プロセス
出力された答え
えぇん...一言で尽くせません
モデル | 表現 |
---|---|
ChatGPT o1 | ✅ |
ChatGPT o1 Pro | ❌ |
Gemini-2.0-Flash-Thinking | ✅⭐️ |
Read the article – https://situational-awareness.ai/from-gpt-4-to-agi/
For the drivers of progress in the coming four years following GPT-4(2023-2027), Compute, Algorithmic Efficiency, and Unhobbling, How many OOMs can each driver contribute? Could you sum up the answer and make it a markdown table?
まずは標準答案をお伝えします:
o1
出力された答え
まあ近いと言えば近いです。
o1 Pro
出力された答え
読解力が少し物足りない感じです。
Flash Thining
出力された答え
最も標準答案に近い!!!