Google、Gemini 2.0 Flash 思考モード (Flash Thinking Mode) を発表 - o1 Proと競合

これはAIの推論能力を向上させる実験的なモデルで、このモードは「思考プロセスを明示的に表示する」ことができ、ユーザーにGemini 2.0 Flashモデルよりも強力な推論能力を提供します。

o1とo1 Proは同じ質問に答えますが、より長い時間をかけて考えます。(Flash Thinkingは14.3秒、o1は1分42秒、o1 Proは2分18秒かかりました)

Gemini 2.0 Flash Thinking Modeの特徴

  1. 中で表示されます。

  2. Thoughtsパネル機能

  • :Thoughtsパネルはデフォルトで折りたたまれており、Thoughtsタイトルバーをクリックすることで展開できます。
  • :主要な回答とは異なり、Thoughtsパネル内の内容はGoogle AI Studioでは編集できません。
  • ユーザーはGoogle AI Studioでこの機能を利用でき、モデルが回答を生成する際の論理的推論プロセスを直感的に理解できます。

  • 機能の制限

    現在、Flash Thinking Modeは実験的なモデルであり、いくつかの制限があります:

    • :32kトークンまでの入力をサポートし、テキストと画像形式のみを受け付けます。
    • :最大8kトークンまでの出力をサポートし、テキスト出力のみ対応しています。
    • :このモードでは検索機能やコード実行機能などの組み込みツールを使用することはできません。

    Chatbot Arena LLM Leaderboard

    一位に急上昇しました。。

    The leap from Gemini-2.0-Flash:

    • Overall: #3 → #1
    • Overall (Style Control): #4 → #1
    • Math: #2 → #1
    • Creative Writing: #2 → #1
    • Hard Prompts: #1 → #1 (+14 pts)
    • Vision: #1 → #1 (+16 pts)

    ChatGPT o1 / ChatGPT o1 Pro / Gemini-2.0-Flash 比較分析

    チャレンジ1: Zebra Problemの解決

    モデル表現
    ChatGPT o1
    ChatGPT o1 Pro
    Gemini-2.0-Flash-Thinking

    Solve this Zebra Puzzle:


    まず私は人間の知能を使って自分で一度やりました。。。これが標準答案です。

    o1

    思考プロセス

    Connecting clues


    I’m linking designers to their attributes. Yan is next to the $80 toy, and the designer in the yellow shirt works at Zippix. The $40 toy relates to a water-based hobby, specifically swimming.


    Pulling together clues


    I’m thinking through the connections: the $40 toy is for swimming, the purple shirt designer enjoys sewing, the $80 toy is linked with jogging, the writer is at one end, the purple shirt is next to the video game designer, the green shirt designer enjoys painting, and the $90 toy is at one end.


    Pinpointing end specifics


    OK, let me see: the $90 toy is at one end, and the writer is also positioned at one of the ends. This narrows down the possibilities.


    Aligning clues


    It’s interesting to see that $90 and $50 toys are at opposite ends. Since the $90 toy collector enjoys painting and writing is at an end, the ca splits into these sections.


    Pinning down the details


    Hmm, I'm piecing together that the no, the green shirt is at the end, charging $90, and painting. This makes me think the $50 toy might be at the other end.


    Wrapping up details


    OK, let me see. The $50 toy is at position #5 with the writer and their painting hobby. The green shirt design crafted the doll.


    Mapping out the details


    I’ve identified the doll at #1, priced at $90 and garnished with a green shirt and painter's artistic XP. The puzzles, valued at $30, are intriguingly placed elsewhere.


    Identifying roles


    Yan, associated with Tinkeru, is crafting the robot. The green shirt, likely Louis, precedes Yan in the lineup.


    Grabbing color clues


    Louis isn't number one; Kenneth is to the right of the purple shirt. It looks like Louis is somewhere between spots two and five.


    Connecting the pieces


    Kenneth aligns to the right of the Purple shirt, who sews. The green shirt, tied to a doll, is set at number one. The $80 toy is jogged by the Sparkio employee.


    Assigning traits


    OK, I’m pinpointing the locations now: the $80 toy is next to Yan, and the $90 painting hobbyist is at the start. This leads me to think through the others' preferences.


    Figuring out the arrangement


    I’m assuming the $30 puzzles go in spots #3 or #4, with the train set right before them. This setup ensures the connection sequence is spot on.

    出力された答え

    正解です!

    o1 Pro

    思考プロセス

    選択肢のリスト化


    情報を整理するために、各デザイナーの服、名前、おもちゃ、会社、価格、趣味をリスト化しました。緑、オレンジ、紫、白、黄色の服の中から選び、名前はKenneth、Louis、Peter、Timothy、Yan、おもちゃはdoll、puzzles、robot、train_set、video_game、会社はCoggly、Jambix、Sparkio、Tinkeru、Zippix、価格は$30から$90まで、趣味はjogging、painting、sewing、swimming、writingです。


    重要な情報の発見

    KenまたはLouisがビデオゲームデザイナーであることを発見し、YanがTinkeruで働いていること、緑の服のデザイナーがLouisよりも左側にいること、$50のおもちゃデザイナーが端にいること、パズルデザイナーが$30を受け取ること、Vidと$90のおもちゃデザイナーが絵を描くことがわかりました。


    職位の割り当て


    5つの位置に服、名前、おもちゃ、会社、価格、趣味を割り当て、直接的な割り当てと制約を明確にリストアップし、グリッドを使用して整理しています。


    緑の服デザイナーの確認


    緑の服デザイナーは$90のおもちゃDollのデザイナーで、絵を描くのが好きで、YanのロボットおもちゃとCogglyの$80のおもちゃに対応しています。


    緑の服デザイナーとおもちゃの位置決め


    緑の服デザイナーの位置は1または5番目で、それぞれ$90と$50のおもちゃが配置されています。Kennethは白い服を着ていて、ルソーは$40のおもちゃ楽器を演奏しています。


    デザイナーの位置の確定


    緑の服デザイナーは1番目に位置し、$90のおもちゃと絵を描く趣味を持っています。$50のおもちゃは5番目にあり、Kennethは白い服を着ています。


    位置と趣味の指定


    5番目には書き手の趣味があり、価格は$50です。他の位置には残りのオレンジ、紫、白、黄色の服があります。


    位置の決定と関連付け

    黄色の服デザイナーの位置を解決しており、それは2から4の間にある必要があります。同時に、Peterは黄色の服デザイナーのすぐ後ろにいなければならず、黄色の服はZippix社にあります。


    デザイナー活動の確定


    Coggly社の従業員は$80のおもちゃを持ち、ジョギングが好きです。この従業員はYanの隣にいます。

    出力された答え

    評価:彼も自分の答えに問題があることを知っていましたが、彼は問題にタイプミスがあると考えていました。外部問題への帰因の这种方式は、私たち平凡な人間に非常に似ています。

    Flash Thining

    思考プロセス

    Let's break this Zebra Puzzle down strategically. I'm going to use a table-based approach, filling in information as I go and looking for intersections. The key is to identify direct links and then use the 'next to' and 'somewhere to the left/right' clues to constrain the possibilities.


    Initial Table Setup (with row numbers for reference):


    Row Designer # Shirt Name Toy Company Price Hobby

    1

    2

    3

    4

    5

    Processing Clues and Deductions:


    Clue 2: Yellow Shirt = Zippix. Let's tentatively put this in a row.


    Clue 4: Purple Shirt = Sewing. Let's tentatively put this in a row.


    Clue 5: $80 = Jogging. Let's tentatively put this in a row.


    Clue 8: Green Shirt = Painting. Let's tentatively put this in a row.


    Clue 10: Yan = Robot. Let's tentatively put this in a row.


    Clue 11: Yan = Tinkeru. Now we can combine this with Clue 10.


    Clue 16: $90 = Painting. Combine this with Clue 8: $90 = Painting = Green Shirt.


    Table Update 1:


    Row Designer # Shirt Name Toy Company Price Hobby

    ? Yellow Zippix

    ? Purple Sewing

    ? $80 Jogging

    ? Green $90 Painting

    ? Yan Robot Tinkeru

    Clue 9 & 16: $90 is at one end and enjoys Painting. We know Green Shirt = Painting = $90. This means the Green Shirt person is at either Row 1 or Row 5.


    Clue 6: Writing is at one of the ends.


    Table Update 2:


    Possibility 1 (Green at Row 1):


    Row Designer # Shirt Name Toy Company Price Hobby

    1 Green $90 Painting

    2 Yellow Zippix

    3 Purple Sewing

    4 Yan Robot Tinkeru

    5 $50 Writing

    Possibility 2 (Green at Row 5):


    Row Designer # Shirt Name Toy Company Price Hobby

    1 $50 Writing

    2 Yellow Zippix

    3 Purple Sewing

    4 Yan Robot Tinkeru

    5 Green $90 Painting

    Clue 1: $80 is next to Yan. This helps with both possibilities.


    Clue 5: $80 = Jogging.


    Possibility 1 Update:


    Row Designer # Shirt Name Toy Company Price Hobby

    1 Green $90 Painting

    2 Yellow Zippix

    3 Purple Sewing

    4 Yan Robot Tinkeru

    5 $80 Jogging

    Possibility 2 Update:


    Row Designer # Shirt Name Toy Company Price Hobby

    1 $80 Jogging

    2 Yellow Zippix

    3 Purple Sewing

    4 Yan Robot Tinkeru

    5 Green $90 Painting

    Clue 7: Purple shirt is next to the Video game.

    出力された答え

    評価:まだ少し合いません。


    チャレンジ2: ユニコーンの絵を描く
    モデル表現
    ChatGPT o1
    ChatGPT o1 Pro
    Gemini-2.0-Flash-Thinking

    draw an ASCII Art Paint of a unicorn

    o1

    思考プロセス

    Creating a unicorn


    I’m crafting ASCII art of a unicorn head, but it looks more like reindeer horns. Adjusting my approach to achieve the stylized unicorn.


    Stepping back


    The original approach was too intricate, so I opted for a simpler ASCII unicorn. It lacks clear unicorn features, indicating potential for further refinement.


    Crafting the final touch


    I refocused on the subtle elements, like a small horn and mane, ensuring they suggest a unicorn rather than a fantasy dragon.


    Crafting the unicorn


    I’m working through ASCII unicorns, ensuring distinct horn and mane details. Traditional designs with horns seem promising, aiming to refine and emphasize these features further.


    Refining unicorn details


    Crafting an ASCII unicorn involves refining the horse shape with a horn and enhancing the mane and tail details for a more distinct representation.


    Bringing in the horn


    Refining the ASCII art to clearly depict a unicorn horn and adding finer details to distinguish the unicorn from other fantasy creatures. Progressing step by step.


    Crafting the unicorn


    I'm crafting a simpler ASCII unicorn, emphasizing a horn and refined details to clearly distinguish it from other creatures like a tent. Progressing through various approaches and adjustments.


    Enhancing the unicorn


    I’m detailing a simpler ASCII unicorn, adding the horn and refining the horse elements to ensure it's clearly a unicorn, not resembling a tent or cat. Progress is evident.


    Refining the image


    I’m piecing together the unicorn's features to avoid making it resemble a cat or horse stable. It’s interesting to see progress i

    出力された答え

    評価:これも魂の画家ですね!

    o1 Pro

    思考プロセス

    ユニコーン画作の創作


    私はユーザーにユニコーンのASCIIアートを描いてほしいという要求を考え、美しい作品を提供し、簡潔な説明やタイトルを添える計画を立てました。


    フォーマットの保護


    私はASCIIアートのフォーマットが崩れないように確保し、コードブロックを使用してクラシックなユニコーン画像を表示できるようにしています。


    より良い画像の探索


    現在、より高品質なユニコーンのASCIIアートを探しています。別のユニコーン画像がユニコーンの特徴をよりよく表現できるかもしれません。


    ユニコーン美術の探求


    私はオンラインでいくつかのユニコーンのASCIIアートを見つけ、異なるスタイルの画像を探索し、より特徴的なユニコーンの姿を提示しようとしました。


    新しい構図の考案


    私はより特徴的なユニコーンのASCIIアートを見つけるかデザインしようと努力し、異なる構図や要素を通じてユニコーンの独特な姿を表現しようとしました。


    クリエイティブな探求


    私はより特徴的なユニコーンのASCIIアートを探しており、異なる姿や詳細を通じてユニコーンの独特な魅力を表現しようとしています。


    スタイルの探求


    私は異なるユニコーンのASCIIアートスタイルを試し、より鮮明で具体的な表現方法を見つけようとしています。これらの試みを通じて、ユニコーンの姿をよりよく展示することができます。

    出力された答え


    とても気に入りました。しかし、思考プロセスを見ると、ネットで画像を探したようです。。これはチートではないでしょうか。

    Flash Thining

    思考プロセス

    Here's a thinking process that could lead to the ASCII unicorn:


    Understand the Goal: The request is to create an ASCII art representation of a unicorn. This means using text characters to visually resemble the key features of a unicorn.


    Identify Key Features: What makes a unicorn recognizable?


    Horse-like body


    Four legs


    Head with a prominent horn


    Flowing mane and tail (optional, but adds flair)


    Start with the Body - The Base: A good starting point is the main body. A slightly curved or angled line can represent the back. Something like _,-._ or ,-._ could work.


    Add the Head and Neck: The head and neck should extend from the front of the body. The neck should curve upwards towards the head. Characters like \ and / can create that curve. The head can be a smaller, defined shape.


    The Horn - The Defining Feature: This needs to be prominent and placed on the forehead. A triangle (/\) or a pointy shape (^) are good options. Consider using underscores or hyphens to connect it smoothly to the head.


    The Legs: Unicorns have four legs. These need to be positioned to suggest standing. Pairs of characters like | | or slanting lines / \ can represent legs. Consider the spacing between the legs for balance.


    The Tail and Mane: These add detail and dynamism. Wavy lines (~) or groups of characters ('') can work for the mane and tail. Think about the direction and flow.


    Refine and Detail: Look at the overall shape. Are the proportions reasonable? Can any areas be improved with more refined character choices?


    Consider using different characters for shading or outlines (e.g., . or :).


    Think about the placement of the eye.


    Add details like hooves.


    Iterate and Experiment: The first attempt won't always be perfect. Try different character combinations and arrangements. Don't be afraid to erase and restart sections.


    Example Iteration (Internal Thought Process):


    Initial thought for body: ------ (too straight)


    Revised body: _,-._ (better curve)


    Initial thought for horn: ^ (too simple)


    Revised horn: /\\ (more pronounced)


    Legs: || (a bit stiff) -> || (spread further apart)


    Mane: ~~~~ (a bit messy) -> ''''' (more defined strands)


    Add Flourishes (Optional): Things like sparkles, a grassy base, or other decorative elements can enhance the artwork.


    Final Review: Does it look recognizably like a unicorn? Is the spacing and alignment pleasing? Make final tweaks.


    This iterative process of identifying features, starting with a basic structure, adding details, and refining through experimentation is key to creating effective ASCII art.

    出力された答え

    えぇん...一言で尽くせません



    チャレンジ3: 読解

    モデル表現
    ChatGPT o1
    ChatGPT o1 Pro
    Gemini-2.0-Flash-Thinking✅⭐️

    Read the article – https://situational-awareness.ai/from-gpt-4-to-agi/

    For the drivers of progress in the coming four years following GPT-4(2023-2027), Compute, Algorithmic Efficiency, and Unhobbling, How many OOMs can each driver contribute? Could you sum up the answer and make it a markdown table?

    まずは標準答案をお伝えします:

    o1

    出力された答え

    まあ近いと言えば近いです。

    o1 Pro

    出力された答え

    読解力が少し物足りない感じです。

    Flash Thining

    出力された答え

    最も標準答案に近い!!!