OpenAIディープリサーチ:インテリジェントリサーチアシスタントが登場

スマートエージェント(agent)です。これにより、ユーザーは膨大なオンライン情報を効率的に処理することができます。この機能は本日からProユーザー向けに公開され、今後PlusおよびTeamユーザーにも提供される予定です。(Proアカウントを購入して正解だった気がする..)

Deep Researchとは何ですか?

完了できる複雑な研究タスクを処理します。

そのコア機能には以下が含まれます:

  • :人間の研究者と同じように、検索戦略を策定し、研究パスを計画します。
  • :インターネット上の膨大なデータを自動で検索・分析・要約し、高品質なリサーチレポートを生成します。
  • :リサーチプロセス中、Deep Research は取得したリアルタイム情報を基に戦略を調整し、結論の正確性と完全性を確保します。
  • :それは、ユーザーがアップロードしたファイルを解析し、Pythonを使用してデータを可視化し、ウェブページからのチャートや画像を埋め込むことができます。

ネットユーザーの使用事例

ネットユーザー Dan Shipper @danshipper

Deep Researchで行ったテストには、以下のものがありました:

  • (2020年から現在まで)
  • トルストイの登場人物描写を解析し、そこから導かれる人間性に関する彼の見解を推測する
  • (企業の年次財務報告書)、報道されていない可能性のある財務異常を掘り起こす
  • 👕 数枚の写真から出発し、全新規のクローゼットコーディネートを研究して提案する

現在の限界

タスクが予定から外れた場合、現時点では途中で中断するオプションはありません

ネットユーザー Ethan Mollick (@emollick)

で、自ら手がかりを探し、研究の障害を回避します。」

。これは

公式事例

ビジネス | 商業

Help me find iOS and Android adoption rates, % who want to learn another language, and change in mobile penetration, over the past 10 years, for top 10 developed and top 10 developing countries by GDP. Lay this info out in a table and separate stats into columns, and include recommendations on markets to target for a new iOS translation app from ChatGPT, focusing on markets ChatGPT is currently active in.

過去10年間にわたり、世界のGDP上位10か国の先進国および新興国のiOSとAndroidの採用率、別の言語を学びたいと考えているユーザーの割合、ならびにモバイルデバイス普及率の変化について調べてください。これらの情報を表形式で整理し、各データを列別にリストアップしてください。また、ChatGPTの現在の活発な市場における新しいiOS翻訳アプリの市場ポジショニングに関する提案も提供してください。

針を見つけるのは難しい | 針探し

There is a TV show that I watched a while ago. I forgot the name but I do remember what happened in one of the episodes. Can you help me find the name? Here is what I remember in one of the episodes:

  • Two men play poker. One folds after another tells him to bet. The one who folded actually had a good hand and fell for the bluff. On the second hand, the same man folds again, but this time with a bad hand.
  • A man gets locked in the room, and then his daughter knocks on the door.
  • Two men go to a butcher shop, and one man brings a gift of vodka.

Please browse the web deeply to find the TV show episode where this happened exactly.

以前に見たテレビドラマの名前を忘れてしまいましたが、覚えているエピソードの内容があります。このドラマのタイトルを教えてくれませんか?以下は私が覚えてるシーンです:

  • 二人の男がポーカーをしています。一人は相手からベットを促された後、手札を捨てます。実際には良い手を持っていましたが、相手のブラフにかかりました。次のラウンドでも彼は手札を捨てましたが、今回は本当に手が悪かったのです。
  • 一人の男が部屋に閉じ込められ、その後彼の娘がドアをノックします。
  • 二人の男が肉屋に行き、そのうち一人はプレゼントとしてウォッカの瓶を持参しました。

ネットワークを深く検索し、これらのエピソードに正確に対応するテレビシリーズを見つけます。

医学研究

Do a deep dive into attempts to improve the reprogramming efficiency of OSKM by directly modifying the protein sequences of the four Yamanaka factors. List all relevant papers you find, the authors, the methods used, and the results. Study the patterns in the changes to the proteins and corresponding results across the papers and list the top 3 domains that scientists modify to increase efficiency, and why they believe these changes are effective.

、そして彼らがこれらの修正が有効であると考える理由をリストアップしてください。


UXデザイン | ユーザーエクスペリエンスデザイン

Find evidence that shows that buttons with icons & labels are more usable than buttons without labels, or labels without icons. I know there’s been a lot of user studies on it, would love to see a detailed report along with a high-level, once definitive answer on the effectiveness.

この設計の有効性を示しています。

ショッピング | 買物

I’m looking for the perfect snowboard. I will be riding primarily in Hokkaido around twice a month during the winter season. I enjoy groomed runs but also want a board that can handle some fresh powder on occasion. I prefer a versatile all-mountain or freestyle board with a medium flex, something that’s stable for carving yet maneuverable in variable conditions. I want something with a fresh, citrus color palette that will pop on the slopes. My budget is mid-range to slightly premium, and I’d like suggestions on specific brands and models that are accessible in Japan. Please explain why each recommended board suits my requirements. Also, include any tips or considerations for riding in Hokkaido’s unique snow conditions. Include images of the items and format it in an easy-to-read table.

カービング(carving)時の安定性を保ちながら、 various雪状況下でも優れた操作性を維持できます。

フォーマットで情報を整理する。

常識 | General Knowledge

What’s the average retirement age for NFL kickers?

NFLのキッカーの平均引退年齢はどのくらいですか?

ディープリサーチとはどのように機能しますか?

で新たな高みに達しました。

訓練中に、それは次のようなことを学びました:

  1. :クエリ内容に基づき最適な検索戦略を立案し、方向性を継続的に調整します。
  2. :矛盾や不足している情報が見つかった場合、自動的に逆戻りして研究方法を見直します。
  3. :ファイルを直接アップロードして分析し、グラフを作成し、可視化データを生成し、さらにその画像や情報源をウェブサイトに埋め込むことができます。

で新記録を達成しました。

Deep Research がAI評価における突破口を見つける

において、それは

1️⃣ Humanity's Last Exam

、このテストでの新しい最高記録を樹立しました。

🔍 Humanity’s Last Exam とは何ですか?

  • 、AIの専門的な質問に対するパフォーマンスを評価します。
  • 、AIの各分野における専門知識能力を包括的に試します。

📊 Deep Research のパフォーマンス

  • での進歩が最も顕著です。
  • 専門情報を積極的に検索でき、既存の訓練データにのみ依存しない能力を持っています。

2️⃣ GAIA 評価

(AIの実世界問題解決能力を測定する公開評価)において、Deep Research

🔍 GAIA 評価とは何ですか?

  • 標準テストです。
  • 問題の難易度は三個のレベルに分けられ、AIの

📊 ディープリサーチの突破

  • GAIA評価の各難易度レベルにおいて、これまでのすべてのAIモデルを上回る強力な適応能力を見せています。
  • 、ディープリサーチは複雑な問題に対する伝統的なAIを超えるパフォーマンスを発揮します。

Deep Researchのエキスパートレベルのタスクにおけるパフォーマンス

特に以下の分野で優れた成績を収めています:

  • 化学(Chemistry)

  • 言語学(Linguistics)

  • 医療健康(Healthcare)

際には、効率が大幅に向上し、人的な研究の負担を軽減できます。

ディープリサーチの限界

ディープリサーチは多くの新しい能力を解錠しましたが、依然として初期段階にあり、特定の

  1. (幻覚):現在の ChatGPT モデルと比較してその誤推論率は著しく低下していますが、依然として不正確な事実を生成する可能性があります。
  2. 方面でまだ不足があり、研究結論の不確実性を正確に表現できない可能性があります。
  3. :報告および引用フォーマットにおいて、若干の誤りが発生する可能性があります。OpenAI はこれらの問題が使用期間の増加とともに最適化される見込みです。

ディープリサーチアクセス許可

現在、OpenAIは段階的な導入戦略を採用しています:

  • 使用可能で、毎月最大
  • 今後の数週間でアクセス権が付与されます。
  • 今後の数か月内でリリースされる予定です。
  • サポートを待っている状況で、OpenAIはコンプライアンスと技術インフラを最適化しています。

ディープリサーチの今後の発展

さらに、OpenAIの計画は次の通りです:

  • 、より専門的でパーソナライズされた研究サポートを提供します。
  • 、より複雑なタスクを自動で完了します。

ユーザーを支援します