本日、OpenAIが最新モデルであるGPT-5をリリースしました。Enterprise Advancedプランのお客様は、Box AI StudioとBox AI APIでご利用いただけます。そしてまもなく、Box AIのすべてのバージョンにも展開する予定です。
Boxによるテストでは、GPT-5は複雑なロジックをより直感的に理解し、要求の厳しい企業タスクに非常に優れた能力を発揮することがわかりました。非構造化データに対する理解度も高く、複数ステップの分析課題にも優れたパフォーマンスを発揮しました。GPT-5は、理想的な思考パートナーとして機能します。これは企業にとって、法的契約書における微妙なリスクの特定から、財務報告書における複雑なオンザフライ計算の実行まで、より高度で信頼性の高い自動化につながります。
複雑な企業情報を理解するための新たなベンチマーク
AIモデルとそれが企業に与える影響に対する最も重要なテストの1つが、膨大な非構造化データ(ビジネスを推進しながらも分析が困難な緻密な契約書、レポート、プレゼンテーションなど)を理解する能力です。GPT-5がデータ抽出のパフォーマンス向上を実証したことで、有用なインサイトを引き出し、コンテンツからワークフローを実行することができるようになりました。
GPT-5のデータ抽出精度は90%で、GPT-4.1よりも大幅に向上
GPT-5とGPT-4.1を、契約書、研究論文、取引ファイル、政府発行の身分証明書など、多様なテキストと画像を含むマルチモーダルドキュメントの8,000以上の項目を網羅した独自の抽出チャレンジセットで評価しました。このデータセットは、構造化データの抽出、緻密なテキストに対する複雑な推論、非構造化データの解析、簡潔で高信号なコンテンツの解釈、マルチモーダルインプットの処理など、幅広いモデル機能をストレステストするために設計されました。
全体として、GPT-5はほとんどのカテゴリで一貫してGPT-4.1を上回りました。表の解析精度、文書間の文脈推論、文書構造への適応性において顕著な向上が見られました。たとえば、文書や画像からは容易に入手できない情報を抽出するように求められた場合、GPT-5は、研究論文間で異なる引用や参考文献といった詳細な情報から正確な回答を推論しました。以前のモデルは、回答を返さなかったり、間違った回答を返していました。
これらの進歩は、GPT-5の強化されたロングコンテキスト理解、より強力なレイアウト認識、改良された数学的推論、そしてより高度なマルチモーダルグラウンディングを反映しており、現実世界のさまざまなコンテンツからより正確で信頼性の高いデータ抽出を可能にします。最も難しいデータセットにおいて、GPT-5はGPT-4.1と比較して、特定のコンテンツを正確に正しく抽出する能力が5パーセントポイント向上しています。これは、特に最も困難で複雑なデータセットに対するコンテンツ理解における大きな進歩を表しています。
GPT-5は長文コンテンツで大幅な進歩。GPT-4.1と比較して9パーセントポイントの精度向上
企業コンテンツには、電子メールや通知などの短い文章から、履歴書、給与明細書、領収書などの中程度の長さの文書、契約書、研究論文、社内規程マニュアルなどの長文で複雑なものまで、あらゆる形式やサイズのファイルがあります。特に長文文書において、GPT-5はGPT-4.1と比較して9パーセントポイントの大幅な精度向上を示しました。これは期待が持てるパフォーマンスの向上です。長くて緻密なコンテンツからインサイトを抽出することは、知的労働において依然として最も面倒で時間のかかる作業の1つです。これらの向上は、GPT-5が長文文脈推論、複数段落の統合、長いスパンにわたる正確性の維持において強化された能力を有することを示しており、構造、論理、ナラティブのフローを深く理解する必要があるユースケースにおいて真価を発揮します。
企業の最も難しい質問に対する卓越した回答
GPT-5に複雑で多段階な質問をしたところ、この新しいモデルは驚異的なパフォーマンスを発揮しました。緻密な財務報告書、技術マニュアル、複数条項からなる法的契約書を推論するようGPT-5に指示したところ、結果は明白でした。GPT-5の優れたロジックは、企業おける最高の「思考モデル」としての地位を確立しました。
財務的推論の限界を押し広げるために設計した次のシナリオを考えてみましょう。「アダム・スタインの銀行口座は、2019年11月中に毎日同じ利率で利息を得ています。11月25日に1回の入金を行い、すべてのAmazon購入額をぴったり相殺し、月末残高をちょうど40,000ドルにしたい場合、 彼はいくら入金する必要があるのでしょうか?」
この質問に答えるには、複数の数値を抽出するだけでなく、それらの関係を理解し、日次利率を計算し、残高を予測し、逆算して解決策を見つける必要があります。GPT-5は、この複雑なロジックの連鎖を完璧に処理して、正しい答えを提供しました。これは、以前のモデルが苦労していたタスクです。
Boxのテストにより、GPT-5の直感的な強みが浮き彫りになりました。
- 洗練された数学的推論: このモデルは、金融課題を分解し、必要な計算を実行し、新しい答えを合成する強力な能力を有し、数学的概念をほぼ直感的に理解できます。
- より効果的なデータ抽出: GPT-5は膨大なメタデータ抽出に優れています。その信頼性は、契約書の分析やデータガバナンスといった企業全体のプロセスを自動化するための基礎となります。
- より深いコンテキストロジック: GPT-5は、定性的により多くのコンテキストを念頭に置き、複雑なロジックを課題に適用できます。これは、エラーの減少と、信頼性の高い回答に直結します。
GPT-5が、あらゆる業界の企業タスクに変革をもたらす
この新しいレベルの推論技術は、あらゆる業界に具体的なメリットを提供し、より洗練されたユースケースを実現します。
- 金融サービス: 単なるデータ取得にとどまりません。財務報告書に関する複雑な複数の要素からなる質問に対し、GPT-5は必要な計算を実行し、総合的な回答を提供します。オンザフライのデータ検証とクロスドキュメント分析も実行して、まったく新しいインサイトを生み出します。
- 法務: 何千もの文書にわたる重要なデータの分析を確実に自動化します。GPT-5は、主要な用語、日付、条項だけでなく、それらに内在する潜在的なリスクと義務も的確に特定できます。これは、コンプライアンス監査とリスク管理にとって不可欠です。
- 小売業と消費財製造業: 消費者動向レポートやサプライチェーン文書から、より深く、より繊細なインサイトを導き出します。このモデルは、市場調査、フォーカスグループの会話、売上レポートなどの複数の情報源から情報を統合する能力を備えており、主要なテーマとセンチメントを要約することで、より迅速で洞察力に富んだ意思決定を行うのに役立ちます。
- テクノロジーとエンジニアリング: 技術仕様書、科学論文、コードサンプル、エンジニアリングドキュメントなどに対して、より高い分析精度を実現します。このモデルは、情報源内の重大な曖昧さを特定して明確にすることで、正しい情報に基づいた結論を正確に導き出し、信頼できるインサイトを提供します。
BoxでOpen AI GPT-5を使いはじめましょう
GPT-5の進歩は、よりインテリジェントな企業向けAIへの大きな一歩です。この強化された推論機能は、より迅速で正確なドキュメント分析と真に信頼性の高いナレッジ抽出といった実用的なビジネス成果をもたらします。GPT-5を活用することで、膨大なコンテンツを処理、分析、理解するAIソリューションを実装でき、ミッションクリティカルな業務に求められる高い基準を満たすことができます。
さぁ、はじめましょう! GPT-5をBox AI StudioとBox AI APIでいますぐお試しください。
※このブログは Box, Inc 公式ブログ(https://blog.box.com/)2025年8月8日付投稿の翻訳です。
著者: Rutuja Rajwade, Senior Product Marketing Manager at Box AI
原文リンク: https://blog.box.com/now-available-open-ais-gpt-5-premiere-thinking-model-box-ai
これまでのBox AI Enterprise Eval
- First Look: Grok 4とBox AI
- First look: Claude 4とBox AI
- Update: Gemini 2.5 Pro (I/O Edition)とBox AI
- BoxとIBMが協業し、LlamaモデルをBox AIに導入
- Gemini 2.5 FlashでBox AIのドキュメントQ&Aと抽出を強化
- Box AI Enterprise Eval: OpenAI o3とo4-miniによるBox AIでのデータ抽出
- First look: Grok 3がBox AI StudioとBox AIに近日登場
- First look: GPT-4.1がBox AI Studioで利用可能に
- Box AIによる企業コンテンツのためのMeta Llama 4モデルの評価
- First look: Gemini 2.5 ProとBox AI
- Box、NVIDIA Llama Nemotron推論モデルをBox AI Studioでサポートすることを発表
- Box AI Enterprise EvalでGemma 3を検証
- First look: GPT-4.5 と Box AI
- First look: Claude 3.7 Sonnet と Box AI
- トピックス:
- Box製品情報