企業は、財務、エンジニアリング、コンサルティングなどのあらゆる業務で、複雑なデータに取り扱っています。しかし、これまでのAIは、こうしたデータを正確に処理することが困難でした。Box AI Enterprise Evalの評価結果によると、Claude Sonnet 4.5は、あらゆる面で優れた性能を発揮するだけでなく、マルチモーダルデータの理解と、構造化データと非構造化コンテンツを統合した推論能力において、画期的な進歩を遂げています。この進歩により、特にプロフェッショナルサービス、宿泊・飲食業、エネルギー、小売業、公共などの業種において、これまで人手と時間がかかっていた業務ワークフローを自動化できる可能性が広がりました。
Boxは、重要な業務プロセスを効率化ために、最先端のAIモデルへのアクセスをお客様に提供することに尽力しています。本日、AnthropicのClaude Sonnet 4.5が、Box AIで利用可能になりました。最も重要な企業タスクの1つであるメタデータ抽出でこのモデルを評価したところ、前モデルと比較して性能が大幅に向上していることがわかりました。
あらゆる面で優れた性能を発揮
Claude Sonnet 4.5とClaude Sonnet 4を、1,500以上のドキュメント、4万以上のデータ項目を含む最新の独自の抽出データセットで評価しました。データセットには、請求書、契約書、研究論文、取引ファイル、公的な身分証明書など、さまざまな業界のユースケースとドキュメントタイプが網羅されており、ドキュメントの長さや形式(テキスト、画像、マルチモーダルコンテンツ)も多様です。このデータセットは、構造化データの抽出、大量のテキストからの高度な推論、非構造化形式の解析、簡潔で情報の多いコンテンツの解釈、マルチモーダルインプットの処理など、幅広い機能に対する負荷テストを目的として設計されました。この拡張されたデータセットを用いることで、以前のデータセットと比較して、企業におけるあらゆる文書処理要件に対応するモデルの性能を包括的な評価できるようになりました。
結果は明らかでした。Claude Sonnet 4.5は、Claude Sonnet 4よりも平均精度が4.1パーセントポイント向上しました。この高い性能は、プロフェッショナルサービス、宿泊・飲食業、エネルギー、小売業、公共など、ほぼすべての業界のデータセットで一貫して確認され、さまざまな企業ドキュメントから情報を抽出する汎用的なタスクにおいて、強力で信頼性の高いモデルであることが証明されました。
マルチモーダルデータを処理し、構造化データと非構造化データの両方を使用してコンテンツ全体を推論
- このモデルでは、画像ファイルやマルチモーダルドキュメントからデータを抽出する能力が大幅に向上しました。画像が多用されたドキュメントの精度は、Claude Sonnet 4の67%と比較して80%に上昇し、13ポイント向上しました。これにより、テキストとスキャン画像、写真といった視覚要素が混在したドキュメントから、構造化データを確実に取得できる可能性が解き放たれます。
- 領収書、パスポート、請求書など、表とテキストが混在するコンパクトなドキュメントに対する精度は67.2%から84.2%へと、17パーセントポイントも大幅に向上しました。これは、小さいながらも情報量の多いドキュメントを扱うワークフローの自動化において、画期的な進歩と言えるでしょう。
お客様のビジネスにもたらすメリット
これらの強力なマルチモーダル機能は、具体的なメリットをもたらし、企業全体の業務を効率化します。
- プロフェッショナルサービス: 税務書類、銀行取引明細書、ID処理を自動化することで、顧客の新規登録時間を数日から数時間に短縮できます。タイムシートや経費明細書に手作業でデータを入力する必要がなくなり、従業員は請求業務に集中できます。SOWや契約変更の処理を迅速化することで、取引サイクルを加速できます。
- 宿泊・飲食業: 身分証明書と予約の確認を自動処理することで、ゲストの即時チェックインが可能になります。フロントデスクのミスと混雑を削減できます。手書きのフィードバックとロイヤルティフォームを、パーソナライズされたサービスとリピート訪問を促進する実用的なインサイトに変換できます。
- エネルギー: フィールドレポート、メンテナンスログ、安全ドキュメントをリモートで瞬時に処理できます。写真も即座に処理できます。許可証や技術図面からデータを確実に抽出することで、コンプライアンスを加速し、監査リスクを軽減できます。請求書とメーターの自動読み取り処理により、請求サイクルを短縮できます。
- 小売業: サプライヤーの請求書の自動照合により、キャッシュフローを最適化できます。返品と保証処理の迅速化により、顧客サービスをスピードアップできます。POSデータ、タイムカード、フィードバックを、手作業で入力することなくリアルタイムのインサイトに変換し、トレンドへの迅速な対応を可能にします。
- 公共: 認可や給付金の申請処理を数週間から数日に短縮できます。税務処理と受給資格判定の精度を向上させ、職員の作業負荷を軽減できます。図面付きの建築許可証、写真付きの登記簿などの複雑な文書を確実かつ完全に処理できます。
いますぐはじめましょう
Claude Sonnet 4.5は、重要なプロセスをより高い精度と信頼性で自動化したいと考えている企業に、強力で新たな選択肢を提供します。特に、以前は処理が困難だったマルチモーダルデータの処理において、性能が大幅に向上しています。
※このブログは Box, Inc 公式ブログ(https://blog.box.com/)2025年9月29日付投稿の翻訳です。
著者: Rutuja Rajwade, Senior Product Marketing Manager at Box AI
原文リンク: https://blog.box.com/first-look-claude-sonnet-45
これまでのBox AI Enterprise Eval
- GPT-5がBox AIに登場: 複雑な企業データを理解するための新たなベンチマーク
- First Look: Grok 4とBox AI
- First look: Claude 4とBox AI
- Update: Gemini 2.5 Pro (I/O Edition)とBox AI
- BoxとIBMが協業し、LlamaモデルをBox AIに導入
- Gemini 2.5 FlashでBox AIのドキュメントQ&Aと抽出を強化
- Box AI Enterprise Eval: OpenAI o3とo4-miniによるBox AIでのデータ抽出
- First look: Grok 3がBox AI StudioとBox AIに近日登場
- First look: GPT-4.1がBox AI Studioで利用可能に
- Box AIによる企業コンテンツのためのMeta Llama 4モデルの評価
- First look: Gemini 2.5 ProとBox AI
- Box、NVIDIA Llama Nemotron推論モデルをBox AI Studioでサポートすることを発表
- Box AI Enterprise EvalでGemma 3を検証
- First look: GPT-4.5 と Box AI
- First look: Claude 3.7 Sonnet と Box AI
- トピックス:
- Box製品情報