<img height="1" width="1" style="display:none" src="https://www.facebook.com/tr?id=139163818022217&amp;ev=PageView&amp;noscript=1"> <img height="1" width="1" style="display:none" src="https://www.facebook.com/tr?id=271598307802760&amp;ev=PageView&amp;noscript=1">

最近よく聞くコンテンツレイクって?
その重要性と効果、要件を解説

 2021.12.21  Box Japan

最近、「コンテンツレイク」と呼ばれる新しい概念が提唱され、話題を集めています。コンテンツレイクはファイルやコンテンツといった非構造化データを集約し、業務や企業を運営する上での意思決定を支援する情報を迅速に得たり、ワークフローを効率化させられることが特徴です。本記事ではデータドリブン面でのコンテンツレイクの概要と具体的な要件について紹介します。

最近よく聞くコンテンツレイクって?その重要性と効果、要件を解説

コンテンツレイクとは?

近年、ビッグデータの50%以上を占めていながらも扱いやすいように管理されていない非構造化データを有効活用しようという動きが注目されています。その中で、コンテンツレイクは非構造化データを構造化データのように扱うための仕組みとして提唱され、世界中で広まっている新しいデータマネジメントの概念です。

データには「構造化データ」と「非構造化データ」がある

企業内で蓄積されるビッグデータは大きく分けて2種類に分類されます。顧客情報を蓄積するCRM(Customer Relationship Management)や基幹管理システムを統合管理するERP(Enterprise Resources Planning)のように業務アプリケーション内で整理されている構造化データと、契約書や請求書のような文書データや画像、音声、動画といったネイティブなファイル形式の非構造化データに分けられます。割合としては非構造化データが8割と大半を占めており、データ量はデジタルトランスフォーメーションの促進などを背景に爆増している傾向にあります。

コンテンツレイクとは、非構造化データを蓄積・利用する仕組み

企業に集まってくるデータは、業務システム内の構造化データやWebサイトやアプリケーション、IoT技術から獲得できる準構造化データ、画像・音声・動画などの非構造化データなど膨大な種類と数に上ります。そのため、企業内には大量のデータが蓄積されますが、それらの中から有効なデータだけをダイレクトに抽出して活用することは難しいという課題があります。

この課題への対処として、多様なデータを蓄積、処理およびアクセスできて、スムーズに検索や抽出を可能とする一元管理の仕組みである「データレイク」があります。そのデータレイクの中で、非構造化データ(コンテンツ)に特化し、構造化データと同じように扱うことができる仕組みこそが「コンテンツレイク」です。

「大切な情報を保護する~データガードレールと行動分析」(完全版)
データのガードレールと行動分析(サマリー版)

なぜ必要?コンテンツレイクの重要性

コンテンツレイクが重要視される理由として「非構造化データの増加」が挙げられます。例えば、小売店では「売上」や「顧客情報」などの構造化データに加えて、商品の陳列情報(写真・動画)や監視カメラの映像、仕入れ状況などの非構造化データ(コンテンツ)も経営判断をする際の重要な情報の一端を担います。

ただし、非構造化データは構造化データと異なり、ユニークなフォーマットを持つ形式のデータであるため、定型化して扱うことが難しく、データ活用する時は専門的な処理を必要とします。特に、その情報が各拠点や事業所単位で独自に管理されていると情報の検索が難しく、場合によっては存在を把握することすらできません。

コンテンツレイクでは、非構造化データを拠点や部署の垣根を超えて集約し、全体で共有できるようにします。この仕組みでは、保有している非構造化データ全てにアクセスできるようになり、その活用自体が容易になります。非構造化データの重要性が注目される中、コンテンツレイクは新たな価値の創造や、組織全体の活性化、データドリブン経営の精緻化やスピードアップなど様々な面での効果が期待されています。

コンテンツレイクで重視すべき点

コンテンツレイクを自社に導入する際に注目すべき要点として「蓄積しやすい状態を作れること」が挙げられます。データによる意思決定を行う場合、ニーズが顕在化してから必要なデータとコンテンツを準備する状態ではスピード感が足りず、機会損失に繋がってしまいます。

逆説的に、スピード感あふれる意思決定においては、使いたい時にはいつも必要なデータとコンテンツが既にある状態こそが望ましいと言えます。つまり、コンテンツレイクでは、データの一元管理とアプリケーション上で必要なデータを直感的に得られる状況が整備されていなければなりません。また、コンテンツはリアルタイム性の高さが重視されるため、構造化データで言うデータベースの更新と同じことである版管理が備わり、常に最新データを得られる環境であることも要件のひとつです。

コンテンツレイクの要件

コンテンツレイクを実現するためには、様々な形式で独自のフォーマットを持つコンテンツを単一基盤で一元管理できる必要があります。人は直感的に理解できても、コンピュータが処理するには手間であった非構造化データを、保管(版管理含む)、共有、参照、編集、削除(破棄)といったアクションを同一のプラットフォームで行える必要があります。また、業界を問わず活用されることから、様々なファイルフォーマットに対応する必要もあります。近年ではデータ・コンテンツの共有や活用は社内にとどまらないため、クラウドベースということも必須でしょう。

大量発生する非構造化データをクラウド上で管理することは、社内外のエコシステムの枠を越えて非構造化データの収集や更新、アクセスを容易にするため、ビジネスやアプリケーション内でコンテンツを活かす際の意思決定が迅速かつ正確になることが期待できます。また、これはテレワークといった多様な働き方をする現在、どこからでもコンテンツレイクを利用できることにもつながります。

一方、コンテンツレイクのセキュリティ対策も必要です。RDB同様、二段階認証やアクセス制御はもちろんのこと、コンテンツならではの電子透かし機能など、コンテンツを保護するためのセキュリティが充実している必要があります。また、技術要件としては蓄積しやすくするためには、APIが充実していることも必須といえるでしょう。

コンテンツを生成する他のシステム、例えばMicrosoft365やSlack、Salesforce、Google、サイボウズ等々の外資、内資問わずあらゆるアプリケーションとシームレスに統合できることが重要です。企業が活用するあらゆる非構造化データの蓄積と活用を可能にする機能がコンテンツレイクの要件であると言えます。

[SMART_CONTENT]

まとめ

コンテンツレイクは、単一のコンテンツプラットフォームで非構造化データ(コンテンツ)を処理できます。そのため、コンテンツの活用が促進され、従来構造化データ中心だったデータドリブンでの意思決定を行う際もスピード感と正確性が向上します。

デジタル化が進む中で、非構造化データの量はもちろんのこと、その重要性も増していくと予測されています。社内に眠ったままの非構造化データがあれば、その活用方法の1つとしてデータドリブンによる意思決定強化を検討いただき、コンテンツレイク整備に着手してはいかがでしょうか。コンテンツレイクを構築しておくことで、ビジネスの大きな変化にも人とシステムが連携できるようになるため即座に適応が可能となり、事業を発展させていけるでしょう。

データドリブン経営を進化させる次のステップ

RECENT POST「DX」の最新記事


DX

業務改善や変革の方法は? DXとあわせた効果的な進め方やフレームワークを紹介

DX

ワークフローシステムとは?今重要視されるその導入メリットとポイントを解説

DX

DX時代の行政事務の効率化のカギは、文書(コンテンツ)のデジタル化とその管理!?

DX

業務改善の第一歩となるプロセスマイニングとは?ポイントを解説

最近よく聞くコンテンツレイクって?その重要性と効果、要件を解説
仕事の効率化にBoxが効きます!

RECENT POST 最新記事

ブログ無料購読

RANKING人気記事ランキング