アナリティクス・エクスペリエンスとは? Google Cloud (GCP)を活用したデータの価値化を徹底解説!
- Analytics HUB
- BigQuery
- Cloud
- Dataplex
本記事は、2021年9月8日に開催された Google の公式イベント「データクラウドサミット」において、 Google Cloud Japan のデータアナリティクススペシャリストである高村哲貴氏が講演された「データを価値に変えるアナリティクスエクスペリエンスとは?」のレポート記事となります。
昨今、企業におけるデータ活用の重要性は年々高まっています。今回は、データを価値に変えるためのアナリティクス・エクスペリエンスについて、概要や具体的なプロダクト、実際のエクスペリエンスまで一挙にご紹介します。アナリティクス・エクスペリエンスとは一体どのようなものなのでしょうか?ぜひ最後までご覧ください。
なお、本記事内で使用している画像に関しては、データクラウドサミット「データを価値に変えるアナリティクスエクスペリエンスとは?」を出典元として参照しております。
それでは、早速内容を見ていきましょう。
目次
データを価値に変えることの重要性と現状
DX の加速
近年、新型コロナウイルスの感染拡大の影響により、世界中が混乱の渦に巻き込まれました。その一方で、 DX 推進の流れは加速しており、あらゆる産業において多くの企業が自社のデジタル変革に取り組んでいます。
DX の具体的な例としては「スマートシティ構想」が挙げられます。国土交通省によると、スマートシティとは「都市の抱える諸課題に対して、ICT等の新技術を活用しつつ、マネジメント(計画、整備、管理・運営等)が行われ、全体最適化が図られる持続可能な都市または地区」と定義されています。
スマートシティ構想は、様々なデータを組み合わせて活用することで、住民が抱えている社会的課題を解決することを目指しています。2030年頃に実現される未来社会を先行実現することを目的として、いま大きな注目を集めている取り組みです。
DX のもう一つの具体例として「リアルとデジタルの融合」をご紹介します。最近では様々なデータを複合的に活用することで、顧客体験をデータドリブンで進化させることが可能になりました。利用されるデータは多岐にわたり、 Web 上の行動データやリアルの購買データ、位置情報データなどが挙げられます。
これらを組み合わせて分析すると、顧客の属性や行動を深い部分まで把握することができ、最適な顧客理解に繋がります。そして、その結果をもとにアクションを実行することで、顧客に対して最適なタイミングで最適なコンテンツを提供できるようになったり、マーケティング施策の効果最大化を実現することが可能になります。
データ活用の現状
ここまで、データを活用した DX の話題について触れましたが、データ活用の現状は一体どうなっているのでしょうか?
2019年の HBR の調査によると「分析に利用されていない企業内データの割合」は全体の 66% との結果が出ています。さらに、「データから具体的で測定可能な価値を見出すことができている」と答えた企業の割合は僅か 32% でした。
次に、日本国内に目を向けてみましょう。2021年に Gartner が発表している、日本におけるデータ利活用の実情調査を見ると、日本企業のデータ利活用は直近3年間で大きく変化していないことがわかります。
このように、データ活用の重要性が強く叫ばれており、企業がその必要性を感じているにも関わらず、実際のデータ活用はなかなか進んでいないのが現状です。
アナリティクス・エクスペリエンスとは?
効果的なデータ活用を実現するためには、データが価値に変わるまでのプロセスや連鎖を考えることが重要になります。
以下は新しい顧客体験を作る場合の連鎖を示した図です。新たな顧客体験を生むためには、プロダクトやサービスを再設計することが重要です。そして、それらを設計するためには、設計の基となる膨大なデータが必要になります。
上図のように、データと設計をシームレスに繋ぐ役割を果たしているのがアナリティクス・エクスペリエンスです。アナリティクス・エクスペリエンスにより、企業内外のあらゆるデータを誰もが簡単かつスピーディーに繋ぎ合わせて Insight を創り出すことができるようになります。
つまり、データという資源が膨大に増加し続ける中で、優れたアナリティクス・エクスペリエンスがデータを価値に変える原動力になる、というわけです。企業が効率的なデータ活用を推進するためには、アナリティクス・エクスペリエンスが重要な鍵を握っていると言えるでしょう。
アナリティクス・エクスペリエンスを因数分解すると、以下の3つの要素に分けることができます。
- シンプルで統合化された分析体験
- Trusted なデータの流通・相互活用
- リアルタイムインテリジェンス
各要素の詳細は上図の通りですが、本記事ではこの3つの要素のうち「シンプルで統合化された分析体験」と「 Trusted なデータの流通・相互活用」を実現するための Google Cloud (GCP)のプロダクトをご紹介します。
Dataplex とは?
Dataplex は、分散化したデータの一元化によりデータ管理を自動化し、大規模な分析を強化するためのインテリジェントなデータファブリックです。データファブリックとは、データ管理の手法や実用性を標準化するためのアーキテクチャです。
Dataplex の活用により、ベストな Google ネイティブ、オープンソースツールで、様々な種類のデータをあらゆる規模で迅速にキュレート、保護、統合、分析することが可能になります。また、標準で高機能な AI が搭載されているため、効率的なデータ管理を実現できます。
ここからは、 Dataplex の特徴を具体的に見ていきましょう。
論理的なデータ構成
Dataplex の特徴として、論理的なデータ構成が挙げられます。ビジネスのユースケースと LOB のニーズに基づき、データを Lake と Zone 内に結びつけます。 LOB は「 Line of Business 」の略であり、企業の業務に直結する部門ラインを意味する言葉ですが、最近では業務に必要な基幹アプリケーションを指す言葉として使われるケースもあります。
なお、 Dataplex の論理構造は、データのアクセス性やセキュリティのコントロール、財務ガバナンスなどの基盤として利用されています。
セキュリティとガバナンスの集中化
Dataplex は、データサイロ全体のセキュリティポリシーを定義することで、データアクセスを一元的に定義、管理、監査することができます。また、機密データの自動検出やデータ保持の一元管理など、統一されたガバナンスポリシーを実現できます。
エンドツーエンドのライフサイクル管理
Dataplex には様々なテンプレートが用意されており、データの移動、階層化、改善をワンクリックで実現可能です。また、 Dataflow や Data Fusion との統合も容易にできます。さらに、統一された監視や柔軟な拡張性により、エンドツーエンドのライフサイクル管理が可能になります。
データインテリジェンス
Dataplex を活用することで、自動データ検出と分類が可能になります。例えば、動的なスキーマ検出と型のマッピングや非構造化データのメタデータ収集などが挙げられます。また、一貫性のあるメタデータでオープンソースと Google Cloud (GCP)ネイティブツールとの相互運用性を確立でき、ビルトインでのデータ品質も大きな特徴となっています。
統合された分析体験
Dataplex の活用により、統合された分析体験を享受できます。例えば、データ管理者向けには、フルマネージドな分析環境やコンサンプションの柔軟性を提供します。また、データサイエンティストやデータアナリスト向けには、ワンクリックでノートブックや SQL workspace にアクセスできるなど、多くの側面から利便性の向上を実現します。
Analytics HUB とは?
2021年に Gartner が実施した調査によれば、「ビジネス成果獲得に貢献した要因や取り組み」として、最も多くの票を集めたのが「活用できるデータの種類・量・品質」であり、全体の 59% を占める結果となっています。
ただし、ビジネスに貢献するデータを用意するのは簡単ではなく、様々な阻害要因が存在します。例えば、高価で壊れやすいパイプラインや不要なデータ複製のコスト、データの可視化と制御のロスなどが挙げられます。その結果、多くの企業は変革をもたらすほどの有効なデータ文化を構築することは難しいと感じてしまうのです。
そして、このような課題を解決するのが Analytics HUB です。 Analytics HUB を活用することで、価値の高いデータと分析の資産を安全かつ効率的に交換できます。 Google を含む「価値の高いアセット」のキュレートされたライブラリへのアクセスや、組織の境界を越えた「安全でプライバシーが保護されたデータ共有と収益化」を実現可能になります。
ここからは、 Analytics HUB のポイントについて具体的に解説します。
データ共有の拡大
データパブリッシャーを使うことで、自身のデータセットの中から共有したいものをシェアードデータセットという形で公開します。そして、それに対してデータサブスクライバーがプロジェクトや VPC perimter 内で自身のデータセットと組み合わせ可能なリンクデータセットを取得し、データを活用することができるようになります。
BigQuery のシェアードデータセットでも同じようなことができますが、 Analytics HUB を活用することでよりスケーラブルに実現することが可能となっています。
Exchange (セルフサービスのデータ共有)
Exchange は、共有やサブスクライバーによる検出とセルフサービスが可能なデータセット Listing のコレクションです。 Exchange の可視性はプライベートやパブリック、内部、制限付きにすることが可能であり、管理者がパーミッションを決定します。
データパブリッシャーとデータサブスクライバーの間に Exchange のレイヤーを作ることで、データパブリッシャー目線では「1対1」または「1対 N」 でデータを共有できるようになります。また、データサブスクライバー目線では、データパブリッシャーから許可されたデータセットだけではなく、公開されているデータセットについても Exchange から取り出して活用できるようになります。
全体アーキテクチャ
ここまでご説明した要素をすべて繋ぎ合わせた Analytics HUB の全体アーキテクチャが下図になります。データパブリッシャーとデータサブスクライバーを Analytics HUB が中で繋げるような構造になっています。
データエコシステムの構築
Google は Analytics HUB を活用したデータエコシステムの構築が今後加速していくと考えています。なぜなら、 Analytics HUB はパブリックデータや Google から要求されるデータ、インダストリーのデータなどの様々な種類のデータをセキュアに、かつ、必要な人に必要な共有することができるため、あらゆるシーンにおけるデータ活用に寄与するプロダクトであるためです。
また、 Google Exchanges の中には Trends というデータが存在します。既に Google Trends という機能が一般公開されており、これを活用することでマーケティングや需要予測など、あらゆるシーンにおいてデータの利活用を促進できます。
Analytics HUB のエクスペリエンス
最後に Analytics HUB のエクスペリエンスとして、実際にどのようなユーザーインターフェースでデータ活用を進められるのか、をご紹介します。
今回のケースでは「データパブリッシャー」「データサブスクライバー」「エクスチェンジアドミニストレーター」の3種類のプレイヤーが登場します。データパブリッシャーとエクスチェンジアドミニストレーターの2人は、場合によっては1人の人格で担われることもありますが、今回は第三者のエクスチェンジアドミニストレーターが存在すると仮定してユーザーインターフェースのイメージをご紹介します。
はじめに、エクスチェンジアドミニストレーターが Analytics HUB という画面上から「 CREATE EXCHANGE 」という機能を使ってエクスチェンジを構成します。
このエクスチェンジは、下図右側にコンフィグレーションが表示されている通り、エクスチェンジごとに細かくアカウント設定できる点が大きな特徴になっています。
次にデータパブリッシャーの視点では、自分のデータセットをエクスチェンジに共有することになります。以下は BigQuery の SQL Workspace の画面になりますが、画面右上の「 PUBLISH DATASET 」のボタンを押すことで、「 shared-product-sales 」というデータセットをこの画面から共有する、という操作を行っています。
次に以下のような画面からリストを作成し、これをエクスチェンジに登録します。
登録をすると「 Product Sales 」という名前で、先ほどのエクスチェンジの中にシェアードのデータセットが登録された状態になります。
さらにデータサブスクライバーの視点を見ていきましょう。以下の画面では、「 subscriber project 」の中に自社のデータセットが1つ存在している状態になっています。これに対して、 ADD DATA という形で Analytics HUB を選択することでデータセットを増やすことができます。
ADD DATA を実行すると、以下のように2種類のデータを探索できるようになります。1つ目は下図の右3つのようなパブリックなデータセットであり、2つ目は下図の左2つのような自分に対してアクセス権を許可されているデータセットです。1番左のデータは、先ほどデータパブリッシャーが共有した Sales Data になっています。
そして、データサブスクライバーが以下の画面で「 ADD DATASET TO MY PROJECT 」を押します。
すると、 linked dataset が生成されます。
以下の画面のように、あたかも自分のデータセットが増えたかのように product sales という新しいデータセットと、自分が初めから持っている dataset 1を組み合わせてクエリを実行したり、ここから新しいインサイトを作ることが可能になります。
このように、 Analytics HUB を活用することで、非常に簡単かつセキュアにデータの共有や交換を実現することができます。例えば、バリューチェーンにおけるサプライヤ、メーカー、小売といった様々な企業間で一つのバリューチェーンを形成している場合に、企業間のデータ共有やデータ交換を効率化できる点が Analytics HUB の大きな価値だと言えるでしょう。
まとめ
今回は、データを価値に変えるためのアナリティクス・エクスペリエンスについて、概要や具体的なプロダクト、実際のエクスペリエンスまで一挙にご紹介しました。主に Dataplex と Analytics HUB の2つのプロダクトに焦点を当てて解説しましたが、内容をご理解いただけましたでしょうか?
昨今、データを価値に変える重要性は高まり続けている一方で、データの多様化とともにサイロ化が進み、データ活用は複雑になり続けています。このような課題に対して、 Google Cloud (GCP)は Dataplex と Analytics HUB により、インテリジェントなアナリティクス・エクスペリエンスと企業を超えたデータ交換・データ活用を実現し、お客様の Data to Value を共創します。
ぜひ Google Cloud (GCP)を導入して、アナリティクス・エクスペリエンスを実現しませんか?
弊社トップゲートでは、Google Cloud (GCP) 利用料3%OFFや支払代行手数料無料、請求書払い可能などGoogle Cloud (GCP)をお得に便利に利用できます。さらに専門的な知見を活かし、
- Google Cloud (GCP)支払い代行
- システム構築からアプリケーション開発
- Google Cloud (GCP)運用サポート
- Google Cloud (GCP)に関する技術サポート、コンサルティング
など幅広くあなたのビジネスを加速させるためにサポートをワンストップで対応することが可能です。
Google Workspace(旧G Suite)に関しても、実績に裏付けられた技術力やさまざまな導入支援実績があります。あなたの状況に最適な利用方法の提案から運用のサポートまでのあなたに寄り添ったサポートを実現します!
Google Cloud (GCP)、またはGoogle Workspace(旧G Suite)の導入をご検討をされている方はお気軽にお問い合わせください。
メール登録者数3万件!TOPGATE MAGAZINE大好評配信中!
Google Cloud(GCP)、Google Workspace(旧G Suite) 、TOPGATEの最新情報が満載!