2021最新情報! Google の最先端技術を活用した Cloud AI の新機能に迫る!
- AI
- AutoML
- TensorFlow
- Vertex
本記事は、2021年5月26日に開催された Google の公式イベント「 Google Cloud Day : Digital ’21 」において、 Google Cloud AI / ML スペシャリスト Dr . Eng . の児玉敏男氏が講演された「 Cloud AI 最新情報アップデート」のレポート記事となります。
今回は Google Cloud (GCP)における機械学習のプラットフォームである Vertex AI について詳しく解説しつつ、 Google の機械学習 OSS である TensorFlow の最新情報もあわせて解説してします。
なお、本記事内で使用している画像に関しては Google Cloud Day : Digital ’21 「 Cloud AI 最新情報アップデート」を出典元として参照しております。
それでは、早速内容を見ていきましょう。
目次
Cloud AI とは?
Cloud AI とは Google Cloud (GCP)に搭載されている機械学習のプロダクトおよびサービス群です。 AI 構築から、会話型 AI 、そしてドキュメント向け AI まで、幅広いラインナップが揃っています。
以下、具体的なプロダクト例を表にまとめます。
ユースケース | プロダクト名 | 概要 |
---|---|---|
AI を組み込んで構築 | Vertex AI | Google 統合機械学習プラットフォームです。効果的な AI モデルの構築、デプロイ、スケーリングに役立ちます。 |
AI を組み込んで構築 | TensorFlow | Google が開発した機械学習に用いるためのソフトウェアライブラリであり、オープンソースで公開しています。 |
AI を組み込んで構築 | AI ビルディングブロック | 視覚認識能力、言語能力、会話能力、構造化データをアプリケーションに簡単に組み込めます。 |
AI を組み込んで構築 | AutoML | AutoML を活用した Vertex AI の機能をビジョン、翻訳、構造化データに使用することで、最小限の労力と機械学習の専門知識で、高品質のカスタム機械学習モデルをトレーニングできます。 |
AI を組み込んで構築 | AI インフラストラクチャ | 費用対効果の高い方法でディープ ラーニング モデルと機械学習モデルをトレーニングできます。 |
会話型 AI | Speech-to-Text | Google の AI テクノロジーを搭載した API で音声を正確にテキストに変換できます。 |
会話型 AI | Text-to-Speech | Google の AI テクノロジーを搭載した API でテキストを自然な音声に変換できます。 |
会話型 AI | Agent Assist | 人間のエージェントが通話している間も、顧客の意図を識別してリアルタイムで詳細な手順を提供し、継続的にサポートします。 |
会話型 AI | Dialogflow CX | デバイスやプラットフォームをまたがる会話環境を作成します。 |
ドキュメント向け AI | 自然言語 | Google の機械学習を使用して非構造化テキストから分析情報を引き出します。 |
ドキュメント向け AI | 翻訳 | Google の機械学習を使用して、言語間の翻訳を動的に行います。 |
ドキュメント向け AI | Vision OCR | 世界クラスの精度でドキュメントからテキストを抽出します。200 を超える言語に対応し、50 言語では手書き入力も認識します。 |
業界向け AI | Media Translation | リアルタイムストリーミングや録音された音声を別の言語のテキストに変換します。 |
業界向け AI | Procurement DocAI | 請求書や領収書などの非構造化ドキュメントを構造化データに変換することで、調達データのキャプチャを大規模に自動化します。 |
上表の通り、 Cloud AI には多くのプロダクトが内包されており、様々な AI を柔軟に活用することができます。
昨今、 AI は様々なビジネスシーンで幅広く活用されています。例えば、コールセンターでの問い合わせ対応に AI チャットボットを組み込むことで自動応答を実現でき、高精度な回答を迅速に返せるようになります。さらに問い合わせを行なった顧客の属性をデータ化・分析することで、運用改善や見込み顧客の抽出を行うことも可能です。
ほかにも、人事 AI として採用時のエントリーシートに AI を使用すれば採用担当者の負荷を軽減でき、本来注力すべき生産性の高い業務に集中することができます。
さらに製造業では、ファクトリーオートメーション( FA )が進んでおり、生産現場の機器に AI を導入することでシステムの調整作業を自動化しています。また、熟練工の技術を AI に学習させて経験の浅い技術者にカスケードすることで、熟練工と同等のパフォーマンスを発揮できるようになります。
このように、 AI は業界を問わず多くのビジネスシーンで利用されています。次章では、 AI をビジネスに組み込むための方法をご紹介します。
AI をビジネスに組み込む方法
AI をビジネスに組み込むためには「スピード」「コスト」「柔軟性」の3つの要素を考慮しつつ、以下の3つの方法から選択することになります。
既存の AI をそのまま使用
まずはスピードとコストを重視して既存の AI をそのまま使用することで、最小限の時間とコストで業務ワークフローに AI の価値を組み込む方法です。 Cloud AI においては、機械学習 API の利用がこれに相当します。
既存の AI をカスタマイズ
次にスピード、コスト、柔軟性の3つのバランスを重視して既存の AI をカスタマイズして使う方法です。 Cloud AI においては、 AutoML がこれに相当します。
AI をゼロから構築
最後はビジネスの差別化を実現して本質的なインパクトを生むために AI をゼロから構築する方法です。 Cloud AI においては、 AI Platform がこれに相当します。
今回ご紹介する Vertex AI は、従来の AutoML と AI Platform を統一された API とユーザーインターフェースによって統合したマネージドな機械学習のプラットフォームとなっています。
AutoML に関しては、以下の記事で詳しくご紹介しています。
簡単にオリジナルAIを始められる!Google Cloudの機械学習/AIサービス「Cloud AutoML」を一挙紹介
AI Platform に関しては、以下の記事で詳しくご紹介しています。
機械学習に便利な Google Cloud (GCP) の「 AI Platform 」とは?概要、機能、料金体系、できることまで徹底解説!
Vertex AI とは?
概要
Vertex AI は、マネージドな機械学習のプラットフォームです。機械学習 API の利用はもちろん、 AutoML トレーニングとカスタムトレーニングの両方でモデルの保存、モデルのデプロイ、予測のリクエストなどを行うことができます。
Vertex AI はアプリケーションバックエンドの一部であり、クラウド、オンデバイス、オンプレミスなどの様々な環境のエンドユーザーに対して、強力な機械学習モデルを構築するためのツールを多く提供しています。
Vertex AI を利用することで、 Vertex コンソールを使った UI ベースのモデル開発や Vertex SDK を使ったコードベースのモデル開発を行うことが可能になります。
以下に Vertex AI を構成する機能を図で示します。データ収集から、特徴エンジニアリング、モデル構築、モデルのデプロイ、モニタリングまで、機械学習ワークフローの各段階で利用されるソリューションを一気通貫で提供しています。
Vertex AI で機械学習タスクを実行するとき、最初の確認事項はユーザー独自の訓練データがあるかどうかです。
訓練データがある場合は、モデルを作成するためにコードを使うか否かで利用するソリューションが変わります。訓練データがない場合は、事前学習済みの機械学習 API を活用します。
機械学習フロー
機械学習タスクの初めのステップはデータ収集ですが、 Vertex AI ではマネージドなデータセットを提供しており、イメージのトラッキング、アノテーション用のユーザーインターフェース、統合されたデータラベリング環境などを利用可能となっています。
そして、データ準備が整った後は、独自のカスタムモデルコードでモデルをトレーニングするか、または AutoML で最適なモデルアーキテクチャを選択します。 AutoML を利用する場合はモデル作成のためにコードを使う必要はありません。
さらに Vertex AI は、トレーニングされたモデルをデプロイするための多くのオプションをサポートしています。オフライン、エンドポイント、バッチ予測など、様々なシーンに応じて柔軟なデプロイが可能になります。
ここからは Vertex AI のデータセット、トレーニング、デプロイについて、さらに深掘りしてご説明します。
データセット
Vertex AI ではマネージドなデータセットを提供しており、イメージのトラッキング、アノテーション用のユーザーインターフェース、統合されたデータラベリング環境などを利用可能となっています。
AutoML 利用時は UI または SDK を介してプログラミングでトレーニングジョブを開始できます。また、カスタムモデルコード利用時はトレーニングのためのメタデータがカスタムトレーニングコードに渡された後、トレーニング用にビルド済みのコンテナから選択するか、もしくは独自のカスタム Docker コンテナにトレーニングコードを提供します。
トレーニング
Vertex AI のトレーニングは大きく「 AutoML トレーニング」と「カスタムトレーニング」の2つに分けられます。
AutoML トレーニング
AutoML トレーニングを利用すれば、コードを記述することなく最新のモデルを短時間でトレーニングできます。また、 Explainable AI を利用して、詳細なモデル評価指標を取得可能です。
カスタムトレーニング
カスタムトレーニングを利用すれば、カスタムコンテナを介して選択したフレームワークで構築されたモデルをトレーニングできます。また、分散トレーニングジョブを実行して GPU でトレーニングを加速することができ、 Vizier の最適化アルゴリズムによるハイパーパラメータ調整も可能になります。
デプロイ
Vertex AI においては、 AutoML またはカスタムモデルコードによってモデルを作成しますが、どちらで作成された場合でもデプロイされたモデルは Vertex コンソール上の同じ場所に表示され、同じ API を介してアクセスできます。
Vertex AI で実現する MLOps
MLOps とは、機械学習モデルの一連のサイクルを円滑化するための管理体制(機械学習基盤)を構築することです。高品質な機械学習モデルを構築するためには、 MLOps が重要な考え方の一つになります。
この MLOps を実現する上では Vertex AI が有効なソリューションとなります。本章では MLOps に寄与する Vertex AI の機能を4つご紹介します。(下図で青く塗られている4つのサービスが該当)
Vertex Pipelines
Vertex Pipelines は機械学習における継続的なトレーニング、デプロイ、モデリング、ガバナンスなどの機能を一元的に提供しています。
Vertex Pipelines の特徴の一つとして、 TensorFlow 、 PyTorch 、 scikit-learn などの様々な機械学習のフレームワークをサポートしている点が挙げられます。
また、 Vertex Pipelines は柔軟性に優れているほか、サーバーレスで提供されているため、運用負荷を削減できる点も大きなメリットの一つです。コストパフォーマンスが高く、あらゆるシーンで活躍する機能だと言えるでしょう。
さらに Vertex Pipelines にはメタデータレイヤーも備わるため、パイプライン全体で生成されたアーティファクトをトラッキングするプロセスを簡素化できます。
Vertex ML Metadata
Vertex ML Metadata は「メタデータストア」と呼ばれるデータベースに機械学習のワークフローにおけるすべてのメタデータを登録し、一元的に管理できる機能です。一般的には Vertex Pipelines と同時に利用されるケースが多くなっています。
Vertex ML Metadata を使うことで、パイプライン内に存在するすべてのコンポーネントとそのリネージへの入出力を自動的にトラッキングすることが可能になります。また、プロジェクト単位でアーティファクトをグループ化し、組織全体のデータセットとモデルの使用状況を可視化できます。
Vertex ML Metadata では、本番の機械学習パイプラインを実行する度、様々なパイプラインコンポーネントの実行および結果のアーティファクトに関する情報を含むメタデータを登録・管理できます。その際、予期しないパイプラインの動作やエラーが発生した場合は、このメタデータを利用してパイプラインコンポーネントを分析し問題をデバックすることができます。
Vertex Feature Store
Vertex Feature Store は特徴量データの一元化されたリポジトリ機能を提供します。これにより、異なるユースケース間で機械学習の特徴量の共有や再利用が可能になります。また、低レイテンシで大規模な機械学習の特徴量を提供できるほか、トレーニングとサービングのスキューを軽減できます。
特徴量の検出および検索ができる点に加えて、トレーニングやサービスを管理するための簡単な API を備えている点も Vertex Feature Store の特徴の一つとなっています。
そのため、 Vertex Feature Store を使えば、特徴量エンジニアリングの作業をチーム間でリアルタイムに共有でき、特徴量データ処理にかかる多くの時間と労力の削減に繋がります。例えば、機械学習のエンジニアが別のチームによって完了されたエンジニアリング作業を繰り返したり、特徴量計算の不整合により引き起こされる問題のトラブルシューティングにかかる負担を軽減できます。
つまり、 Vertex Feature Store によって、機械学習タスクにおける様々な作業を合理化および最適化でき、自社の生産性向上に大きく寄与します。
Vertex Model Monitoring
機械学習タスクは従来のプログラミングとは異なり、モデル予測コードが機能していてもモデルが正しく機能しないケースがあります。その場合、モデルを継続的にモニタリングして、モデルのドリフトを検出する仕組みが必要になります。
Vertex Model Monitoring に搭載されているモデルモニタリングとパイプラインアラートの機能を使えば、モデルのパフォーマンスが変更されたときに自動的に警告を出してくれるため、モデルモニタリングを効率的に実行できます。
まとめ
ここまでご説明した通り、 Vertex AI はデータ収集からモデルのトレーニングやデプロイ、モニタリングまで、機械学習のワークフローを一気通貫でサポートします。
Vertex AI の活用により、機械学習におけるすべてのステップを効率化できるため、自社の生産性向上を実現でき、スムーズに機械学習を進めることが可能になります。
TensorFlow の2021最新情報
TensorFlow とは?
TensorFlow は、 Google が提供している機械学習の OSS であり、端的に TensorFlow の内容を説明すると「機械学習のソフトウェアライブラリ」です。ライブラリとは、プログラムを設計するときに必要な機能をまとめたファイルのことです。
Google は2011年に「 DistBelief 」というディープランニングの基盤を開発しました。 DistBelief は音声認識などのサービス性能向上を目的としたものでしたが、汎用性が低い点がネックとなり、サービス公開には至りませんでした。
この DistBelief の課題を見事に解決したライブラリが TensorFlow であり、同 OSS を活用することで DistBelief の汎用性は大きく改善されました。このような経緯もあり、 TensorFlow の性能は多くの人に認められることとなり、今では全世界に公開されている OSS となっています。
TensorFlow に関しては、以下の記事で詳しくご紹介しています。
機械学習サービス「 TensorFlow 」とは?メリット、デメリット、活用事例まで徹底紹介!
TensorFlow の進化
TensorFlow は、これまで何度も進化を続けてきました。TensorFlow 2.0がリリースされて以降、様々なアップデートが繰り返し実装されています。
以下、主なアップデート内容を表にまとめます。
バージョン | アップデート内容 |
---|---|
TensorFlow 2.0 | 新しい API としてリリース |
TensorFlow 2.1 | TPU のサポート |
TensorFlow 2.2 | プロファイリングツールのパフォーマンス改善 |
TensorFlow 2.3 | データ管理に関する改善 |
TensorFlow 2.4 | 分散トレーニング GPU のアップデート |
TensorFlow 2.5 | 品質とスケーラビリティの改善 |
このように、 TensorFlow では様々なアップデートが実施されています。新機能が追加されるだけでなく、安定性やパフォーマンスにも重点が置かれ、開発が続けられてきました。
現在、 TensorFlow において最も注目すべき点は Google の最先端の AI を利用できる API として実装されたことです。これにより、専門知識を持たない人でも容易に Google のテクノロジーを活用し、自社の生産性向上を実現することが可能になりました。この点が TensorFlow の最大のメリットであると言えます。
TensorFlow の新機能
以下、開発者が機械学習モデルを作成するときの全体フローを図で示します。
上記の中から、今回は TensorFlow Hub と KYD ( Know Your Data )の新しい機能をご紹介します。
TensorFlow Hub
TensorFlow Hub は機械学習におけるトレーニング済みモデルのアセットのリポジトリであり、事前にトレーニングされたセーブドモデルを提供しています。モデルの微調整が可能なほか、どこにでもデプロイできます。
また、 TensorFlow Hub は数行のコードを書くだけでトレーニング済みモデルを再利用できるため、自社の業務効率化に直結します。さらに、再利用して構築できる1万以上の事前トレーニング済みモデルのレポジトリを無償で提供している点も大きな特徴です。
今回、モデルを検出するだけでなく、自分で何も作成せずにブラウザ上でモデルを簡単にテストできる機能が TensorFlow Hub に追加されました。
例えば、下図は鳥を認識するモデルです。
今回の新機能により、ブラウザ上に画像を直接ドラッグ&ドロップできるようになりました。
そして、画面上でスコアとともに結果を返してくれます。下図の通り、鷲であることを示しています。
この機能追加によって工数削減を実現できるとともに、より直感的に作業を進められるようになりました。
KYD ( Know Your Data )
データを理解することはモデル構築における大切なステップです。また、データの理解はバイアスの潜在的な原因を特定する上でも重要な意味を持っています。
そこで今回、 web ベースで提供されるデータセットの探索ツール「 KYD ( Know Your Data )」が新しくリリースされました。 KYD は画像やテキストなどの豊富なデータセットを理解し、それらをシームレスに探索して潜在的なバイアスや不均衡を見つけるのに役立ちます。
一般的なモデルのトレーニングでは、データの読み込み、特徴量やラベルの定義などの作業を繰り返し実行する必要がありますが、 KYD を活用することでこれらの工数を大幅に軽減できます。
Vertex AI に関する質問
Q . Vertex AI でデバッグする方法が記載されているドキュメントはありますか?
A.こちらにトラブルシューティングが記載されています。
Q . Vertex AI に統合されたことで以前の AutoML や AI Platform が今後廃止されることはありますか?
A .これまでの AutoML 、 AI Platform も引き続きご利用頂けますが、今後のソリューションやサービスのプランにつきましては、利用規約に則り、公式サイトにてアップデートされますので、そちらをご確認ください。
Q . Vertex AI は TPUv4 を使えますか?
A.2021年後半に Google Cloud (GCP)ユーザーは利用可能になる予定です。
Q . Vertex AI は Colab と統合できますか?
A . Colab に記述したコードで Vertex AI トレーニングサービスを使用して ML モデルをトレーニングすることが可能です。
Q . Vertex Pipelines は本日時点で使える状態ですか?
A.はい。 Vertex Pipelines は、現在パブリックプレビューとしてご利用可能です。
Q . Vertex AI に AI モデルの説明機能はサポートされていますか?
A .はい。 Vertex AI には Explainable AI として以下3つの方式がサポートされています。
- 1.サンプリングされた Shapley
- 2.統合勾配
- 3.XRAI
まとめ
本記事では、 Cloud AI の数あるサービスの中から「 Vertex AI 」と「 TensorFlow 」の2つのサービスに焦点を当てて、最新情報を交えながら重要なポイントを解説しました。
Vertex AI はデータ収集からモデルのトレーニングやデプロイ、モニタリングまで、機械学習のワークフローを一気通貫でサポートします。これにより、機械学習におけるすべてのステップを効率化でき、スムーズに機械学習を進めることができます。
また、 TensorFlow は Google の最先端の AI を利用できる API として実装されており、専門知識を持たない人でも容易に Google のテクノロジーを活用することができ、自社の生産性向上に大きく寄与します。
今回ご紹介した Cloud AI は Google Cloud (GCP)に内包されているサービスであるため、利用するためには Google Cloud (GCP)の契約が必要になりますが、お得に使いたいのであればトップゲート経由での契約がオススメです。
トップゲート経由で契約することで
- Google Cloud (GCP)の利用料金が3% OFF
- クレジットカード不要で請求書払いが可能
- 導入後サポートが充実
など、様々なメリットを享受することができます。
本記事を参考にして、ぜひ Google Cloud (GCP)の導入を検討してみてはいかがでしょうか。
弊社トップゲートでは、専門的な知見を活かし、
- Google Cloud (GCP)支払い代行
- システム構築からアプリケーション開発
- Google Cloud (GCP)運用サポート
- Google Cloud (GCP)に関する技術サポート、コンサルティング
など幅広くあなたのビジネスを加速させるためにサポートをワンストップで対応することが可能です。
Google Workspace(旧G Suite)に関しても、実績に裏付けられた技術力やさまざまな導入支援実績があります。あなたの状況に最適な利用方法の提案から運用のサポートまでのあなたに寄り添ったサポートを実現します!
Google Cloud (GCP)、またはGoogle Workspace(旧G Suite)の導入をご検討をされている方はお気軽にお問い合わせください。
メール登録者数3万件!TOPGATE MAGAZINE大好評配信中!
Google Cloud(GCP)、Google Workspace(旧G Suite) 、TOPGATEの最新情報が満載!