Google Cloud Vision API とは?機能やできること、料金体系まで徹底解説!
- API
- Cloud
- 料金体系
Google Cloud Vision API をご存知でしょうか? Google が提供する画像認識サービスであり、機械学習モデルによって画像を解析し、多くの情報を取得することが可能です。
本記事では、 Google Cloud Vision API とは何か?という基礎的な内容から、 Google Cloud Vision API の機能やできること、料金体系など、あらゆる観点から一挙にご紹介します。
目次
Google Cloud Vision API とは?
Google Cloud Vision API とは、 Google が提供する画像認識サービスです。 Google Cloud Vision API は Google 独自の機械学習モデルを採用しており、これによって効率的に画像を分析し、様々なことを実現できます。
例えば、
- オブジェクトや顔の検出
- 手書き文字の読み取り
- 有用な画像メタデータの構築
などが挙げられます。
Google Cloud Vision API は強力な事前トレーニング済み機械学習モデルを提供しており、画像にラベルを割り当てることで、事前定義済みの数百万のカテゴリに画像を高速分類します。これにより、前述したようなオブジェクト・顔の検出や印刷テキスト・手書き文字の読み取り、有用なメタデータの構築などが可能になります。
機械学習に関心のある方は以下の記事がオススメです。
Google Cloud Vision API の機能
Google Cloud Vision API には、どのような機能が搭載されているのでしょうか?代表的なものをいくつかご紹介します。
物体検出
Google Cloud Vision API を活用することで、特定の画像に含まれている様々な物体を検出できます。例えば、「動物」や「食べ物」など、検出対象をカテゴリ分けして、適切なラベルを返してくれます。
顔検出
Google Cloud Vision API を使えば、画像データから人間の顔を検出することが可能です。目や鼻などのパーツの位置情報を取得できるのはもちろん、その人の表情を分析することで、喜怒哀楽などの感情データを取得することもできます。
テキスト抽出
Google Cloud Vision API は OCR ( Optical Character Recognition :光学文字認識)機能を搭載しています。これにより、画像に含まれているテキストデータを自動的に検出することが可能になります。
ロゴ検出
Google Cloud Vision API は、顔やテキストだけではなく、画像に含まれているロゴを検出することも可能です。この機能を活用すれば、画像データ内の製品ロゴや企業ロゴを簡単に検出でき、権利関係におけるブランドチェックなどに応用できます。
ランドマーク検出
Google Cloud Vision API には、ランドマーク検出の機能も搭載されています。例えば、富士山や東京タワーなどのランドマークが画像に含まれている場合、それらをランドマークとして自動的に検出し、その物体の地理的な位置情報を返すことが可能です。
Google Cloud Vision API でできること
Google Cloud Vision API を活用することで、具体的にどのようなことを実現できるのでしょうか。以下、具体的な活用法を2つご紹介します。
不適切な画像に対してぼかしを入れる
Google Cloud Vision API と ImageMagick を使用することで、 Cloud Storage バケットにアップロードされた不適切な画像を検出してぼかすことができます。これにより、暴力的な表現を含むような不適切な画像に対して、閲覧制限をかけることが可能になります。
なお、このユースケースにおいては、画像検出のプロセスに Google Cloud Vision API が活用されています。 Google Cloud Vision API で対象の画像を検出した後、 ImageMagick でぼかしを入れます。
画像内のテキストを翻訳して読み上げる
Google Cloud Vision API と他の Google サービスを組み合わせることで、画像ファイル内に含まれているテキストを翻訳し、読み上げることができます。使うサービスは「 Cloud Translation 」と「 Text-to-Speech 」です。
はじめに、 Google Cloud Vision API を活用し、画像からテキストデータを検出します。そして、検出されたテキストを Cloud Translation で翻訳し、最後に Text-to-Speech で翻訳したテキストを読み上げます。
Google Cloud Vision API の料金体系
Google Cloud Vision API の課金は「ユニット」という独自の単位をもとに算出されます。例えば、1枚の画像に対して「ラベル検出」と「テキスト検出」を行った場合、1ユニットの「ラベル検出」の料金と1ユニットの「テキスト検出」の料金が発生します。
以下、 Google Cloud Vision API の1,000ユニットあたりの料金を表にまとめます。
機能 | 〜1,000 ユニット/月 | 1,001 ~ 5,000,000 ユニット/月 | 5,000,000 ユニット〜/月 |
---|---|---|---|
ラベル検出 | 無料 | 1.50米ドル | 1.00米ドル |
テキスト検出 | 無料 | 1.50米ドル | 0.60米ドル |
ドキュメントテキスト検出 | 無料 | 1.50米ドル | 0.60米ドル |
セーフサーチ(不適切なコンテンツ)検出 | 無料 | 1.50米ドル(ラベル検出を利用している場合は無料) | 0.60米ドル(ラベル検出を利用している場合は無料) |
顔検出 | 無料 | 1.50米ドル | 0.60米ドル |
ランドマーク検出 | 無料 | 1.50米ドル | 0.60米ドル |
ロゴ検出 | 無料 | 1.50米ドル | 0.60米ドル |
画像プロパティ検出 | 無料 | 1.50米ドル | 0.60米ドル |
クロップヒント検出 | 無料 | 1.50米ドル(画像プロパティ検出を利用している場合は無料) | 0.60米ドル(画像プロパティ検出を利用している場合は無料) |
ウェブ検出 | 無料 | 3.50米ドル | 非公開( Google へ問い合わせ要) |
オブジェクトのローカライズ | 無料 | 2.25米ドル | 1.50米ドル |
上表の通り、 Google Cloud Vision API は利用する機能によって料金が異なります。すべての機能において「1ヶ月あたり1,000ユニットまで」は無料で利用可能ですが、1,000ユニットを超過すると料金が加算されるため、複数機能を併用する場合は、料金が高額になる可能性があります。
Google Cloud Vision API を利用する際は、この点に注意して使ってください。
画像認識サービスは Google Cloud (GCP)がオススメ
ここまで、 Google Cloud Vision API について詳しくご説明しましたが、市場には Google Cloud Vision API 以外にも多くの画像認識サービスが存在します。例えば、 Microsoft が提供する Azure Cognitive Services や、 Amazon が提供する Amazon Rekognition などが挙げられます。
しかし、せっかく画像認識を行うのであれば Google Cloud (GCP)がオススメです。
Azure Cognitive Services や Amazon Rekognition と Google Cloud Vision API の比較をしたい方は以下の記事で詳しく比較しておりますので、以下の記事をご覧ください。
3大パブリッククラウドAWS GCP Azure の画像認識AIを価格や機能、精度の観点で比較!
Google Cloud Vision API は Google Cloud (GCP)に内包されているサービスの一つであるため、Google Cloud Vision API を利用するためには Google Cloud (GCP)を契約する必要があります。最後に、 Google Cloud (GCP)の概要とオススメな理由をご説明します。
Google Cloud (GCP)とは?
Google Cloud (GCP) は Google が提供するパブリッククラウドサービスです。同じ種別のサービスとしては、 Microsoft 提供の「 Azure 」や Amazon 提供の「 AWS 」などが挙げられます。
Google Cloud (GCP) は、セキュアで高い安定性を持つ Google の IT プラットフォーム環境を自社で利用することができます。ビッグデータや Google Workspace との連携など、『クラウド利用を越えた先の IT 戦略』をシームレスに実現することが可能です。
また、「 BigQuery 」をはじめとした優れたデータ解析ツールが用意されているため、一部のエキスパートだけでなく、組織全体でデータを活用し、経営戦略の策定や業務改善に繋げていくことが可能です。さらに Google Cloud(GCP) の多種多様なサービスを活用することで、高精度なデータ分析を実現することができます。
ユーザーインターフェースが使いやすい
Google Cloud (GCP)の大きな特徴として、使いやすいユーザーインタフェースが挙げられます。あらゆる操作がボタンクリックやドラッグ&ドロップなどで完結するため、専門知識を持たない人でも簡単に使うことができます。これにより、組織全体で社内のデータを有効活用でき、画像認識に関してもスムーズに作業を進めることが可能です。
豊富なソリューションが揃っている
Google Cloud (GCP)には、多彩な機能がオールインワンで提供されています。今回ご紹介した Google Cloud Vision API はもちろんのこと、その他にも多種多様なサービスが備わっています。
例えば、
- Cloud Text-To-Speech API (テキストを音声に変換)
- Cloud Translation API (任意の文字列をサポートされている言語に翻訳)
などが挙げられます。これらを Google Cloud Vision API と組み合わせて使うことで、より高度な画像認識を実現することができます。
データ処理速度が速い
画像認識においては、データの処理速度が重要なポイントになります。膨大なデータを効率的に処理するには、高いサービススペックが求められるためです。
Google Cloud (GCP) は月間60億時間分の動画を再生する YouTube や、10億人のユーザーが利用している Gmail と同じインフラをベースとしています。そのため、高速で安定したパフォーマンスを誇り、大量のデータに対してもスムーズなリアルタイム処理を実現します。
柔軟にスケーリングできる
Google Cloud (GCP)は 100% クラウドで提供されているサービスであるため、状況に合わせて柔軟にスケーリングできます。将来的にデータ量が増加した場合でも簡単にリソースを追加できるため、安心してサービスを運用することができます。
また、 Google Cloud (GCP) は自動スケーリングに対応しており、自社の状況に応じてリソースを自動的に増減してくれます。そのため、管理者が都度設定を変更したり、煩雑なリソース調整を行う必要はありません。面倒な作業は Google Cloud (GCP) が自動で行ってくれるため、自社は本来注力すべき作業に集中することができ、結果的に業務効率化や生産性向上に直結します。
セキュリティレベルが高い
Google Cloud (GCP) は第三者認証取得のハイレベルなセキュリティを備えており、
- SSAE16 / ISAE 3402 Type II:SOC 2/SOC 3
- ISO 27001・FISMA Moderate
- PCI DSS v3.0
など、さまざまな年次監査を受けています。
そのため、安全なセキュリティ環境で画像認識を行うことができ、情報漏洩などの各種リスクを低減した形で、安心して作業を進めることが可能になります。
まとめ
本記事では、 Google Cloud Vision API とは何か?という基礎的な内容から、 Google Cloud Vision API の機能やできること、料金体系など、あらゆる観点から一挙にご紹介しました。
データの多様化が進む現代において、画像認識の重要性は益々高まっています。画像ファイルを含むビッグデータを分析・活用し、企業成長を促進していく上で、 Google Cloud Vision API はとても有効なサービスだと言えるでしょう。
Google Cloud Vision API を活用することで、物体検出や顔検出、テキスト検出などが可能になり、特定の画像ファイルからあらゆる情報を取得することができます。これらの機能を応用すれば、様々なシーンにおける生産性向上に繋がります。
市場に存在する画像認識サービスは多岐にわたりますが、せっかく導入するのであれば Google Cloud (GCP)がオススメです。使いやすいユーザーインターフェースや高速データ処理、高いセキュリティレベルなど、企業は様々なメリットを享受できます。
本記事を参考にして、 Google Cloud (GCP)の導入および、 Google Cloud Vision API の活用を検討してみてはいかがでしょうか?
弊社トップゲートでは、Google Cloud (GCP) 利用料3%OFFや支払代行手数料無料、請求書払い可能などGoogle Cloud (GCP)をお得に便利に利用できます。さらに専門的な知見を活かし、幅広くあなたのビジネスを加速させるためにサポートをワンストップで対応することが可能です。
Google Workspace(旧G Suite)に関しても、実績に裏付けられた技術力やさまざまな導入支援実績があります。あなたの状況に最適な利用方法の提案から運用のサポートまでのあなたに寄り添ったサポートを実現します!
Google Cloud (GCP)、またはGoogle Workspace(旧G Suite)の導入をご検討をされている方はお気軽にお問い合わせください。
メール登録者数3万人!TOPGATE MAGAZINE大好評配信中!
Google Cloud(GCP)、Google Workspace(旧G Suite) 、TOPGATEの最新情報が満載!