2020.04.27
【書籍紹介】「Google Cloud Platform 実践機械学習開発 Google Machine Learning 」
- Cloud
- エンジニア
- 書籍紹介
目次
トップゲートのエンジニアが Google Machine Learning 本を発刊!!
クラウドでは、同じ目的を実現するのにも様々な選択肢があり、どの技術を使うか迷いがちです。
しかし、GCP の根底にある思想を正しく理解すれば誤った技術選定をすることはありません。
本書は、Google Cloud Platform(GCP) サービスのコンセプトや考え方を、実践的な使用例を通して完全理解する解説書です。
機械学習のデータ処理や学習や推論をスケーラブルにし、たくさんある GCP プロダクトの使い分け・活用例を知ることができます。
内容紹介
【序章】
- 環境の準備
- Google Cloud SDK について
- Windowsへのインストール
- Macへのインストール
- Cloud SDK の使い方
- Cloud Shell
【Chapter.1】専門知識不要で使えるサービス
- AutoML とは
- AutoML Tables とは
- AutoML Tables の位置づけ
- Cloud AutoML Tables のモデルを構築する流れ
- 本書のサンプルで必要な環境
- AutoML Tables を使って予測
- 番外編 前処理+ AutoML
- BigQuery M Lとは
- BigQuery ML の特徴
- BigQuery でできること
- BigQuery ML、AutoML、Tensorflow の位置づけ
- Biquery の操作方法
- BigQuery ML でモデルを構築する流れ
- BigQuery ML を使って予測
【Chapter.2】TensorFlow
- TensorFlow とは
- TensorFlow と計算グラフ
- TensorFlow v2 における変更
- Eager Execution
- AutoGraph
- TensorFlow の高レベル API
- TensorFlowとKeras の歴史
- tf.keras の使用例
- 途中経過の保存
- 学習の途中再開
【Chapter.3】計算リソースとしての GCP
- Google の計算リソースに対する考え方
- Google Compute Engine
- インスタンスの作成画面
- 課金について
- 等価な gcloud コマンドの生成
- gcloud コマンドによるインスタンスの作成
- 使い終わったインスタンスを削除する
- 一連の処理の自動化
- Startup スクリプト
- Container-Optimized OS
- AI Platform
- AI Platform の使用例
- AI Platform のその他の機能
- Preemptible VMの活用
- Preemptible VM
- Preemptible VM を自動で再起動する方法
- TensorFlow で学習を途中から再開させる方法
- 学習後にインスタンスを落とす方法
- 最終的な構成とコードの例
【Chapter.4】データの処理
- データストレージ
- Cloud Storage
- BigQuery (Storage)
- データ処理パイプライン
- BigQuery によるデータ処理
- BigQuery によるデータ繋ぎ込み
- BigQuery によるデータ加工・特徴量生成
- Window 関数
- BigQuery での構造化データの扱い方
- 配列の値の処理
- 配列の作り方
- 構造体
- Cloud Dataflow によるデータ処理
- Apache Beam について
- Apache Beam プログラミングモデル(Batch基本編)
- Apache Beam プログラミングモデル(Streaming編)
- Cloud Dataflow Template
- Dataflow によるデータ繋ぎ込み
- Dataflow による機械学習の予測処理
【Chapter.5】プロダクションのための機械学習
- 再現性
- Docker で環境を固定する
- シード値を固定する
- 汎化性能
- 前処理
- 交差検証(CV)
- DataAugumentation(DA)/li>
- チームでモデル改善
- 実験の成果物に誰でもアクセスできるようにする
- チームで実験を共有する
- MLOps
- バージョン管理と精度の監視
- 大規模タスクの実行