継続は力なり

タイトル通り定期的な更新を心掛けるブログです。

【俺的Advent Calendar 2018(3日目)】Amazon SageMakerのre:Invent2018発表アップデートを学ぶ(1)

タダです。

Amazon SageMaker(以下、SageMaker)のre:Invent2018アップデートが連発しまくっていたので、一度アップデートをまとめていきたいと思います。

多数のアップデートがあったため一回で終わることなさそうなんで何回かに分けてまとめます。

SageMakerのアップデート一覧

今回は、SageMaker Ground TruthとAmazon SageMaker ノートブックが Git 統合の理解を深めます。

そもそもSageMakerって?

SageMakerはフルマネージド型の機械学習サービスです。

SageMakerでは、次の3つの工程を行います。

  1. Jupyter Notebookを利用するためのノートブックインスタンスを使った開発
  2. モデルのトレーニン
  3. モデル(推論)のデプロイ

Amazon SageMaker Ground Truth

Amazon SageMaker Ground Truthは、SageMakerの新機能で、機械学習で必要なデータセットを効率的・高精度なラベル付けを簡単に行えるようにするサービスになります。

SageMaker Ground Truthでは、以下のデータセットの構築をサポートします。

  • テキスト分類
  • 画像分類
  • 物体検出
  • セマンティック・セグメンテーション
  • ユーザ定義のカスタムタスク

また、SageMakerのデータセットをラベル付けするのに比べてコスト(70%)と時間を削減するのも特徴です。

SageMaker Ground Truthでは3つのラベリングの方法を提供します。

ラベルをつけると、機械学習における答えを与えて鍛える教師あり学習を使えるようになります。 教師あり学習を使った機械学習システムを使うのに役立つサービスですね。

Amazon SageMaker ノートブックが Git 統合

SageMakerノートブックインスタンスと、GitHub、CodeCommit、その他のセルフホスティング型Gitリポジトリと統合が可能になりました。

Gitを使うためには2つの方法があります。

  • ノートブックインスタンスを作成する際にパブリックGitリポジトリのURLを紐づけてクローンする
  • プライベートリポジトリはAWS Secret Managerのシークレット情報を指定してクローンする
    • AWS CodeCommit 以外のプライベート Git リポジトリを追加するには、まず認証情報を保存するための AWS Secrets Manager シークレットを作成し、次に create-code-repository の AWS CLI コマンドを使用中に提供するための、AWS Secrets Manager シークレットの Amazon リソースネーム (ARN) を取得する必要があります。

4日目も続けてSageMakerのアップデートをまとめます。