タダです.
データ分析に興味がありその勉強の一環で,8/21 に「AWS 認定 Machine Learning Speciality」を受けて合格しました.今回は自分がどんな勉強をしたかを振り返り,今後受験される方の勉強の参考になれば嬉しいです.
試験範囲について
試験範囲については試験のガイドで確認できます.課題に対する機械学習の手法を選択できる能力,AWS サービスを特定する能力,拡張性・コスト最適化・信頼性ある・セキュアなソリューションを設計し実装する能力が問われそうだと認識しました.
この試験では、特定のビジネス上の課題に対応する ML ソリューションの設計、実装、展開、保守を行う能力を評価します。この試験で評価する能力は次のとおりです。
・ 特定のビジネス上の課題に対して適切な ML の手法を選択し、その理由を明確に説明する。
・ ML ソリューションを実現するうえで適切な AWS サービスを特定する。
・ スケーラビリティに優れ、コスト最適化され、信頼性が高く、セキュアな ML ソリューションを設計し、実装する。
試験の割合が以下のようになっています.
試験分野 | 試験における比重 |
---|---|
分野 1: データエンジニアリング | 20% |
分野 2: 探索的データ解析 | 24% |
分野 3: モデリング | 36% |
分野 4: 機械学習の実装と運用 | 20% |
試験勉強で注力したこと
次に,試験に向けて注力して勉強したことをまとめていきます.大きく3つのことをやりましたが,自分は機械学習に興味はあるものの業務でデータを集めてきてモデルを開発したり,その基盤を作るといったことはしたことがなかったです.そのため専門知識は本や解説記事をみて学んでいかなきゃいけなかったので,2と3をずっと繰り返し勉強していました.
1. 問われるトピックを確認する
サンプル問題や模擬試験を解くことでどのような問題が問われるのかを確認しました.出題の割合通りモデリングと探索的データ解析パートの出題割合が高く感じたためこの分野に重きを置いた勉強をしていきました.公式ブログにも記載がありましたが,SageMaker,EMR,Lambda,Glue,S3 のトピックは勉強しようと思いました.
この新しい試験は、特定のビジネス上の問題に対して ML ソリューションを設計、実装、デプロイ、保守する能力を検証したい開発者およびデータサイエンティストのために AWS の専門家によって作成されました。
さらに、特定のビジネス上の問題に適した ML アプローチを選択して正当化し、ML ソリューションを実装するのに適切な AWS のサービスを特定し、スケーラブルでコスト最適化された信頼性の高い安全な ML ソリューションを設計および実装する能力を検証します。AWS トレーニングと認定では、ML および人工知能 (AI) サービス、特に Amazon SageMaker、および Amazon EMR、AWS Lambda、AWS Glue、Amazon S3 などのその他のサービスの使用に関して 1 年以上の実務経験があることをお勧めしています。
また,「Exam Readiness: AWS Certified Machine Learning - Specialty」をみて試験分野で必要な勉強のトピックを確認しました.
2.機械学習の基礎や機械学習の開発フローを学ぶ
自分は教師あり学習や教師なし学習といった入り口の勉強はしていたたものの,機械学習のアルゴリズムごよの特徴やモデルの開発フローの基礎を理解できていませんでした.そのため,書籍を使って勉強を進めました.アルゴリズムの知識の整理には「見て試してわかる機械学習アルゴリズムの仕組み 機械学習図鑑」を使いました.主要なアルゴリズムの解説,図解,実装イメージを簡潔に説明していてアルゴリズムの具体的なイメージを掴むのに助かりました.
モデルの開発に関する勉強は「仕事で始める機械学習」の1~6章を見て行いました.機械学習プロジェクトが立ち上がってからシステムにモデルを組み込み,評価を行うまでを簡潔に書かれていて開発フローを掴みたいと思っていた自分にとってありがたい一冊でした.
Youtube 動画
書籍だけで理解が深まらない場合は,Youtube の動画を見ました.中でもスタビジというチャンネルにお世話になりました.機械学習のトピックを5分~12分ほどで解説してくれているので書籍で勉強した専門知識の整理をするために見ていました.
3. 機械学習の知識とサービスの理解を深める
AWS の機械学習関連のサービスが紹介されているためこのページに載っているサービスを中心にドキュメントやよくある質問を確認して理解を深めました.機械学習のためにデータを収集->保存->処理->分析->デプロイの工程ごとに登場するサービスや機能を整理しました. aws.amazon.com
また,「AWS ではじめるデータレイク」にも関連のトピックが出てくるのでこの本にもサービスの理解で助けられました.
関連記事
BlackBelt シリーズおよびYoutube 動画
ドキュメントと合わせて BlackBelt シリーズおよび Youtube の動画を見ました.SageMaker を中心に資料及び解説動画を確認しました.
SlideShare
Youtube
AWS Well-Architected レンズ
SageMaker の設計や運用周りのドキュメントがないかと探していた時に「AWS Well-Architected レンズ」を確認していきました.機械学習だけではないですが,トピックごとに AWS Well-Architected の5つの柱に当てはめた観点で解説してくれてます.日本語も2020年4月にリリースされているので読みやすかったです.
レンズは AWS Well-Architected が提供するガイダンスを、機械学習、分析、サーバーレス、ハイパフォーマンスコンピューティング (HPC)、IoT、金融サービスなどの特定の業界およびテクノロジー領域にも広げます。ワークロードを完全に評価するには、AWS Well-Architected フレームワークと 5 つの柱とともに、適切なレンズを使用します。
まとめ
「AWS 認定 Machine Learning Speciality」に向けて勉強した内容をおおまかにまとめました.次は,Database Speciality に挑みたいと思います!