タダです.
「Amazon Builder's Library」オンライン輪読会の第3回を開催しましたのでレポートします.
開催経緯
開催の経緯は, kdnakt さんがまとめてくれています.オンライン輪読会は2回目なのである程度やり方も確立されてきていい感じです. kdnakt.hatenablog.com
お題目
今回の輪読は,[運用の可視性を高めるために分散システムを装備する]を読みました.Amazon のシステムの運用での知見を学びたくて選びました. aws.amazon.com
資料
所感
「インストルメンテーション」がとても頻繁に出てきた言葉でした.これはパフォーマンスのレベルを監視または測定し、エラー診断、トレース情報を記録することを意味で,文中ではログや監視データに出力して利用していました.特に,Amazon のような毎秒2,000万件超えのリクエストを裁くサービスでのプラクティスは気付きがあり,輪読のメンバーごとの会社での取り組みを聞けて私も勉強になりました.
監視のデータでは,エラーが発生することはわかっても原因の特定に役立つわけではないと文中にあっったのですが必ずしもそうではないのかもしれません.例えば,AWS のサービスは各サービスごとに監視情報が CloudWatch 上で公開され利用者は確認することができます.輪読会では, EC2 のステータスチェックの情報で障害を検知して対処するきっかけとなったという話がありました.なので,必ずしも原因の特定に役立たないこともないなと気づきを得ました.
まとめ
[運用の可視性を高めるために分散システムを装備する]輪読会のレポートでした.
次回は[キャッシングの戦略と課題]を読みます.担当は脱脂綿さんです.お願いします!
過去の開催レポート
『The Amazon Builder's Library』オンライン輪読会 第1回開催レポート kdnakt.hatenablog.com