継続は力なり

タイトル通り定期的な更新を心掛けるブログです。

監視の基本と戦略を学ぶなら『入門 監視』で勘所を押さえよう

タダです.

業務で3月から Datadog を使った監視の設定やチューニング,運用を担当することになったのですが,監視について学んだ経験がなかったため監視の勉強の一環として「入門 監視」を読みました.読了したので学んだことと所感と一緒に本書を紹介します.

入門 監視 ―モダンなモニタリングのためのデザインパターン

入門 監視 ―モダンなモニタリングのためのデザインパターン

  • 作者:Mike Julian
  • 発売日: 2019/01/17
  • メディア: 単行本(ソフトカバー)

目次

本書の章立ては次の通りです.本編として170Pの内容です.

  • 第1章 監視のアンチパターン
  • 第2章 監視のデザインパターン
  • 第3章 アラート、オンコール、インシデント管理
  • 第4章 統計入門
  • 第5章 ビジネスを監視する
  • 第6章 フロントエンド監視
  • 第7章 アプリケーション監視
  • 第8章 サーバ監視
  • 第9章 ネットワーク監視
  • 第10章 セキュリティ監視
  • 第11章 監視アセスメントの実行
  • AppendixA 手順書の例:Demo App
  • AppdendixB 可用性表
  • AppendixC 実践 監視SaaS

本書で学んだこと

本書を通じて学んだことを以下に列挙します.

  • 1,2章で監視におけるアンチパターンデザインパターンが説明されているのですが,一覧として整理されていたので勘所として勉強になりました.
  • 3章で監視の目的をシステムやシステムのコンポーネントの振る舞いや出力を観察,チェックし続ける行為と定義して,目的実現のための日々のアラート,オンコール,インシデント管理の運用の仕方を学べました.
  • 4章で監視における統計の話が出てきます.なぜ監視に統計?と最初は思いましたが,CloudWatch のメトリクスにも統計が使われているので学ぶ意義を実感できました.
    • CloudWatch ではメトリクスデータの集計方法としてドキュメントにあるように 最小値/最大値/合計値/平均値/データのカウント数/パーセンタイル値があります.
  • 5~10章で KPI を確認しつつ各コンポーネントで監視の観点をさらえたので,監視の設計をしたことない自分にとって勉強になりました.
  • 11章で5~10章で扱ったトピックのケーススタディを通してどんな観点で監視を取りまとめるかを振り返ることができました.

読了後の所感

本書を読み終えての所感についてもまとめます.

  • 本書全体を通して監視の設計に関わったことがない自分にとって監視をどう進めるか,どんな考え方がアンチパターンで,デザインパターンとしてこう考えるべきという視点を得られたと感じています.実際に監視設計に関わる時に再度立ち返りたいと思う書籍でした.
  • 監視は継続的な改善活動だというデザインパターンは得心できました.自分はシステムの運用に関わったことが少ないのですが,関わってみて日々の運用に加え,社内外の課題やトラブルを乗り越え,成長のための改善を繰り返していく活動だと感じてます.その中で事業にコミットするための監視の閾値を設けることやシステムの重要な監視項目をチェックしていることが監視の重要性を感じますし,監視の継続的な改善をすることで事業やプロダクトをよりよくしていく一端を担えるのだなと感じました.
  • AppendixC では当時Mackerelのプロダクトマネージャーを担当されていた @songmuさんが執筆されており,監視 SaaS を使うメリット,導入するときの観点,使い分け,これからの監視 SaaS 等のトピックがありました. 自分は Datadog を扱っているので,監視 SaaS の良さをまだまだ使えてないなとか,今後の SaaS での監視の取り組みを考え直すきっかけになりました.

まとめ

入門 監視」で学んだこと,所感を整理しました.監視の素地がないけど業務で当たることになった人や感覚に頼っていたり経験則があまりない人にとってオススメの書籍だと感じました.自分自身も本書を読んだからもう終わりではなく,監視を通じた継続的な改善を続けていけたらと思います.