継続は力なり

タイトル通り定期的な更新を心掛けるブログです。

Service Health Dashboards を監視する『AWS Outage Alerts』機能を実装するまでにわかったことを整理する

タダです.

AWS Outage Alerts」を検証した時の記事を書きましたが,先日自分が担当する業務でこの機能を実装しました.実装に至るまでに追加で設定を調べたり,検証してわかったことをこの記事で整理します.

sadayoshi-tada.hatenablog.com

AWS Outage Alerts」で実現すること

AWS 基盤障害時に Service Health Dashboards のステータスが更新されます.その更新情報を Datadog が監視して 東京リージョンの全てのサービス障害アラートを飛ばすように実装します.

要件の整理

自分が受け持った業務での要件としては次のものです.

  • 東京リージョンのサービス基盤障害時にアラートを通知する
  • 他のリージョンからのアラートは受け取らないようにする

追加の調査でわかったこと

1, Pick monitor scope でリージョンを指定すると東京リージョンのサービスアラートを受け取れる

設定として Pick monitor scope でregion:ap-northeast-1とすると東京リージョンでアラート通知可能なサービスの基盤障害を通知できます.東京リージョンの特定サービスごとに監視を入れたい場合は更にフォーム内に監視対象のサービスを追加すれば監視が可能です.画像の状態ですと Datadog で監視可能な東京リージョンのサービスを監視している状態です.

東京リージョンの基盤障害アラートを受け取るためのフィルター f:id:sadayoshi_tada:20200531232328p:plain

グローバルレベルの Route53 もリストされているのですが,CloudFront はリストされてなかったりするので監視したいサービスがregion:ap-northeast-1 フィルターに対応してるかは前回の記事でも紹介した通知テストで確認を入れると良いです.

東京リージョンの特定サービスを受け取れるかの確認 f:id:sadayoshi_tada:20200531233235p:plain f:id:sadayoshi_tada:20200531233243p:plain

2, リージョンフィルターにリストされないサービスはグローバルフィルターにある場合がある

1つ目でわかったことと関連して東京リージョンのフィルターにリストされないサービスも通知させたい場合ですが,まずは Datadog の Integration を確認しましょう.基本的なサービスは Setup のドキュメントで行なっている Integration を行えば監視可能です.ただ,一部のサービス(例えば,EKS や Fargate など)で監視対象としてリストされない時は個別の Integration の導入が必要になります.

docs.datadoghq.com

監視したいサービスの Integration が導入済みでしたら1つ目の対応とは別にもう1つモニターを作り,region:globalを指定して確認してみてください.自分の場合は,CloudFront のステータスも監視したかったのですが,region:globalのフィルターで CloudFront がリストされました.

f:id:sadayoshi_tada:20200601020121p:plain

まとめ

簡単ではありますが,「AWS Outage Alerts」実装までにわかったことを整理しました.逆に言うとそれほど監視設定は複雑ではなかったなと思います.この記事が自分と同じように「AWS Outage Alerts」を検討している人や興味を持っている人の参考になれば嬉しいです.