タダです.
AWS の障害が発生した時に感知するためにService Health Dashboardの RSS 情報を見る方法があります.ただ,監視システムでサービスステータスを統合管理できたら運用しやすいかと思います.自分が業務で使っている Datadog で AWS のサービスステータスを監視できないかを調査・検証したのでこの記事でまとめていきます.
AWS のサービスステータスを Datadog で監視する方法
Datadog での AWS サービスステータスを監視するための方法が公式ブログで紹介されていました.「AWS Outage Alerts」を使うことでサービスステータスを監視し,ステータスに変化があるとアラート通知ができる仕組みです. この機能は Datadog がService Health Dashboardのステータスをチェックして実現しています.
監視の設定方法
Datadog で「AWS Outage Alerts」をどう設定していくかを見ていきます.はじめにモニターを新規で作成する際にIntegration
を選びます.
次に,Integration
選択後,Installed
タブを選んで AWS のアイコンを選択します.
続いて,モニターの詳細を設定していきます.Integration Status タブを開きまず①のPick monitor scope
のセクションで監視したいリージョンとサービスを選択します.次に,②のSet alert conditions
セクションでアラートの条件を設定するのですが,デフォルトの1回のチェックが失敗したらすぐアラートを発報するようにするのがおすすめ設定です.
そして,アラートの通知の設定です.アラート通知文で指定している{{region.name}}
はアラートの発生したリージョン名を,{{service.name}}
はアラートの発生したサービス名を通知する変数として使えます.通知先を指定後テスト通知してみます.
テスト通知でメールを送信した結果,テストでは「us-east-2 の EC2」で障害が発生したとした場合のアラートが飛んでくることを確認できました.メールで通知しましたが Slack にも通知可能です.
まとめ
Datadog での AWS 障害を通知するための機能の紹介と設定方法を検証したので紹介しました.通常サービスのプロセスやリソース監視はやられていると思うのですが,AWS のサービスステータスも「AWS Outage Alerts」機能で監視を行うことができそうなのでこの機能をどう運用していくかも検討してまた記事化していきます.