継続は力なり

タイトル通り定期的な更新を心掛けるブログです。

AWS のサービスステータスを Datadog で監視する『AWS Outage Alerts』機能

タダです.

AWS の障害が発生した時に感知するためにService Health DashboardRSS 情報を見る方法があります.ただ,監視システムでサービスステータスを統合管理できたら運用しやすいかと思います.自分が業務で使っている Datadog で AWS のサービスステータスを監視できないかを調査・検証したのでこの記事でまとめていきます.

AWS のサービスステータスを Datadog で監視する方法

Datadog での AWS サービスステータスを監視するための方法が公式ブログで紹介されていました.「AWS Outage Alerts」を使うことでサービスステータスを監視し,ステータスに変化があるとアラート通知ができる仕組みです. この機能は Datadog がService Health Dashboardのステータスをチェックして実現しています.

www.datadoghq.com

監視の設定方法

Datadog で「AWS Outage Alerts」をどう設定していくかを見ていきます.はじめにモニターを新規で作成する際にIntegrationを選びます.

f:id:sadayoshi_tada:20200515012912p:plain

次に,Integration選択後,Installed タブを選んで AWS のアイコンを選択します.

f:id:sadayoshi_tada:20200515013224p:plain

続いて,モニターの詳細を設定していきます.Integration Status タブを開きまず①のPick monitor scopeのセクションで監視したいリージョンとサービスを選択します.次に,②のSet alert conditionsセクションでアラートの条件を設定するのですが,デフォルトの1回のチェックが失敗したらすぐアラートを発報するようにするのがおすすめ設定です.

f:id:sadayoshi_tada:20200515013612p:plain

そして,アラートの通知の設定です.アラート通知文で指定している{{region.name}}はアラートの発生したリージョン名を,{{service.name}}はアラートの発生したサービス名を通知する変数として使えます.通知先を指定後テスト通知してみます.

f:id:sadayoshi_tada:20200515013628p:plain

テスト通知でメールを送信した結果,テストでは「us-east-2 の EC2」で障害が発生したとした場合のアラートが飛んでくることを確認できました.メールで通知しましたが Slack にも通知可能です.

f:id:sadayoshi_tada:20200515014259p:plain

まとめ

Datadog での AWS 障害を通知するための機能の紹介と設定方法を検証したので紹介しました.通常サービスのプロセスやリソース監視はやられていると思うのですが,AWS のサービスステータスも「AWS Outage Alerts」機能で監視を行うことができそうなのでこの機能をどう運用していくかも検討してまた記事化していきます.