継続は力なり

タイトル通り定期的な更新を心掛けるブログです。

東京都のオープンデータを使ってデータの可視化を QuickSight で実践しよう!

タダです.

QuickSight のハンズオンを試してみて,やっぱりオープンデータを使って自分なりに可視化してみたい!と思ったので東京都が公開している新型コロナウイルス関連のデータを可視化してみます.

stopcovid19.metro.tokyo.lg.jp

可視化対象のデータセット

東京都が公開している新型コロナウイルス陽性患者の発表詳細が CSV データとして公開されています.ハンズオンでもやりましたが,CSV データを QuickSight に食わせることでデータ可視化ができます.

catalog.data.metro.tokyo.lg.jp

データセットの中身

CSV データの中身は次のカラムがあります.

  • No
  • 全国地方公共団体コード
  • 都道府県名
  • 市区町村名
  • 公表_年月日
  • 曜日
  • 発症_年月日
  • 患者_居住地
  • 患者_年代
  • 患者_性別
  • 患者_属性
  • 患者_状態
  • 患者_症状
  • 患者_渡航歴の有無フラグ
  • 備考
  • 退院済フラグ

2020年7月27日時点で僕が見た限りですが,以下の項目は大半のデータが入ってなかったので,可視化のデータから外しています.

  • No
  • 市区町村名
  • 発症_年月日
  • 患者_属性
  • 患者_状態
  • 患者_症状
  • 患者_渡航歴の有無フラグ
  • 備考
  • 退院済フラグ

データの可視化してみた結果

3つのデータ可視化をしてみました.1つ目は折れ線グラフによる日別の患者公表件数と退院済みの患者数を表しました.オレンジ色の線が日別の陽性と判定された人数で青色の線が退院済みの人数です.こう見ると緊急事態宣言が解除された5月末まではほぼ2つの数値は同数だったけど,7月に入ってその開きがでているのがわかります.日ごとに感染者数が増えている一方になっているので不要不急な外出や人混みは避けて予防に努めたいところです.

f:id:sadayoshi_tada:20200727062554p:plain

2つ目は日ごとのエリア別発症された患者数を表しました.これは面グラフで表現しましたが,赤色が都民の患者数です.圧倒的な数です.発症した患者の居住地と一緒に感染の導線になっているエリアもわかるとヒートマップ的に可視化できるかもしれないなと思います.

f:id:sadayoshi_tada:20200727063255p:plain

3つ目は年代別の患者数の割合を表しました.20,30代が大半を占めています.仕事やプライベートの外出が盛んだからかなと予想します.

f:id:sadayoshi_tada:20200727063539p:plain

ハンズオンを経験して CSV データの取り込みからデータを表現する時に QuickSight のどこをどう触ったり,設定すれば可視化できるかを学べたのを活かせたと思います.

まとめ

QuickSight を使ってデータの可視化を実践しました.各種報道で発表されている感染者数にばかり目がいってしまいがちですが,東京都が公開している情報をみて今どんな状況なのかをデータを見えやすい形にして判断できる情報が提供さています.実際のデータを見てみると新しい見方や気づきを得られるかもしれないので,気になる人は試しにデータのダッシュボードを作ってみて欲しいです.

関連記事

sadayoshi-tada.hatenablog.com

sadayoshi-tada.hatenablog.com