2016-12-20

Tableau:時系列データを利用して、市区町村データを動的に見せる方法

こんにちは、データ解析が楽しくてたまらないDaiでございます。

さて、Tableauを使って、市区町村データを色塗りマップ表示する方法を前回調べました。

これを、さらに地域ごとの変化を時系列で動的に見れたら、もっと広い分析ができそうです。

そこで今回は、色塗りマップを時系列データを利用して、動的に見せる方法をご紹介します。

完成図はこちらです。







目次

  1. csvファイルをダウンロード
  2. 地理データを変換して、色塗りマップを表示する
  3. Yearデータを、ディメンションとして変換し、ページにぶち込む
  4. データを眺めてみると、発見が!

1. csvファイルのダウンロード


さ、今回は例題として、世界中のGDP成長率を、1971年から2018年まで分析してみましょう。
OECDの以下のサイトにアクセスして、CSVファイルをダウンロードしちゃってください。
下の画像の赤枠にあります。

Real GDP forecastTotal, Annual growth rate (%), 1971 – 2018

今回はこのデータを特に加工せずに、直接利用してしまいます。

2. 地理データを変換して、色塗りマップを表示する


さて、ダウンロードしたデータをTableauから開きます。
まず最初に、(1)Locationという変数を、クリックして、地理的役割から国/地域を選択します。
そして、(2)Locationをダブルクリックします

そうすると、列と行が自動生成され、こんな感じになります。



そして右上図のように、(3)表示形式から、色塗りマップをクリックします。





そうすると色塗りマップが表示されると思います。



さらに左下にある(5)Valueをドラッグアンドドロップし、 色にValueを突っ込みます。




3. Yearデータを、ディメンションに変換し、ページにぶち込む

そして、(6)左下のTimeを左上のページにぶち込みます。直後だと合計データになってるとおもうので、(7)右クリックして、ディメンションデータに変更してみてください





これで完成です。

そうすると、右上のような、TIMEという軸がでたと思います。あとはこれを(8)右矢印を押してやってみてください。時系列データが動きます。






3. データを眺めてみると、発見が!


さて、実際に時系列で動かしながらみてみました。
ヨーロッパを見てましたが、2007年以降からに一気にGDP成長率が下がっています。なんででしょうか。
「2007年 経済 出来事」と検索してみたら、リーマンショック関係しているのがわかりました
(このブログを読んでくれていらっしゃる方の場合、そんなこと調べなくてもわかると思いますが)


2009年になると、経済に強く影響が出ているのが見えます。ポーランドだけ生き残ってますね。なぜでしょうか。ポーランドの経済ってどうなっているんだろう。

感想

こんな感じで分析がインタラクティブに進み、問いが複合的に出てくるところがTableauのよいところですね。

願わくば、この時系列データを移しながら、色塗りデータを見せたものをGIF画像や動画で保存できる機能があると、非常にビジュアルしやすくて面白いと思います。ぜひTableauさんには開発してもらいたいものです。(もしかしたらあるのかな)

ちょっと関係ないのですが、OECDのデータは後から人が分析しやすいように加工されていて素晴らしいです。日本の国勢調査とか、よくわからない罫線とかでくくられていると思ったら、
時系列データを47都道府県分別のエクセルのタブに入れていたりして、後工程の思いやりがないというか・・・・・・。そのお役所仕事いらないからもっとデータをオープンにしてください汗


今回は時系列データX地理データでした。もっと深く最短で分析できるようになりたいのであれば、下の書籍が非常におすすめです!



Tableauデータ分析~入門から実践まで~
小野泰輔 前田周輝 清水隆介 三好淳一 山口将央
秀和システム
売り上げランキング: 23,483

注目の投稿

 PythonのTweepyを利用して、Twitter APIを利用している。 その中で、ハマったポイントをメモしておく。 まず、Searchに関して。 Twitter検索は、クライアントアプリ側では、全期間の検索が可能になっている。 一方で、APIを利用する際は、過去1週間しか...