こんにちは。
エンジニアの佐藤です。
Tableau、始めました。
(有志者とともに社内勉強会開催中)
目次
▼目次
Tableauとは
Tableauとは、
タブローソフトウェア(Tableau Software)は、BI(ビジネスインテリジェンス)に特化したインタラクティブなデータの視覚化ツール。
wikipediaより抜粋
です。
グラフを作っているのかをブログネタにしようと企んでいたのですが・・・・
モザイクを入れたら何が何だかわからないことになってしまいました。しかもこれグラフ化しているわけでもない(泣)。
なのでTableauを使って野球データを可視化しようと思います! なぜなら野球が好きだから。
阪神タイガースを可視化
データはここから引っ張ってきました。 野球の本場はデータが豊富だなぁ。
僕は阪神ファンなので、阪神のデータを用いて作ります! 最新の2016年のデータで作るぞ( ・`ω・´)
データを引っ張ってきて・・・(Get as Exel Workbook)
Tableau Desctopを開いて・・・
接続→Excelでダウンロードしたexelファイルを選択して・・・
できました!
なんか、いい感じに見えます!!
どのように作っているのか一部紹介いたします。
ディメンションとは
まずディメンションですが、
初めてデータ ソースに接続すると、Tableau は不連続のカテゴリー別情報 (値が文字列やブール値のフィールドなど) を含むフィールドを、[データ] ペインの [ディメンション] エリアに割り当てます。
ヘルプより抜粋
です。 名前で分類分けしたり、IDが入ります。
阪神タイガースでは名前と、あと参照データを調整して「野手/投手」で区別するディメンション、それと[若手],[中堅],[ベテラン]を分類分けする計算フィールドを作成しました。
選手層のディメンションを作成
[sql] if [Age] > 18 and [Age] <= 26 then"若手"
elseif [Age] > 26 and [Age] <= 34 then
"中堅"
elseif [Age] > 34 then
"ベテラン"
end
[/sql]
メジャーとは
次にメジャーですが、
初めてデータ ソースに接続すると、Tableau は定量的な数値情報 (値が数値のフィールド) を含むフィールドを、[データ] ペインの [メジャー]エリアに割り当てます。
ヘルプより抜粋
です。 野球のデータの多くはこちらに属しています。
今回は既存データの他に[1B(シングルヒット)][三振率]等を追加しました。
シングルヒットと三振率のメジャーを作成
1B (ヒット数 – 二塁打 – 三塁打 – ホームラン数)
[sql] [H]-[2B]-[3B]-[HR] [/sql]三振率(三振数 / 打席数 )
[sql] [SO]/[AB] [/sql]等など、目的のデータに必要な計算フィールドを作成しました。
野球はデータが集めやすいので、初心者におすすめのスポーツのようですね。
そして、選手別のヒット種別をつくってみました。
シートを作成
- ディメンションのNameを列にドロップする
- メジャーバリューを行にドロップする
- 1B,2B,3B,HR以外をメジャーバリューから外す
- マークを棒グラフにする
- メジャーネームをマークの色にドロップする
でできた!!
去年ヒットを最も阪神タイガースで打ったのは福留孝介選手です。 当時39歳、現在も4番を務めている選手です。
2番目にヒットを打ったのは去年の新人王高山駿選手です。
こうして見ると大和選手が 二塁打の割合が高いことがわかります。 試しに二塁打率を計算フィールドで求めてグラフに追加しましょう。
二塁打率を表すメジャーを作成
二塁打率(二塁打数 / 打席数)
[sql] [2B]/[PA] [/sql]
おお、大和選手の二塁打率はチーム2番でした!! 気が付きませんでしたが1番高いのは上本選手で、3番目に北条選手が続きました。
おわり
などなど、こうして数字だけでは気が付きづらいデータを可視化することで新しい発見できました。
こうして業務で扱うデータを可視化し役立てることができるのがTableauです。
操作も直感的でわかりやすいです!!
次もまた色々探って行きます。 データも少なく、別年度とか入ってませんしね。
あと、リンクバルではデータに強いエンジニアを募集しております。
応募は、こちらから。