ブラッドリーテリーモデル

 このブログでは、
  ・株式会社エスミの事業内容
  ・株式会社エスミが開発、販売するソフトの紹介
  ・事例の紹介
などをおこないます。

 今回は事例の紹介です。
 2015年のプロ野球のデータを取り上げます。できるだけ公式記録集などに載らないような記録に着目していきます。

 プロ野球のデータ分析を扱った『スポーツの数理科学 -もっと楽しむための数字の読み方-』(共立出版)という本があります。かなり古い本(1988年4月発行)になりますが、プロ野球や大相撲のデータを使っていろいろな角度から分析がおこなわれています。ただし、簡単に読めるような内容ではなく、一般化された数式が数多く載っており、数学が相当に得意な方でないと読みこなせないと思います。
 筆者が大学3年生の時に、大学の図書館から借りましたが、ほとんど理解できませんでした。一般化された数式の意味がわからなくても、実際のデータを使った計算手順が示されていれば少しはわかったかもしれませんが、途中過程がほとんど載っておらず、最終的な答えがあるだけでした。本を借りた目的がExcelに数式を入れて数字遊びをすること、あわよくば卒業論文の題材にすることでしたが、そんなに簡単なことではありませんでした。

 1988年当時、パソコンはまだ高価で各家庭には普及していません。数式を理解できて、プログラム化できる環境があった方というのはかなり少なかったのではないでしょうか。そういう意味ではハードルの高い本と言えるでしょう。
 6年ほど前に古本屋で購入して久しぶりに読みましたが、やはり理解できませんでした。しかし、筆者が理解できなくてもエスミには理解できる人がいます。今回は筆者が興味を抱いた、第2章の「強さ」をはかるで紹介されているブラッドリーテリーモデル(BTモデル)を紹介します。

 下表は1986年ペナントレースの対戦成績(引分は除外)です。1988年発行ですので、載っている事例もその時代のものになっています。画像をクリックすると、別ウィンドウで拡大画像が開きます。

 ペナントレースでは勝率で順位が決まりますので、この表の上から1位、2位、・・・6位となっています。順位がついているのだから強さもこの順番だと思われるかもしれませんが、チーム間の相性(カモと苦手)も考慮する必要があります。本では難しいことがいろいろと書かれていますが、それらを全て飛ばして計算結果をお見せします。
 下表をご覧ください。BTモデルで求めるのは強さを表す「π i」です。各球団に50(合計300)を与え、強さの平均が50になるようにしています。強いチームほど50より大きく、弱いチームほど50より小さくなります。π iの合計は300になります。画像をクリックすると、別ウィンドウで拡大画像が開きます。

 セ・リーグは実際の順位とπ iは一致していますが、パ・リーグは4位と5位が入れ替わりました。本には「日本ハムと上位チームとの引分を除いた対戦数がロッテよりも多かったためと考えられる」と書かれています。

 続いて、カモと苦手の関係です。下表でプラスが大きいほどカモ、マイナスが小さいほど苦手を意味します。わかりやすくするために、絶対値が0.6以上に色をつけました。画像をクリックすると、別ウィンドウで拡大画像が開きます。

 広島とヤクルトの関係に違和感があるかもしれません。対戦成績は広島から見て14勝12敗で勝ち越しているのに、ヤクルトが苦手になっているからです。
 ここでのカモと苦手というのは単純な勝敗成績で決まるのではありません。全体の対戦成績から個々の対戦成績の期待値を算出し、その差の大小から計算しています。
 下表をご覧ください。これは期待値と差で、本には載っていません。期待値というのはカイ2乗検定で知られる独立性の検定適合度の検定で出てくる期待値と同じです。横に合計すると、実際の勝数に一致します。画像をクリックすると、別ウィンドウで拡大画像が開きます。

 広島とヤクルトの期待値見ると、広島から見て17.76勝8.24敗となっています。広島の成績を考えると、ヤクルトには17~18勝しているべきで、実際の14勝だと期待に満たない→誤差よりも大きい→ヤクルトが苦手と判定されます。一方、ヤクルトから見れば、この弱さの割に広島に善戦したと言えます。
 このような関係を見ることができるのがBTモデルの良い点です。

 対戦成績から順序をつける手法として、サーストンの方法があります。サーストンは『EXCELアンケート太閤』『EXCEL官能評価』に搭載されています。しかし、サーストンは対戦数が等しくなければいけないという制約があります。そこで、引分を0.5勝0.5敗として対戦成績に組み込むと対戦数を揃えることができます。

 BTモデルでは対戦数が等しくなくても計算することができます。30年前と違って現在は交流戦がありますので、12球団の強さを同時に算出することができます。
 下表は2015年ペナントレースの対戦成績で、引分も含めています。特に、交流戦は3戦しかないので、引分を除外するのは勿体ないように思います。画像をクリックすると、別ウィンドウで拡大画像が開きます。

 π iを見ると、平均50を超えたのはパ・リーグの上位4球団だけで、セ・リーグにはありませんでした。特に、ソフトバンクは90.83と圧倒しています。 π iの順位を見ると、ヤクルトと巨人は5位と6位、阪神はオリックスの下となる8位でした。セ・リーグにとって交流戦の対戦成績(負け越し)が響いていると言えそうです。

 続いて、カモと苦手の関係です。先ほどよりも基準を緩くして、絶対値が0.7以上に色をつけました。画像をクリックすると、別ウィンドウで拡大画像が開きます。

 ソフトバンクのような強いチームだと、広島との1勝2敗で苦手と判定されてしまいます。中日やDeNAには2勝1敗と勝ち越していても、-0.6~-0.7になってしまうのです。機会があれば、2005年の交流戦実施以降のデータで12球団の順位付けとカモ・苦手を紹介したいと思います。

 最後に、今年のペナントレースの対戦成績です。ちょうど交流戦が終わったところですので、ここまでの順位とカモと苦手の関係です。画像をクリックすると、別ウィンドウで拡大画像が開きます。

 昨年と同様、ソフトバンクの強さが際立ち、π iは101.94です。セ・リーグでπ iが50を超えているのは広島だけ、30台が3チームもあり、今年も交流戦で苦戦したことが数字に表れています。