NPBにおけるピタゴラス勝率と実際の勝率

スポーツアナリティクス Advent Calendar 2020の14日目の記事です。

はじめに

みなさんピタゴラス勝率をご存知でしょうか。ざっくりいうと得点と失点と勝率の関係を表したもので、以下ような単純な式で表されます。

{ \displaystyle
ピタゴラス勝率 = \frac{得点^{2}}{得点^{2} + 失点^{2}}
}

このピタゴラス勝率について、Essence of Baseballさんのサイトを見てると以下の記述が目につきました。

また、 ピタゴラス勝率をチームの戦力と考え、実際の勝率との差は監督の能力を表すとする分析も見られるが、このような使用法は適切でないとされている。ピタゴラス勝率自体の高低にも監督の影響は及んでいるはずであるし、監督が同じでもピタゴラス勝率と実際の勝率との乖離には継続性が見られないからである。

Essence of Baseball: ピタゴラス勝率

このなかの「監督が同じでもピタゴラス勝率と実際の勝率との乖離には継続性が見られない」という箇所について気になったのでそれらしきデータがどこかにないのかと探してみたのですが、特に見つかりませんでした。
そこで本記事では、プロ野球におけるピタゴラス勝率と実際の勝率の関係について可視化しながら、チームや監督によってピタゴラス勝率と実際の勝率との乖離があるのかを調べていこうと思います。
(データは楽天が参戦して現在の12球団になった2005シーズン以降のものを使用しています。)

ピタゴラス勝率と実際の勝率の関係

まずはピタゴラス勝率と実際の勝率がどのような関係になっているかを見ていきます。下の図は2005シーズン以降における12球団のピタゴラス勝率と実際の勝率の散布図です。青線はピタゴラス勝率=実際の勝率となっており、この線より上だとピタゴラス勝率より実際の勝率が高く、下だと低いことを表してます。
いずれの点も青線に近く、ピタゴラス勝率で実際の勝率をかなり精度よく近似できていることがわかります。

f:id:flaty1992:20201208161011p:plain:w600
ピタゴラス勝率と実際の勝率

上のグラフだとピタゴラス勝率と実際の勝率の乖離がどのくらいの大きさなのか少しわかりにくいので、ピタゴラス勝率と実際の勝率の差をヒストグラムで表してみます。大体±0.05(5%)に収まっているようです。
(今回の例に当てはめていいかは微妙ですが、偶然の要素で0.05程度はブレてもおかしくないので妥当な誤差だと思います。詳しくは去年自分がJapan.Rで発表したスライドをご覧ください)

20191207_japanr_LT - Google スライド

f:id:flaty1992:20201208161917p:plain:w600
ピタゴラス勝率と実際の勝率の差の分布

チームごとの関係

次に先ほどのグラフをチームごとに分けて描いてみます。特定のチームがピタゴラス勝率と比較して実際の勝率が高かったり低かったりみたいな傾向はないように見えます。

f:id:flaty1992:20201208162858p:plain:w600
ピタゴラス勝率と実際の勝率(チームごと)

ヒストグラムで見ても同様です。強いて言えば中日がプラス側に偏っている気がしますが、12球団もあれば1球団くらいは偏っていても確率的におかしくないので判断が難しいです。

f:id:flaty1992:20201208163624p:plain:w600
ピタゴラス勝率と実際の勝率の差の分布(チームごと)

時系列で比較

ではチームごとのピタゴラス勝率と実際の勝率の関係を時系列で見てみましょう。赤がピタゴラス勝率で緑が実際の勝率となっています。中日に注目してみると、2010年〜2012年の3年連続で実際の勝率がピタゴラス勝率を0.05程度上回っています。ただ、2010、2011年は落合監督ですが、2012年は高木監督に変わっているのに加え、両監督の他のシーズンは継続的に上回っているわけではなさそうです。(落合監督は2004~2011年、高木監督(第2次)は2012~2013年)
また、2017年は0.048、2020年は0.087とこちらも大きく上回ってますが、2017年は森監督、2020年は与田監督と監督が異なっています。さらに両監督の他のシーズンはむしろ下回っていたりと、特定の監督が安定して実際の勝率がピタゴラス勝率を上回るという傾向はなさそうです。

f:id:flaty1992:20201208200755p:plain:w600
ピタゴラス勝率と実際の勝率の推移

f:id:flaty1992:20201208202755p:plain:w600
ピタゴラス勝率と実際の勝率の差の推移

まとめ

以上の結果から、Essence of Baseballさんのピタゴラス勝率の説明にあるように、ピタゴラス勝率と実際の勝率との乖離には継続性が見られないことがデータから見て取れました。やっぱりある程度の期間を見るのは大事ですね!


おまけ

今回分析に使ったデータを使って、対象期間内のピタゴラス勝率のベスト/ワースト3、ピタゴラス勝率と実際の勝率の差ベスト/ワースト3も見てみようと思います。(チーム名はフルで書くとテーブルの見た目が悪くなるので省略)

ピタゴラス勝率ベスト3

1位は17.5ゲーム差をつけてぶっちぎりで優勝した2011年のソフトバンクホークスです。ピタゴラス勝率的にはもう少し勝ってもおかしくなかったのは恐ろしいですね...

チーム 試合数 勝ち 負け 引き分け 得点 失点 実際の勝率 ピタゴラス勝率 実際の勝率 - ピタゴラス勝率
SB 2011 144 88 46 10 550 351 0.657 0.711 -0.054
ロッテ 2005 136 84 49 3 740 479 0.632 0.705 -0.073
巨人 2012 144 86 43 15 534 354 0.667 0.695 -0.028

ピタゴラス勝率ワースト3

球団創設時の楽天が1, 2位という結果です。どちらかというと3位だけでなく4, 6, 7位を占めている2009~2012年の横浜が際立っています...

チーム 試合数 勝ち 負け 引き分け 得点 失点 実際の勝率 ピタゴラス勝率 実際の勝率 - ピタゴラス勝率
楽天 2005 136 38 97 1 504 812 0.282 0.278 0.004
楽天 2006 136 47 85 4 452 651 0.356 0.325 0.031
横浜 2010 144 48 95 1 521 743 0.336 0.330 0.006

ピタゴラス勝率と実際の勝率の差ベスト3

1位は今シーズンの中日でした。2位の阪神名将ポイントという指標で盛り上がったみたいです。

チーム 試合数 勝ち 負け 引き分け 得点 失点 実際の勝率 ピタゴラス勝率 実際の勝率 - ピタゴラス勝率
中日 2020 120 60 55 5 429 489 0.522 0.435 0.087
阪神 2015 143 70 71 2 465 550 0.497 0.417 0.080
阪神 2010 144 74 66 4 518 561 0.529 0.460 0.069

ピタゴラス勝率と実際の勝率の差ワースト3

1位は2005年のロッテでした。この年のロッテはピタゴラス勝率的には圧倒的に優勝しておかしくなかったのですが、ソフトバンクに敗れ2位となっています。しかしクライマックスシリーズソフトバンクとの接戦の末に勝ち上がり、日本シリーズ阪神に圧勝して見事日本一に輝いています。
2位は2013年のソフトバンクです。ピタゴラス勝率的には楽天と優勝争いしてもおかしくありませんでしたが、最終的に4位と2010年代唯一のBクラスという結果に終わっています。

チーム 試合数 勝ち 負け 引き分け 得点 失点 実際の勝率 ピタゴラス勝率 実際の勝率 - ピタゴラス勝率
ロッテ 2005 136 84 49 3 740 479 0.632 0.705 -0.073
SB 2013 144 73 69 2 660 562 0.514 0.580 -0.066
ヤクルト 2010 144 60 84 0 596 623 0.417 0.478 -0.061