将棋タイトル戦で3連敗後に4連勝するケースは稀と言えるか統計学的検証

前から気になってしょうがなかったので、計算してみる。

将棋のタイトル戦(7番勝負のもの)に関して、3連敗後の4連勝での逆転勝ちが非常に少ないといわれているが、本当にそうなのか数学的に証明してみたい。

以下のブログによるとこれまで194局中2局がそのケースに該当するとのこと。そして7番勝負のタイトルマッチで3連敗4連勝が発生する理論上の確率は、1/64(≒0.0156)である。3連敗4連勝は理論上の確率と比べて明らかに少ない(起こりにくい)と言えるだろうか?

ファイナンスコーヒー – 王位戦第7局
http://financecoffee.skr.jp/archives/1057

ここでは、z検定を用いて、将棋タイトル戦で3連敗4連勝が起こりにくいかを有意水準0.05で統計的に検定する。仮定として、挑戦者とタイトル保持者の力は互角(両者の勝つ確率は0.5)とする。

① 検定仮説 P =0.0156
② 対立仮説 P < 0.0156
③ 調査結果 n=194, p= 2/194(≒0.0103), P0 = 0.0156
④ 統計量 W=-0.5957 (z検定の公式より)
⑤ 棄却域 α=0.05, 片側検定 よってz(α)=z(0.05)=1.64
⑥ 比較 |w|<1.64なので検定仮説を棄却できない
⑦ 結論 有意水準0.05で将棋タイトル戦7番勝負で3連敗後4連勝するケースは理論値の0.0156よりも低いとはいえない。

たまたまそういうケースが少ないということか。あー、少しすっきりした。

確率論的に見た第22期竜王戦

今回は渡辺竜王の4連勝だった。内容的にも圧勝で、まったく森内九段を寄せ付けた感がない。こないだの羽生-山崎の王座戦を思い出す。プロ同士の将棋でこれぐらい差が出るのは珍しいと思うが、確率的にどうか検証してみる。
 
棋士レーティングより、本日時点での渡辺竜王の森内九段に対する期待勝率は、56%。
 
したがって、渡辺竜王が4連勝する確率は、0.56^4 = 0.098345となり、10%程度は4連勝の確率があったことがわかる。

ちなみに、渡辺竜王が防衛する確率はどうなるか?
 
先に4勝する確率なので、単純な組み合わせとも行かず、めんどくさいが、ひとつずつ出してみた。
 
4勝1敗のパターン:4通り
×
×
×
×
 
4勝2敗のパターン:10通り
× ×
× ×
× ×
× ×
× ×
× ×
× ×
× ×
× ×
× ×
 
4勝3敗のパターン:20通り
× × ×
× × ×
× × ×
× × ×
× × ×
× × ×
× × ×
× × ×
× × ×
× × ×
× × ×
× × ×
× × ×
× × ×
× × ×
× × ×
× × ×
× × ×
× × ×
× × ×
 
○=0.56, ×=0.44として、それぞれのパターンの発生確率を求めると、
4勝1敗≒0.17
4勝2敗≒0.19
4勝3敗≒0.17
 
となり、全部合計して約0.63。
 
したがって、現在のレーティングから判断すると渡辺竜王の防衛確率が6割以上あったことになる。
もっといい計算方法ないかなあ?
 
 
 
PS.しかし、事前の研究熱心さで有名な森内九段が見事に作戦負けしてるからなー。渡辺さんの強さばかり目立ったシリーズだった。
 

Bonanzaと大数の法則

ボナンザメソッド(ボナメソ)には理論上はっきりとした限界がある。
 
プロの棋譜を集めれば集めるほど、大数の法則により平均的なプロ棋士の棋力に近づくからだ。しかも、今のボナンザは全幅探索を可能とするために限定的なパラメータしか入力していないから、その分総合的な判断のできる人間が上回るだろう。また、ボナメソには学習データの少ない局面では強さを発揮できないという弱点もある。しかし、指し間違いが少ないというコンピュータならではの利点もある。その分を相殺しても、ボナメソではプロ棋士の下位レベルぐらいに到達するのが限界(※)と見ている。
 
おそらく作者がソースコードを公開したのもそういった限界を感じてのことではないだろうか?
 
※もちろん、これは条件によって異なる。早指しになればなるほどBonanzaのレベルはプロの上位に近づく。
 
 

プロ棋士をも打ち負かす最強将棋登場!サクセス 最強将棋 BONANZA 【PSP】

超幾何分布、二項分布、ポアソン分布の内部統制サンプリングにおける考え方

非常にざっくり書いてみる。
 
内部統制のサンプリング結果は、超幾何分布となる。(サンプル抽出後、かごに戻さないからね)
    ↓
超幾何分布計算めんどくさすぎ。(非常に大きな数同士の掛け算が必要になる)
    ↓
母集団の数が多ければ、二項分布で近似すれば、計算簡単じゃね?(玉が多ければ、サンプル抽出後、かごに戻しても影響少ない)
    ↓
発生確率が低いのなら、さらにポアソン分布で近似すりゃ、超簡単やん。Open-mouthed(平均値だけわかれば、確率分布を計算できる!)
 
Q&A監査のための統計的サンプリング入門

Q&A監査のための統計的サンプリング入門
富田 竜一

金融財政事情研究会 2007-11
売り上げランキング : 7147
おすすめ平均

Amazonで詳しく見る by G-Tools

内部統制テスト時のサンプリング数25件について検証

内部統制テスト時のサンプリング数は、日常的に発生する業務であれば25件必要とされている。このことについて、前回のエントリで書いたExcelのBETAINV関数を使用して検証してみた。

要求信頼度90%で、サンプル中に発見されるエラーが一つもないと仮定した場合の上限逸脱率は以下のようになる。

サンプル数 20 21 22 23 24 25
上限逸脱率 0.108749 0.103849
0.099372
0.095264
0.091482 0.087989

上限逸脱率をどこに設定するかによって変わってくるが、10%未満に設定するのであれば、最低22件、9%未満に設定するのであれば最低25件必要ということになる。 一般的な資料では、後者が採択されているため、24件ではだめで、最低25件のサンプリングが必要ということになっているようだ。

ちなみに、要求信頼度95%で、発見されるエラーが0のときの上限逸脱率の表は以下のようになる。

サンプル数 27 28 29 30 31 32
上限逸脱率 0.105019 0.101466 0.098145 0.095034 0.092114 0.089368

この場合、上限逸脱率を10%未満にするには、最低29件、9%未満にするには最低32件のサンプリングが必要になることが分かる。

下の本が参考になる。

Q&A監査のための統計的サンプリング入門

Q&A監査のための統計的サンプリング入門
富田 竜一

金融財政事情研究会 2007-11
売り上げランキング : 7147
おすすめ平均

Amazonで詳しく見る by G-Tools

上限逸脱率の計算

上限逸脱率の計算は、Excelで簡単にできる方法があるようだ。
 
 
 
EXCELではBETAINV関数を用い、下記のような表記となる。

 BETAINV( 1 – β, 1 + k, n – k )

(β:サンプリングリスク(1-βは保証水準)、k:実際に発見されたエラー数、n:サンプル件数。)

例として、要求信頼度90%、サンプル数25件でエラーが0件の場合(β=0.1、k=0、n=25)、上限逸脱率は以下のように計算できる。
 
=BETAINV( 0.9, 1, 25)=0.87989
 
よって、上限逸脱率が10%を超えないことが分かる。
 
 
このBETAINV関数は、累積ベータ確率分布の逆関数を返すらしいのであるが、二項分布とβ分布には、緊密な関係がある。
 
ある確率pに従う二項分布に関してα+β-1個の確率変数があるときに、ベータ関数f(α,β)はβ番目(一番大きいもの)からα番目を上から拾ってきたときに、それが、β番目から1番目(一番小さいもの)の中で占める割合 r を求めるものである。で、その逆関数がBETAINVで、r, α,βをもとにpを求めてくれるという大変ありがたい関数だそうだ。
 
誰か知らんが、こんなことを考えた人すごい。
それを実装しているExcelってほんとすげー。
 
 
PS. Excelの関数のオンラインヘルプはいけてない。ほんと、意味不明。
 

Talking about 内部統制評価時のサンプリング調査についての考察

訂正。

以前のエントリの考え方が正確ではなかったので、修正する。

90%の信頼水準を得るためには少なくとも25件のサンプリング調査が必要とされている点について、これの証明には少なくとも以下の前提が必要である。

①母集団が十分に大きいこと
②許容逸脱率: l
③要求信頼度:90%
④検出力は無視
⑤帰無仮説:母逸脱率qは許容逸脱率 l に等しい
⑥対立仮説:母逸脱率qは許容逸脱率 l より小さい

このとき、サンプル数n件、棄却上限件数をx件として達成信頼度を計算し、要求信頼度を充足するかどうかを判定する。もし、要求信頼度を達成しない場合は、サンプル数を増加するか、または棄却上限件数をすくなくして、同様の判定を繰り返す。

 

仮に母逸脱率を9%としたときに、サンプルを20件取得して、エラーが0件見つかったとする。二項分布をベースにそのサンプル試行が発生する確率を求めると、約0.15となる。これはExcelで簡単に計算できる。ちなみに式は、

=BINOMDIST(0,20,0.09,TRUE)

である。

このとき、達成信頼度は0.85である。これは、要求される信頼度90%に及ばないため、帰無仮説を棄却できない。これはつまり、サンプルを20件取り出してエラーが運よく全然見つからなかった、ラッキー!という確率(危険率)が15%もあり、信頼するに足りないということをさしている。

次のステップとして、サンプル数を増やしてトライしてみる。

サンプルを25件取得してエラーが0件でした。このサンプル試行が発生する確率は、0.0946313
となり、達成信頼度は0.9053687(>90%)となる。これは、要求される信頼度を満たしているため、帰無仮説を
棄却できる。

言い換えれば、25件のサンプルを調べて逸脱が0件であれば、母集団の逸脱率が9%より小さい確率が90%以上あるということになる。このことから「90%の信頼水準を得るためには少なくとも25件のサンプリング調査が必要とされている」のは、前提として母集団の許容逸脱率を9%前後と暗黙的に見ているということになる。これは監査人の経験に基づく値であろう。

前回のエントリの最後の部分に以下のように書いた。

・40件までとしている情報
http://maruyama-mitsuhiko.cocolog-nifty.com/security/2006/03/post_daea.html

・42件までとしている情報
http://www.zeem.jp/present/account/k_200802.html

僕の試算によると、ポアソン分布、二項分布、どちらを使用しても最大逸脱率9%のときに40件中1件のエラーが発見された場合、信頼水準は90%に1%以上届かない。したがって、正確性を期すのであれば、後者を採択すべきであろう。

これはこれであっているんだけど、許容逸脱率を9.8%と設定すれば、40件中1件の誤謬があった場合でも、要求信頼度90%(ポアソン分布でも二項分布でも)を満たすことに気づいた。したがって、前者も正解である。

ちなみに、許容逸脱率9.8%、40件中1件の誤謬の場合の危険率をポアソン分布をベースに計算した場合、Excelの計算式は、次のようになる。

=POISSON(1,40*0.098,TRUE)

※サンプル数の平均値=母集団の平均値とみて、事象が一定期間に1件または0件発生する確率。0からの累積確率を求めるので最後の引数はTRUEとなる。


許容逸脱率をどの程度に設定するか、確率分布の計算モデルとして何を使用するかによって必要なサンプル数が変わってくる点には要注意だ。

まだ混乱しているが、一応まとめた。
参考書籍↓

 

Q&A監査のための統計的サンプリング入門

Q&A監査のための統計的サンプリング入門
富田 竜一

金融財政事情研究会 2007-11
売り上げランキング : 7147
おすすめ平均

Amazonで詳しく見る by G-Tools