
引用元スレ:統計的に今シーズンのパで誰がクラッチヒッターだったか示す
http://hayabusa.open2ch.net/test/read.cgi/livejupiter/1447337454/
http://hayabusa.open2ch.net/test/read.cgi/livejupiter/1447337454/
1: 名無しさん@おーぷん 2015/11/12(木)23:10:54 ID:Vjo
需要があるならやるでー
2: 名無しさん@おーぷん 2015/11/12(木)23:16:40 ID:Vjo
手法は以下の通りや
ヒットが出る確率をp=打率 n=打数 x=安打数とした時の二項分布に従うと仮定する
つまりヒットが出る確率=nCxp^x(1-p)^n-xや
ヒットが出る確率をp=打率 n=打数 x=安打数とした時の二項分布に従うと仮定する
つまりヒットが出る確率=nCxp^x(1-p)^n-xや
3: 名無しさん@おーぷん 2015/11/12(木)23:18:18 ID:ig0
なるほど、算数の話はわからんが続けてどうぞ
4: 名無しさん@おーぷん 2015/11/12(木)23:20:12 ID:Vjo
次に中心極限定理を用いてこの確率を以下の様に近似する
p_hat-z(a/2)*sqrt(p_hat*(1-p_hat)/n)<p<p_hat+z(a/2)*sqrt(p_hat*(1-p_hat)/n)
ここでp_hat=打率 z(a/2)=標準正規分布のa点 p=真の打率や
p_hat-z(a/2)*sqrt(p_hat*(1-p_hat)/n)<p<p_hat+z(a/2)*sqrt(p_hat*(1-p_hat)/n)
ここでp_hat=打率 z(a/2)=標準正規分布のa点 p=真の打率や
6: 名無しさん@おーぷん 2015/11/12(木)23:21:26 ID:pI5
>>4
ワイ文系民、低みの見物
ワイ文系民、低みの見物
5: 名無しさん@おーぷん 2015/11/12(木)23:21:17 ID:Vjo
今回はa=0.95とするで
つまり95%の確率の真の打率の範囲を求めるって訳やで
つまり95%の確率の真の打率の範囲を求めるって訳やで
7: 名無しさん@おーぷん 2015/11/12(木)23:22:04 ID:JVi
全く分からん
8: 名無しさん@おーぷん 2015/11/12(木)23:22:35 ID:Vug
御託はええからはよ
9: 名無しさん@おーぷん 2015/11/12(木)23:22:41 ID:HvG
二項分布以降分からんから噛み砕いてくれ…
16: 名無しさん@おーぷん 2015/11/12(木)23:23:57 ID:Vjo
>>9
二項分布はコインをn回なげてx回表が出る確率分布やで
中心極限定理はある変換を施すといかなる分布も(標準)正規分布で近似できる定理やで
二項分布はコインをn回なげてx回表が出る確率分布やで
中心極限定理はある変換を施すといかなる分布も(標準)正規分布で近似できる定理やで
33: 名無しさん@おーぷん 2015/11/12(木)23:36:00 ID:HvG
>>16
サンガツ まだそちらの方がイメージ出来そう
サンガツ まだそちらの方がイメージ出来そう
10: 名無しさん@おーぷん 2015/11/12(木)23:22:48 ID:Vjo
今回のワイのアプローチは上で求めた区間に得点圏打率が入っているか否かでクラッチか否かを判断するで
つまり得点圏打率がp_hat+z(a/2)*sqrt(p_hat*(1-p_hat)/n)以上ならクラッチ
逆にp_hat-z(a/2)*sqrt(p_hat*(1-p_hat)/n)いかならギャククラッチや
つまり得点圏打率がp_hat+z(a/2)*sqrt(p_hat*(1-p_hat)/n)以上ならクラッチ
逆にp_hat-z(a/2)*sqrt(p_hat*(1-p_hat)/n)いかならギャククラッチや
11: 名無しさん@おーぷん 2015/11/12(木)23:22:55 ID:NDu
ああなるほどそういうことか(思考放棄)
12: 名無しさん@おーぷん 2015/11/12(木)23:23:03 ID:ctV
はよせーy
13: 名無しさん@おーぷん 2015/11/12(木)23:23:24 ID:4wX
お?数学に自信ニキか?
14: 名無しさん@おーぷん 2015/11/12(木)23:23:32 ID:VAf
なるほどわからん
18: 名無しさん@おーぷん 2015/11/12(木)23:24:28 ID:6PK
難しくて反論する余地なさそう
31: 名無しさん@おーぷん 2015/11/12(木)23:33:51 ID:Iut
>>18
これ
これ
19: 名無しさん@おーぷん 2015/11/12(木)23:24:28 ID:VY7
理系はわかるんかこれ?
20: 名無しさん@おーぷん 2015/11/12(木)23:26:13 ID:8gS
ところでクラッチってなんや(無知並感)
23: 名無しさん@おーぷん 2015/11/12(木)23:27:35 ID:ig0
21: 名無しさん@おーぷん 2015/11/12(木)23:27:08 ID:VAf
いいからあくしろよ
22: 名無しさん@おーぷん 2015/11/12(木)23:27:15 ID:8fI
クラッチニキが来そう
24: 名無しさん@おーぷん 2015/11/12(木)23:27:41 ID:Vjo
例を一つ出すで
打率が三割で得点圏打率が4割で打数が500のバッターの上の区間は
0.3-1.96*sqrt(0.3*0.7/500) 0.3+1.96*sqrt(0.3*0.7/500)
= 0.259 0.34
となるで.つまりこの打者の打率は95%でこの範囲に入ると予測されるで
打率が三割で得点圏打率が4割で打数が500のバッターの上の区間は
0.3-1.96*sqrt(0.3*0.7/500) 0.3+1.96*sqrt(0.3*0.7/500)
= 0.259 0.34
となるで.つまりこの打者の打率は95%でこの範囲に入ると予測されるで
25: 名無しさん@おーぷん 2015/11/12(木)23:28:20 ID:vKJ
ほうほう実に興味深い
26: 名無しさん@おーぷん 2015/11/12(木)23:28:20 ID:o5G
27: 名無しさん@おーぷん 2015/11/12(木)23:28:42 ID:Vjo
そして0.34<0.4だからこのバッターはこの場合クラッチと判断するで
28: 名無しさん@おーぷん 2015/11/12(木)23:29:21 ID:5EY
パリーグなら中村晃かな
29: 名無しさん@おーぷん 2015/11/12(木)23:29:31 ID:zWb
もう待ちきれないよ!早く出してくれ!
30: 名無しさん@おーぷん 2015/11/12(木)23:32:57 ID:Vjo
ではいくで~~
1.中村晃 ・打率.300・得点圏.375 ・上側確率 0.340 ・下側確率 0.260
2.田中賢介・打率.284・得点圏.346 ・上側確率 0.322 ・下側確率 0.246
1.中村晃 ・打率.300・得点圏.375 ・上側確率 0.340 ・下側確率 0.260
2.田中賢介・打率.284・得点圏.346 ・上側確率 0.322 ・下側確率 0.246
32: 名無しさん@おーぷん 2015/11/12(木)23:34:27 ID:Vjo
3.浅村栄斗・打率.270・得点圏.331 ・上側確率 0.308 ・下側確率 0.232
4.藤田一也・打率.270・得点圏.326 ・上側確率 0.314 ・下側確率 0.226
4.藤田一也・打率.270・得点圏.326 ・上側確率 0.314 ・下側確率 0.226
34: 名無しさん@おーぷん 2015/11/12(木)23:37:54 ID:Vjo
5.柳田悠岐・打率.363・得点圏.413 ・上側確率 0.405 ・下側確率 0.321
6.中島卓也・打率.264・得点圏.305 ・上側確率 0.302 ・下側確率 0.226
この六人の打者が得点圏打率ー上側確率>>0 となる打者や
つまり統計的にみても5%でしか起きない得点圏打率以上のを残した選手やで
6.中島卓也・打率.264・得点圏.305 ・上側確率 0.302 ・下側確率 0.226
この六人の打者が得点圏打率ー上側確率>>0 となる打者や
つまり統計的にみても5%でしか起きない得点圏打率以上のを残した選手やで
35: 名無しさん@おーぷん 2015/11/12(木)23:40:03 ID:S9N
ちなみに何人調べたんや?
37: 名無しさん@おーぷん 2015/11/12(木)23:41:51 ID:Vjo
>>35
30人やで
30人やで
36: 名無しさん@おーぷん 2015/11/12(木)23:41:29 ID:Vjo
ここから7位のメヒアから28位のイデホまで得点打率が下側確率と上側確率の間に入るで
つまり統計的に見て十分に起こり得る範囲に収まってっていうわけや
よってクラッチでもチャンスに弱いってわけでもない選手達やな
つまり統計的に見て十分に起こり得る範囲に収まってっていうわけや
よってクラッチでもチャンスに弱いってわけでもない選手達やな
38: 名無しさん@おーぷん 2015/11/12(木)23:42:45 ID:Vjo
二人だけ得点圏打率が下側確率を下回った選手がおるで
つまり統計的に見て十分にチャンスに弱い?と言える選手や
つまり統計的に見て十分にチャンスに弱い?と言える選手や
39: 名無しさん@おーぷん 2015/11/12(木)23:42:55 ID:8gS
なるほど数学的な話はさっぱりやがなんとなくわかってきたわ
40: 名無しさん@おーぷん 2015/11/12(木)23:46:13 ID:Vjo
すまん上側確率というより上側打率っていったほうが分かりやすいな
29.栗山巧・打率.268・得点圏.221 ・上側確率 0.306 ・下側確率 0.230 ・得点圏-下側打率=-0.009
30.ペーニャ・打率.268・得点圏.189 ・上側確率 0.311 ・下側確率 0.225 ・得点圏-下側打率=-0.036
栗山とペーニャだけが統計的に見てチャンスに弱い打者だと言えるで
29.栗山巧・打率.268・得点圏.221 ・上側確率 0.306 ・下側確率 0.230 ・得点圏-下側打率=-0.009
30.ペーニャ・打率.268・得点圏.189 ・上側確率 0.311 ・下側確率 0.225 ・得点圏-下側打率=-0.036
栗山とペーニャだけが統計的に見てチャンスに弱い打者だと言えるで
51: 名無しさん@おーぷん 2015/11/12(木)23:57:05 ID:8fI
>>40
絶対ペーニャだわと思ってたらやっぱりペーニャだった
絶対ペーニャだわと思ってたらやっぱりペーニャだった
41: 名無しさん@おーぷん 2015/11/12(木)23:48:39 ID:Vjo
まとめ
チャンスに強い打者ランキング
1中村
2田中
3浅村
4藤田
5中島
弱い打者ランキング
1ペーニャ
2栗山
他の打者は統計学的にみればその得点圏打率は十分起こり得る範囲に収まったで
チャンスに強い打者ランキング
1中村
2田中
3浅村
4藤田
5中島
弱い打者ランキング
1ペーニャ
2栗山
他の打者は統計学的にみればその得点圏打率は十分起こり得る範囲に収まったで
44: 名無しさん@おーぷん 2015/11/12(木)23:52:09 ID:jSz
>>41
柳田どこ行った
柳田どこ行った
45: 名無しさん@おーぷん 2015/11/12(木)23:52:43 ID:Vjo
>>44
すまん藤田と中島の間に柳田やわ
すまん藤田と中島の間に柳田やわ
42: 名無しさん@おーぷん 2015/11/12(木)23:49:44 ID:Vjo
お分かり頂けただろうか?
46: 名無しさん@おーぷん 2015/11/12(木)23:52:45 ID:TI9
確率のばらつきを超えた成績を残したのがその7選手なんやろ?
わかったわかった(白目)
わかったわかった(白目)
47: 名無しさん@おーぷん 2015/11/12(木)23:52:51 ID:Hkw
中村晃は去年も得点圏2位とかやから
誤差の範囲とかでなく実際チャンスに強いんやろな
誤差の範囲とかでなく実際チャンスに強いんやろな
48: 名無しさん@おーぷん 2015/11/12(木)23:54:00 ID:Vjo
>>46
起こっても不思議ではない打率以上に得点圏打率が高いって感じかな~
>>47
あんまり得点圏だから打率が上がるってのは理屈が分からないけれど何かあるのかもね
起こっても不思議ではない打率以上に得点圏打率が高いって感じかな~
>>47
あんまり得点圏だから打率が上がるってのは理屈が分からないけれど何かあるのかもね
49: 名無しさん@おーぷん 2015/11/12(木)23:54:51 ID:Vjo
他には得点圏打率と通常の打率の差を統計的に検定する方法もあるで
暇があったらやってみるわ
暇があったらやってみるわ
50: 名無しさん@おーぷん 2015/11/12(木)23:56:11 ID:6AL
>>49
それは普通のt検定とは別の方法で?
それは普通のt検定とは別の方法で?
52: 名無しさん@おーぷん 2015/11/13(金)00:00:46 ID:2QC
>>50
所謂z検定になるけれど二項分布だとちょっと面倒な所がある
所謂z検定になるけれど二項分布だとちょっと面倒な所がある
53: 名無しさん@おーぷん 2015/11/13(金)00:00:50 ID:nIf
よく分かってない人はこう理解しとけばええで
↓
普段テストで平均点くらいの点数取れる人が偏差値30以下になってしまう。
これが今回のイッチの言う条件や。。本来ならそれくらいあり得ないことをしてしまった選手と言うこと
↓
普段テストで平均点くらいの点数取れる人が偏差値30以下になってしまう。
これが今回のイッチの言う条件や。。本来ならそれくらいあり得ないことをしてしまった選手と言うこと
54: 名無しさん@おーぷん 2015/11/13(金)00:01:37 ID:nIf
あっ、>>53は厳密には違う意味やけど、概念としてな
55: 名無しさん@おーぷん 2015/11/13(金)00:02:14 ID:2QC
今年の打率って一生に一回きりのものだけれどそれを仮に100回とか何度も繰り返したとして
そのときの打率の範囲を求めてるって感じかな
そのときの打率の範囲を求めてるって感じかな
56: 名無しさん@おーぷん 2015/11/13(金)00:03:21 ID:PDt
この計算やと得点圏の打数をまるまる無視してるように気がするんやけどそれはええのか?
58: 名無しさん@おーぷん 2015/11/13(金)00:04:15 ID:2QC
>>56
多分厳密にやると問題となると思う
だから本当に厳密にやりたかったら得点圏打率と通常打率の差の検定をする必要があると思う
多分厳密にやると問題となると思う
だから本当に厳密にやりたかったら得点圏打率と通常打率の差の検定をする必要があると思う
59: 名無しさん@おーぷん 2015/11/13(金)00:08:14 ID:PDt
>>58
なるほど
まあそんなに大きな差が出るところでもないんやろな
なるほど
まあそんなに大きな差が出るところでもないんやろな
60: 名無しさん@おーぷん 2015/11/13(金)00:08:49 ID:2QC
>>59
やらないと分からないけれど上位二人はほぼ差の検定をしても有意に差がでると思うよ
やらないと分からないけれど上位二人はほぼ差の検定をしても有意に差がでると思うよ
61: 名無しさん@おーぷん 2015/11/13(金)00:12:55 ID:2QC
上でワイが求めた上側確率とか下側確率とかは
100回今シーズンを繰り返したら95回は打率がこの範囲に収まるってものやで
統計学おもろいからみんな勉強してな
100回今シーズンを繰り返したら95回は打率がこの範囲に収まるってものやで
統計学おもろいからみんな勉強してな
62: 名無しさん@おーぷん 2015/11/13(金)00:14:07 ID:nIf
えらい見にくいと思ったらp_hatってpハットのことか。
テキストベースで見るとメッチャ見にくくなるんやな。ようやく理解できた
テキストベースで見るとメッチャ見にくくなるんやな。ようやく理解できた
63: 名無しさん@おーぷん 2015/11/13(金)02:33:49 ID:JbL
計算にはR使ったんか?
64: 名無しさん@おーぷん 2015/11/13(金)14:18:17 ID:2QC
>>63
簡単な計算だからエクセルでやってもうたで
簡単な計算だからエクセルでやってもうたで