ベイズ塾アドベントカレンダー2日目の記事です。ベイズ塾立ち上げの頃から関わってきた最年長塾生(元山口分校校長)として,自分語りします。
ベイズ統計について,塾が始まった頃から考えると随分と理解も進んだし,考え方も変わってきました。最初はMCMC,乱数が統計とどう関係あるのかとか,色々な確率分布があるのはわかるけどそれがどうした,というぐらいの理解でした。今では多少整理もついていると思います。でもこの10年でこれだけ考え方が変わったんだから,また10年経ったら「あの頃の俺はアホだったなあ」と思うかもしれません。
私が学生の頃は(1990年代),心理統計と言っても分散分析,因子分析,回帰分析がわかってれば十分でした。それがSEM,階層線形モデル,階層線形混合モデルと進む中で「これからはベイズ統計らしい」となって(2000年代〜),ベイジアンモデリングをやっていこう,てな今のご時世。教える側にもなりましたから,これだけの広い領域をどうやって体系立てて教えていくかは悩みます。時間も限られているしね。
あらためて自分のなかで心理統計は何か,と言われると因子分析,ひいては多変量解析が一番面白いと思います。いまだに初恋の人を想い続けてる感じ。そういう意味ではベイズ統計である必要はそんなになくって,線形代数の中に篭ってても良かったのかもなあ。そんな立場で考えてみれば,MCMCは万能係数算出機ぐらいに思ってつかえばよくって,データ生成からイメージしていけるから「このときはこの手法,あの時はその手法」と振り回されなくてよくなった,という理解でもいいのかなと思ったり。そういう意味では初期の激しいベイズ統計愛も落ち着いてきたなあ,と思います。
主義主張の派閥闘争はもう飽きたんですが,それでも最初はベイズ的な確率の考え方は画期的にカッコ良くて,それまでの頻度主義統計がアホらしくなるほどでしたから,ブンブン旗振って騒いでいました。みんなとワイワイ楽しかったなあ。今も楽しいけど。研究のツールとしてどう使えるか,というのがわかった今となってもなお,心理学の初学者にはベイズ統計から教えたほうがいいな,という信念は変わっていません。
頻度主義的統計の方法でも悪くないのですが,やはりデータがどこからどう出てきているか,心理測定はどうあるべきかを考えるなら,ベイズ統計的アプローチの方がいいと思うからです。ほとんど正規分布しか使わないような要因計画法への適用であっても,データ生成メカニズムから考えるほうが,t分布の導出を経て帰無仮説検定を教えるよりも(実際は導出なんかしないで機械が計算してくれるから,という用法になるけど),わかりやすいと思うんだよな。
わかりやすいかどうかは個人の判断だし,ベイズ的アプローチ(特に私は縁あるKruschkeの考え方に一番共感しますけど)の場合は「どこから差があったと言えるか」のROPEを考えるときに領域固有の問題になるから「手続きの一般化」ができない,だから教育コストがかかる,というのも問題だと思っています。モデル比較の方法についても諸説あるしね。それでも「有意差」にこだわりがちな傾向から初学者を引き離し,補正に補正を加えつつα水準のインフレを見て見ぬふりをする悪き習慣を止めるために,ベイズ統計はもっと心理学の中に入っていくべきだ,と考えます。
それもこれもふくめて,そもそも心理統計というのはどのような営みなのだろう・・・それを一本のストーリーにすることが,私の次の興味関心です。
塾は「ベイズ」塾ではありますが,それに関係ないことでもいろいろディスカッションできるし,学会ほど広くなく,互いの顔が見える程度のコミュニティとして関わっていきたいと想います。年長者だからできることがあれば言ってね。あと年寄り扱いはするな(デブ扱いもするな),気持ちは26歳(65kg)の若手研究者ですからね。
今後ともますます盛り上がりますように。
追伸 塾のgatherを用意しました。オンライン懇親会会場です。週末の夜はなるべく顔を出そうと思います。