Kosugitti's BLOG

アンドロイドは正規分布の夢を見るか

この画面は、簡易表示です

2013 / 11月

腹痛い

数年に一回のペースで,ものすごい腹痛になることがある。

 

一番ひどいのは,多分なんかの菌にやられて数日間寝込んだことがあったけど,そこに至らないレベルでも,貧血で倒れそうになる(たぶんお腹に血が集中して頭がクラっとするんだとおもうが)レベルのやつが,時折あるね。

 

山口に来てから,二度目の,脂汗を垂らして苦しむレベルのやつが,昨晩来ました。あれはいつやっても辛いなあ。

 

今日はリサミが9時からあるから,なんとか出勤して話し合いは終えたんだけど,話し合いをしながら気がふわ~っと飛んでいきそうになって,「あかんこれ病のレベルや」と思ったので,2コマ目以降の指導・講義を全部キャンセルしてしまいました。ご迷惑をお掛けしました。

早退して,昼ごはんも食べずに横になり,時折トイレに行きながら生きてましたよ。

 

陀羅尼助丸には今回も感謝です。あと,食前に飲む漢方は効くね。大正漢方胃腸薬を夕飯前に飲んだら,今頃(22時)はもうブログが書けるぐらいに回復しました。ふぃー。



子供のいろいろ

上の子の場合

・仲良しの隣の家の子とピクニックにいく、という。休みの日の朝からお弁当を作ってやらねばならないので、面倒である。お小遣いもせびられる。途中で駄菓子屋に寄るらしい。朝出て、夕方まで帰ってこないので、心配であったり気楽であったり。

・今朝の話。関西に住んでいる許嫁のところに手紙を送るので切手をくれという。二通あって、同じところに送る(差し出し人は本人と弟)というので、一つにまとめろよ、と封を開ける。と、写真が入っている。一つは先方からもらったものw もう一つは、自分のアルバムから昔の写真を取り出して、ご丁寧に周囲を切り抜いて手紙本文にはりつけている。勝手にアルバムの写真をとったらダメだとか、写真を切るなよ、とか、なんかいろいろ叱った。ついでに切手代80円とるので、明日のピクニックのお小遣いは20円です、といったら泣いた。最終的に、お金の大切さと写真の大切さを伝えて、切手は特別にあげることにした。次の誕生日(2月)から、月300円のおこづかい制を導入することにした。

真ん中の子の場合

・わがままボーイ。妹と喧嘩する日々。まだまだ子供っぽい。先日の学会初日、俺は土曜日でも7時おきだなあ、と思っていたところ、6時に「・・・濡れた・・・」といっておこされた。おねしょである。5歳だから、まだそういうこともあるか。

・拗ねるボーイ。3日前にコタツを出したのだが、夕飯がお鍋の時に、台所から卓上コンロまで土鍋を運ぼうとして「熱いのが行くからどいてー」というと、コタツの中に潜り込んだ。ので、「そこはかえって危ないじゃないか!」というと、半泣きになって拗ねて「食べぬ!」といって別室で引きこもる。相変わらず、拗ねると面倒である。

下の子の場合

・かわいさばつぐん。来週には3歳になるはずなのだが、今だにオムツは取れないし(取ろうともしない。トイレの感覚があるのに連れて行こうとするとガンと拒否して、部屋の隅に行ってしゃがみ込む)、日本語も不十分である。流暢に喋らなくてもいいと思っているようだ。あと、指すいが直らない。出っ歯になるのが怖い。

・車内でかけている音楽を一緒に歌う。大声を張り上げるももクロ「怪盗少女」はとても可愛らしい。あと「なめこのうた」も大好き。ヒムペキのポニョも一緒に「ぱーりら、ぱりらぱーりら」とか言ってるのは、よくない学習をさせてしまったかも。車内では三人とも、ジッタリンジンの「夏祭り」を歌います。



中四国心理学会第69回大会を運営しました

2013年11月16,17日の両日,中四国心理学会第69回大会を山口大学で開かせていただきました。

200名弱の大会参加者,公開講演も150名超のご参加を頂き,大変盛会となりました。

ご来場の皆様に感謝いたします。

 

また,今回もあっかるいスタッフと共に仕事させてもらったことに感謝です。

色々あって,終わってからまあよかったよかった,終わり良ければすべて良し,なーんてものがただの自己満足であり認知的不協和の解消でありおめでたい話であり,学会運営でどれだけ喜んでもらったり楽しんでもらったりしても,自分の研究者としての資質向上には組しない(むしろ雑務にかまけて研究教育が滞ったほどだ)ことは重々承知しているのだけど,それでも良かったし楽しかったし感謝している。

そういうことにさせてください。俺のワガママにつきあってくれた,来場者,スタッフ,関係者各位に御礼申し上げます。

 



偏η^2の信頼区間を求める

社会心理学会のWSで,効果量の信頼区間の話をやっていた。

分散分析では,anovakunが偏\eta^2(partial \eta^2)をpeta=Tオプションで出してくれるから愛用しているんだけど,この偏 \eta^2の信頼区間を出したらもっとわかりやすいよ、という話。

確かに,その変数が分散のどの程度を説明するかという指標なので,その信頼区間があるとわかりやすいよね。

 

ところが,WSでは「RのMBESSパッケージを使えば簡単ですから」とは紹介されていたものの,このMBESSパッケージがなかなかくせ者で,どのようにして算出していいのかがわかりにくい。

こちらのサイトを参考にして,これ経由のソースをダウンロードしてできるらしいことはわかったんだけど,MBESSパッケージではどうやるの。。。っと悩んで,やっと見つけたので答えを記録しておきます。(追記・訂正があります)

こうすることで,偏\eta^2とその95%信頼区間が描けます。conf.limits.ncf関数がメインで,信頼区間のオプションはconf.level=0.95がデフォルトになっているので,これで95%信頼区間がでます。
ちなみに,括弧でくくることでprintをしていることに注意ね。

自由度とF値だけで算出できるかと思いきや,非心F分布non-central F distributionとやらが出てきて,後輩やらいつもの先生のサイトに助けてもらったり,とうろうろしましたが,答えがスッキリ出たのは気持ちいいなあ。

こうなると,他の効果量の信頼区間も欲しいところだが,今はちょっと時間がないので、また今度。

 

 

追記

この算出式でなくても,

で算出できることを,南風原先生直々にご指摘いただきました!感謝です!

なお,下限,上限を求める式中のdf1+df2+1のところは,WSの中でも誤っていることが指摘されていて(聞いてたのに理解してなかった!スミマセン),正しくはNであるとのこと。G*powerでは正しく推定されているよ、という話はここに関係していたのですね。

 

In Table 2 in Faul et al. (2007), the noncentrality parameter \lambda for “Multiple regression: increase of R^2” is given as f^2*N.
This parameter is implemented in G*Power.But in Cohen (1988, p.414), the noncentralityparameter is given as f^2* (u+v+1), where u and v are the df for numerator anddenominator, respectively.

 

ということで,正確に書き直すと,

となります。
まだまだ勉強が足りないなあ。テキストからやり直しだぁ!

[amazonjs asin=”4641121605″ locale=”JP” title=”心理統計学の基礎―統合的理解のために (有斐閣アルマ)”]


  • Categories:

分位点回帰Quantile Regressionは確かに面白い

社会心理学会大会2013@沖縄国際大学,はそこそこ楽しめたのだけど,中でも一番面白かったのが分位点回帰についてのWS。

前々から企画者のIさんに面白さは伺っていたのだけど(論文も書かれてましたね),WSで確認し,先ほど実際自分で触ってみて面白さを味わった。当然,Rでできるのである。

少し宣伝?解説?しておくと,従来の回帰分析が平均回帰を狙っているのに対し,分位点回帰は任意の分位点(30パーセンタイル点とか,第3四分位とか)での回帰係数を求めるというもの。しかもひとつではなくて,複数求めることができるから,第1四分位ではこういう傾きだったのに,第3四分位では傾きが変わりましたね,なんて事も分かる。

心理学変数のほとんどは正規分布するという便利な建前があるが,実態的データ,例えばネットワークサイズとか年収のようなもの,は当然偏った分布をするのであって,平均点目指して回帰する時点ですでに歪んでしまっているわけである。それを補正する可能性があるのがこの手法。

何より感心したのは,WSで「我々の仮説が平均回帰に縛られすぎてないか?もっと自由であるべきではないか?」という問いかけがあったこと。確かにそうだよなあ,実際のデータとか経験則は,必ずしも平均のことばかりではないからなあ。

 

さてRではquantregパッケージというのがあって,そのなかのrq関数が分位点回帰をしてくれる。QuantileRegressionだからqr関数じゃないの,と思うかもしれないが,qr関数はすでに固有値分解のQR法に割り当てられた名称なのでダメなのです(これは譲れない)。

quantregに入っているエンゲル係数データを使って,試しにちょっとやってみた。

コードはfoodexp(食費)をincome(収入)で予測するだけの式だけど,tau=seq(0,1,0.25)のオプションで0,0.25,0.50.0.75,1.0の分位点回帰をせよ,という意味になっている。0とか1は無意味だけど,0.25,0.75は四分位だし,0.50は中央値回帰になっている。結果は明らかで,収入が下位25%のところだと0.47しかない係数が,中央値で0.56,第3四分位で0.64とあがっていき,上位階層の人間ほど食費にお金が回せるのだな,ということが明らかだ。

お金がらみでついでにもうひとつ。野球の年俸と成績の関係を分位点回帰にかけてみた。データはここから持ってきたものを使っている。

これをみると,年俸が低いうちはホームランや打率がものを言うが,年棒が高い層は打率はむしろ負のパスになって,ホームランや三振のパス係数がおおきくなっていく。つまり,記録より記憶で儲けるようになると,一流ってことですかな。

人文社会科学系のデータは歪んでいるのも一杯あるだろうから,こういうモデルで自由な仮説検証がもっと進むといいですね。

>> See also RPubs http://rpubs.com/kosugitti/10473

 

参考文献はこちら。安くていいと思う。

[amazonjs asin=”1412926289″ locale=”JP” title=”Quantile Regression (Quantitative Applications in the Social Sciences)”]



SEMから教える。SEMだけで教える。

Yamadai.RというRの勉強会を定期的に開いているのだが,参加者が基本的にゼミ生なので,ゼミ生に対する統計の補講のようになっている。まあそれでもいいんですけど。そういう位置づけの会になっているので,授業では触れないやり方とか,新しい教え方を試す場にさせてもらっています。

 

普段の統計の講義(データ処理法)では,検定,回帰分析,因子分析,とオーソドックスな順で教えていくのだけど,いつも最後の方は時間が足りなくて,SEMまで言及できなかったりする。ということで,Yamadai.Rでは逆に,最初からSEMを教え始めた。回帰分析は説明したんだけど,lavaanパッケージを使ってやるのである。

重回帰分析を教えるときに,「独立変数間は無相関でないとねー」とか注意しないといけないが,lavaanを使っていると「このモデルは独立変数間に相関が考えられるよね,パスを足してみようか」という対応ができるわけで,わざわざ遠回りした上で「昔は苦労した」みたいな話をしなくていい。

さらに別の教育効果があることを先日発見した。

データとして,プロ野球選手の年棒とシーズン成績をここからとってきて使ってみた。打者のデータに限定して回帰分析につかうと,例えば「ホームラン一本打ったら年棒がいくらあがるか」という話ができて,学生もイメージしやすい。いい教材を見つけたと思う。

で,前回は潜在変数を仮定したモデル(因子分析)を教えていた。「安打数」「HR数」「四球数」「体重」を観測変数として,【腕力因子】を仮定し,「盗塁数」「犠打数」「体重」を観測変数とした【脚力因子】を仮定したモデルを描いてみたのである。このモデルが妥当かどうかは検証していくとして,まずこういう目に見えないものを背後においてみる,というお話なので,やってみて「おおできた」,「腕力と脚力が負の相関,なるほどな」みたいな実感を得た。いいかんじ。

そのあと,モデル修正指標を見てみると,腕力因子から盗塁数にパスを出すと良い,という事であった。ここでちょっと「?」となったのだが,学生が「腕を振るから走るんじゃないか」「スライディングのときに腕をのばすのではないか」「まさか逆立ちして走るのか」とか言い出したので,シメタ!と思ったのである。

【我々は,背後に潜在変数があると仮定してモデルを描いた。その潜在変数が「腕力」であるかどうかは,俺が名前をそうつけただけで,本当に腕の力なのかどうかわからない。なのに我々は,いったん腕力と命名してしまうと,まるでそれが実際に存在するかのように考えて,「腕力だとするとこのモデルはどういう意味があるか」と思考の向きが逆転させてしまう。それは(よくあることだが),よくないことだ。よくよく注意しなければならない。】

というようなことを教える好例となったのである。

これ,探索的因子分析から教えていると,ちょっと気付きにくいことなんじゃないだろうか。あるいは,教える側からは強調するのだけど,教わる側からするとイメージしにくい問題ではないだろうか。そもそも探索的因子分析から教える場合,共通性の推定方法とか,因子数の決め方とか,次々に新しい言葉,気をつける点が出てきてしまって,「因子の解釈と命名」まで注意が維持しにくいような気がするんだよね。これをいい例で教えられたと思ったわけです(間違えてくれた学生ありがとう)。

心理学の研究も気をつけないとそういうことになりがちで,自分で勝手に仮定した構成概念に関係する文言からなる質問紙をして,因子分析の結果,「ほら見ろ因子がでたぞー!」っていうのって,自作自演というか,マッチポンプというか,「てっちゃんの手品」になってるんだよね。

注)「てっちゃんの手品」というのは,愚息(てっちゃん)が「お父さん見てみて!いい?ぬいぐるみをこの箱の中に隠して・・・ジャーン!ぬいぐるみがでてきましたー!」という手品を披露してくれたことに起因する小杉ゼミ専門用語。

 

なので,SEMから教える,SEMだけで教えることを考え始めた。

回帰分析,重回帰分析,パス解析をへて潜在変数を仮定したパス解析,という順に教えていくと,流れが非常にスムーズだし,評価も適合度だけでいいので伝わりやすい。従来の方法でも,どうせ回帰分析,因子分析を教えたあと,構造方程式モデリングに言及するわけだし,しかも最後の一コマだけつかって,「今まではこういう方法があるって教えてきましたけど,これからはこちらに統合されていきます」と言ってもあまり感動してもらえない。今後はもうSEMだけでいいだろうし,いつまでも古典的な方法を従来の順番通り教えていく必要もないかなあ。学部教育なので「因子分析とか回帰分析とかは聞いたことがないです。構造方程式モデリングしかできません」という学生を作るのもちょっとな,と思っていたんだけど,これからはもうそれでいいかもしれない。

 

来年度のデータ処理法,シラバス大幅変更の予感,です。

 




top