Kosugitti's BLOG

アンドロイドは正規分布の夢を見るか

この画面は、簡易表示です

2012 / 12月

俺的10大ニュース2013

昨日,ゼミ生と「お歳暮交換会」を実施。クリスマスパーティーのような軟弱なものではなく,英語禁止タイムやお絵描きしりとりなど,なかなかハードな遊びが含まれる宴会だったわけです。

昨夜のそれを持って本年のお仕事はいったんおしまい。まだ研究会や打ち合わせ等の仕事はあるけど,とりあえず大学に出てするそれはおしまいですね。世間様より一足早く仕事納めしました。
既に帰省先からこの記事を書いております。500キロの長旅はしんどかったぜ。

さて,昨日の交換会中,英語禁止タイムを設けたのだけど,そうするとみんな口数を減らすという戦略をとるので,ひとり一人順番に「今年のニューストップスリー(←これで罰金×3)」を話してくというのをやりました。
で,私も恒例の,今年の総括をしておこうと思います。

俺の今年の10大ニュースは,次のようなものではないかと。

  1. 退職記念パーティー実行委員会
  2. 学務厚生部という学部のお仕事を頂きました
  3. 科研費をもらえるようになりました
  4. 北海道学会出張
  5. 出版計画が立ち上がり,実行することに
  6. 娘は大太鼓のセンスがあることが判明,息子は幼稚園に通い始めるし,娘は単語を発するように。
  7. 髪の毛を染めてみたよ
  8. 沖縄学会出張
  9. 膝がアレになっちゃった
  10. ヤマグチ会発足

まずは何と言っても,2月,3月の退職記念パーティー。主に2月の方を担当していて,3月の方はただのお客様だったのでたいしたことはないですけど。30年近く一所で勤めると,こういう人生を歩むのだなあというの色々勉強させてもらいました。自分が退職する頃はどうなっているんだろう,ってやっぱり考えてしまいます。このような会を開くこと自体,一般的ではない時代になっているだろうと思います。やりたがっているわけじゃないよw

次はやっぱりお仕事のことで,毎週火曜日に会議があるような学務厚生部というところの末席に加えていただきました。任期は二年間。学生との対応はもちろん,大学の中でどのように議事が進んでいくんか,仕組みがわかったり情報が入ったりするのを体験。喜びよりも正直ストレスの方が多いお仕事。このお仕事しているからって,給料が上がるわけでなし。まあ社会勉強だと思ってやっているけど,どうしても自分のポリシーとぶつかる時もあります.やれやれ,頑張ります。

3つ目は,科研費がもらえたこと。自分が代表責任者の。若手Bです。分担ではあちこちからもらっていたんだけど,自分が代表になって好き勝手できるお金があることはやはり良いことだと。責任も感じるし,認めてもらえたやりがいも感じるし。

北海道学会出張は,学生三人を連れての遠征で,面子が良かって楽しかったというのもあるし,夜の学会活動もしっかりやったので大変楽しうございました。いつも研究室でやり取りしているのと違う側面を見て色々思うこともあるし,研究室運営の方法について,私自身さぐりさぐりですが,やってみて勉強になった。もちろん彼ら自身も何か,学会当日だけでなくその前後の研究室運営の仕方について,学んでいってくれたらなあと思うわけです。

出版計画については,降ってわいたような話で,最初は後輩の後方支援かと思ったら,いつの間にやら旗ふり役になっていた。まあ面白い話なので,喜んでリソース裂きますけど。来年はしかし,大変なことになりそうです・・・。

後はプライベートなことですね。子どもたちの成長を色々感じられた年でした。もちろん末っ子も大きくなってます。長男と末っ子は同時七五三だったし。まあまだまだガキンチョですけど,可愛いものです。来年もこの調子で可愛く育ってくれれば。長女は音楽会で,これはもう驚くぐらい完璧に,一定のリズムを刻んでました。大太鼓をやる?というのでなんでそんな係なんだと正直思いましたが,パーカッションのセンスがあるんだなあ・・・。

髪の毛を染めてみた,というのもおもしろ出来事ではあったかな。二回ほど金髪に。今は少し明るめの色なんですけど。外見で遊ぶというのは,自分が楽しいのではなくて,周りが驚くのが面白いんだね。特に髪の毛の色なんて,自分の視界には入ってこないところの変化ですから,自分としてはいつも通りの世界が見えているだけなんです。今年何人かに,「ああみえてKosugittiは普通だ」という言われ方をしましたが,もし金髪にしていなかったら普通に見えて普通なわけで,そんなことになるぐらいなら外見で出オチのボケをいれておくことは大事なんじゃないか,と思っています。

あと,学生の卒業旅行で準備運動無しに階段の駆け上がりをしたら,旅行から帰ってきた二日後に膝がぐにゃぐにゃに。軽い肉離れを起こしていたようで,治療に行ったら股関節の固さを指摘されました。十年ほど前に台湾で足つぼマッサージをしたときに,股関節が悪いねと言われたときは何のこっちゃと思いましたが,いよいよ症例になって出てきてしまったようです。今後この股間との付き合い方を考えねばなあ。

一ヶ月に一回,山口市内(山口駅前付近)で飲み会をする,ヤマグチ会というのも発足。そもそもは友人と妻とで出かける感じだったのですが,最近はなぜか恋人同伴の会になっております。出かけるときはベビーシッターを頼んで出るのだけど,そういうやり方もできるのだなというのをやってみて,学んだり。来年も三月までは続けたいなと(四月から友人が異動するので面子が・・・)。

学生指導で悩んだり,学生指導で悩んだり,学生のことで悩んだり,オープンに書けないことが例によって色々あった一年ではあったけど,なんだか徐々に大人になっていってるな,という気がします。情報が集まる,人間関係について多角的に考えることができるようになる,立場的に物を言わなければならない状況が生まれるなど。他人に求められる役割とそれに応えること,それに個人的経験や価値観をどうすり合わせていくか,という「出来事」として語れない「経験」がたくさんあるわけで。ふむぅ。

ま,歳を取るのも悪くないなと思います。

こういうのが脂がのってくるというのだろうか。

このままの関数で行くはずがなく,体力が落ちてきているように,社会的にも学生とのつきあい方も変わっていくはずです。大学内での立場も変わるし,研究者業界の中でも若手でやってられなくなってくる。どうやって最適化していくか,どうやってフィナーレを迎えるか,そういうことも考えながら,とりあえず来年あたりは,相対的にまだ若手なんだから一生懸命お仕事していこうぜ!をテーマにやっていくことになりそうです。

今年の目標だった,愚痴は言わずに意見を言う人間になる,というやつは,後半についてはある程度できたかもしれない。意識してたから。でも相変わらず,お腹がすいたらイライラするし,お酒を飲んで学生相手に愚痴っぽくなります。これは直しておかないと。
子どもを叱りつけたくはないんだけど,いらっとしているとつい声を張り上げてしまうしなあ。それで妻がビビっているのが分かると,心中では申し訳なく思ったり悲しくなったりするのですが,人間ができてないので….今後のテーマであります。

さあ,来年はどんな一年になりますやら。
皆さんも良いお年をお迎えください。



お詫びと訂正とやったね

ちょっと体調が悪くてですね。仕事を早退して昼寝していたのです。

夕方,子どもたちの足音でが覚めて,何気なくTLを眺めていたら,このツイートを発見。

おお,俺の昨日のエントリーについての言及だ,ということで,読みましたよ。んで,間違いに気づきました。いやお恥ずかしい。
それでやり直したらうまく行ったもんだから,Rpubsのコードのほうを訂正してアップしておきます。
間違えた方のリンク(http://rpubs.com/kosugitti/3274)も残しておきますね。どういうエラーで,どう直したのか。自戒の意味も含めて。訂正前の情報を読まれた方,お詫びして訂正いたしますので,ご勘弁ください。

いやー,Rのせいにするんじゃなくて,ちゃんとエラーとかRからの返しをよく読まないといけないね。
Rはすごいというか,俺が浅はかというか。
まあなんにせよ,うまくいくようになったので嬉しいです。
ご指摘ありがとうございました。>>@langstat氏

追伸)2012/12/19付でRstudioがアップデートしてました。mirtパッケージもです。今回の訂正は,R2.15.2,Rstudio0.97.247,mirt0.4.2環境下で作っています。

追伸)mirtパッケージのconfmirt.model()関数で,カンマが含まれている複数行のモデルを書いていて,knitrするとエラーが生じるのは回避できませんでした。ので,Rpubsの方には載ってません。ご容赦ください。



社会調査士のためのこれからの因子分析

R Advent Calendarに参加しちゃったので,なんか考えないと行かんなあ,ということで今までやってきたことをぐるりと振り返ると,やっぱり心理学的調査の業界で生きてきたので,調査データの因子分析というのが(俺の中の)王道なわけです。なので,思うところを書いてみます。
枕が長くなりますので,Rを使ったお話だけ分かればいいやという人は,こちらのサイト(Rpubsコード)に飛んでください。

さて。

私が学生だった15年ほど前は,まだ大学でもメインフレームにTSSで接続するような時代で,調査実習もSPSS/PCをつかうという頃。一回の因子分析に20分かかったので,因子数の決定にも慎重に,ドキドキしながらやったものです。

そういう「ちょっと古い」時代をしっている人間は,データは5〜7件法でとって,それを因子分析するときは主因子解で,Varimax回転するというのが王道だと習いました。斜交回転や最尤法といった技は,97-98年頃,SPSSのバージョンが8?9?にあがった頃にオプションとしてついたのであって,それまでは理論はあるけど計算機がついてこないという時代だったのです。

大学を卒業する頃には最尤法,promax回転できまり!という時代が来たわけだけど,「データは5件法で」というあたりは特に問題視されることもなくスルーされていました。統計学者に言わせると,7件法でギリギリ,9か11件法ぐらいでないと間隔尺度水準と見なすことができないとなることは知られていたんだけど,「だってしょうがないじゃない」という感じで普通に因子分析をしておったわけです。間隔尺度水準がアヤシイとされる3,4件法になるんなら,もういっそ数量化三類(=双対尺度法。名義尺度水準の分析法ですな)にしなさいと言われたり。

ところが10年ほど前から,この「似非間隔尺度水準,実質は順序尺度水準じゃないか」というデータに対して,統計業界から項目反応理論(IRT) を使えばいいじゃない,という話が出てきた。IRTの中でも段階反応モデル(GRM)は,反応が段階でとれるものに対するモデルであり,順序尺度水準のままで分析できるときたもんだ。しかもGRMは数学的にはカテゴリカル因子分析と同じ,すなわち因子分析の姿を変えただけのものであり,ポイントは普通の因子分析を始める時につかう積率相関係数のかわりに,ポリコリック相関係数を使えばいいだけ,という。まあ理解もしやすいわけですね。

じゃあそのポリコリック相関係数が算出できるソフトは,といえば,やはりR。IRTを扱う専門ソフトはBILOG-MGとかあったし,GRM(PCM)を扱うソフトはParscaleというのがあったんだけど,海外ソフトを輸入して買うという,お金がないとやってられないじだいだったわけです。
Rもまだまだヨチヨチ歩きのころで,周りに十分なテキストや解説サイトがなかったので,私も敷居が高く感じていました。

お金がないから仕方がない,とRに手を出したのが,私とRとのそもそもの出会いでもあったわけで。
さて,Rのパッケージltmにpolycor関数が入っている!これで勝つる!と思われたけど,ひとつ問題が。それは,IRTはテスト理論を背景にしていることから,基本的に一因子モデルなんですね。これは困る。心理屋さんは基本的に多因子モデルが好きなんです。もちろん,単純構造を目指すという原則があるから,因子数がわかれば因子ごとにIRT(GRM)をやって因子得点の算出に向かえばいいんだけど,やはり多因子でないとねえ・・・。

ところがどっこい。最近,mirtパッケージがこの問題を解決してくれたのです。なんと因子間相関までみとめて頂ける!モデルも結構自由に書ける!
いやー,Rの発展,展開は最近目覚ましいものがありますね。これで今のところ,変に新しいソフトを買ってその使い方を習熟して,という苦労することなく(Parscaleをdisっているわけではない。パー助はパー助で可愛かったんです。),いつものRスクリプトでやりたいことが全部できるようになっちゃった。

ということで,話が長くなりましたが,これからの因子分析は
1.5件法ぐらいであれば,ポリコリック相関係数をもとに並行分析等で因子数を決定し,
2.多次元段階反応モデルwith最尤推定&プロマックス回転で尺度水準,抽出法,回転法もばっちり!
という方向性に進んでいくと思われます。

「5件法をまんま主因子法varimax回転」が許されるのは小学生までだよねー!

という時代が来るかどうか分かりませんが・・・ウヒヒ。

さあでは,実際にRでやってみましょう。以下ではコードと出力の一部を書いていきますが,結果を伴うRpubsの方にもリンクを貼っておきます。

それでは4件法の順序尺度水準で得られたデータを因子分析する例についてお話します。
従来通りの因子分析の方法,段階反応モデルを使った方法,多次元IRTを使う方法,の三段階にわけて比較検討しながら進めてまいります。

今回は次のパッケージをご用意ください。

サンプルデータはltmパッケージにあるScienceデータを使います。4件法で7つの項目があります。

従来はこうした4件法であっても,(無理矢理)間隔尺度水準とみなして分析していたわけです。
すなわち,相関係数の出し方がピアソンの積率相関係数で,それに基づく因子分析だった。
ちょっとやってみます。まず間隔尺度水準に置き換えます。

積率相関係数とポリコリック相関係数を比較します。ポリコリック相関係数は,ltmパッケージが読み込むpolycorパッケージにあるhetcor関数で,変数の型にあった適切な相関係数を出してくれる関数。

これが結果。ピアソンの積率相関係数。

ポリコリック相関係数はこちら。

結果をみると,ポリコリック相関係数のほうが数値が大きい。逆に言うと,順序尺度水準の変数を無理矢理間隔尺度水準とみなして積率相関係数を出すことは,不適切なモデル適用によって値が過小評価されちゃうことでもあるわけです。

で,普通の因子分析というのは,連続変数とみなしたデータに対して固有値分解し,因子数を決めたりするわけですね。
因子数の決定には,psychパッケージのfa.parallel関数による並行分析がいいかも。

まあ結果は変わらないんですけどね。

因子分析も連続変数と見なした古典的方法と,ポリコリック相関係数をつかった方法,両方で見てみましょう。
まずは古典的方法から。

ポリコリック相関係数を使った方。

これまた結果は大きく変わらないのですが,後者の方がやや大きい負荷量が算出されている。前者の方がやや「目減り」していたわけです。

後者がカテゴリカル因子分析のやり方ですが,いったんhetcor関数でポリコリック相関係数を算出させるあたりがちょっといやですね。
ということで,ルートとしては,この因子分析の結果を受けてIRT(GRM)ということが考えられます。
最近,psychパッケージにirt.faというポリコリック相関係数から因子分析できる関数が追加されました。
変数は数値型(Factor型ではない)で渡す必要がありますが,次のようにします。

結果の全体像をみるには,print関数でshort=Fオプションをつけましょう。

まあ他にも色々できるようですが,まだちょっと関数の挙動が怪しかったりします。

IRT(GRM)をやるには,以前からある専門のltmパッケージ使った方が確実かも。
今回第一因子はTechnology,Environment,Industryからなり,第二因子はFuture,Work,第三因子はBenefit,Comfortからなるわけですから,ltmパッケージのgrm関数を使って,

とすることができます。

もっとも,これだと因子間相関がでないですね。IRT(GRM)は基本的に単因子モデルですから。
これを多次元モデルにするのがmirtパッケージのmirt関数です。数値型の変数を渡して,

となります(警告が出るのでちょっと推定がうまくいってないかもです)

ちなみにmirt関数は確認的にモデルを書くこともできます。
confmirt.model()関数で3つの因子と対応する項目番号から,次のようにモデルを描くことができます。

とまあ,このようにかなりカテゴリカルな因子分析ができる環境が整ってきているわけです。
ltmは安定した答えを出してくれますが,psychパッケージやmirtパッケージはまだちょっと不十分かな,とおもうところがなくはありません。
その辺は今後に期待ということで。

余談ですが,もっとちゃんとしたいという人は,M-plusというソフトがありますよ。

補遺)時代背景については,あくまでも私の個人史からのお話ですので,ご容赦ください。ちなみに私は1994年にKUに入学,1998年〜2003年はKGにおりました。



政党と政策のプロット

先日こんなツイートをしましてね.

 

 

 

で,自分で言うときながら,「この3つの論点が独立でない」ってのはどんなイメージになるんだろう,とおもって,分析してみました。

 

分析には,Rと青木先生のサイトhttp://aoki2.si.gunma-u.ac.jp/R/ とこの選挙総合サイトhttp://go2senkyo.com/blog/archives/6265 を使います。

 

選挙サイトの情報がちょっと古いかもしれない(今日現在で,日本未来の党にかんする情報が載ってなかった)が,一応「消費税」「原発」「TPP」について,賛成,反対,意見保留(条件付き,あるいは分からない)の三段階がある。これをデータにして,双対尺度法で分析,プロットしてみた。

ソースコードはRpubs http://rpubs.com/kosugitti/3022 にアップしました)

結果は次の通り。

f:id:kosugitti:20121203135822p:plain

左下でゴッチャリしているのは,「共産党」「新党大地」「日本新党」が全く同じ(全部反対)なので座標も同じになっちゃう。自民党と公明党もこの3つに関してはほぼ同じなので,右下でかぶってる。

 

ま,意見保留・条件付き,をどう評価するかにも依るんだけど,日本維新の会は結局自民,公明と同じ方向性ということ。そういう意味では,第三極じゃないんだよなw

みんなの党国民新党は,左・右の真ん中あたりを狙ってるのかな。民主党は幸福実現等と同じ方向性にいっちゃったねえ。

これだけみれば,現政権系,右派,左派,という別れ方みたいです。

 

さて,政策の相関関係なんだけど,意見保留・条件付き(△)を無視して,賛成(○),反対(×)だけを結んだ補助線をいれると次のようになる。

f:id:kosugitti:20121203135826p:plain

これを見ると,消費税の賛成・反対と,原発問題はほぼ直交する議論であり,TPPの参加・反対は両者と相関する話(ただし原発問題と相関は高い)なのだなということがわかる。

 

これは12月03日現在の話で,今後二週間の間に態度を変えてくるところも出てくるだろうし,この3つ以外の論点もあるんですけど,ちょっとは投票に際して考えやすくなったかなあ。

 

 

 

 




top