Kosugitti's BLOG

アンドロイドは正規分布の夢を見るか

この画面は、簡易表示です

2015 / 2月

餃子がうまい「札幌や」

俺が人生で一番うまいと思う餃子を食べさせる店、それが大阪市港区の「札幌や」。

縁あって、今日久しぶりに行くことができました。

相変わらずうまい!!!

(null)

餃子がうまいのです。
ラーメンもあるけど、ここでラーメンを食べる腹が空いているなら、その分餃子を食べたほうがいい。

といったのにバターラーメンを食べる先輩。

餃子だけでよかったでしょ?



採点の祭典と項目遊び

講義でIRTを教えているもんですからね,自分のテストの項目が良問だったかどうか,当然チェックしたいわけです。

内容が重複する二つの講義が毎年あって,片方は100人超の大講義なので,普通紙マークシートに回答してもらっています。おかげさまでほとんど読み取りミスもなく,マークシート読取君3FUJITSU ScanSnap S1500 FI-S1500で集計は一気に終了。ここからRを使っての項目分析(採点の祭典)となるわけです。

毎年のデータをマージして,共通の項目で等価。二年経った今でも300ケースないので項目母数は安定しないけど(そんなときはMCMCで推定してみたりして)。まあ基本的に,ltmパッケージのltm関数でやります。

で,項目母数を見ながら考えるのです。あー,この項目は難しかったか,これは簡単すぎるなあとか。今回のテストのピークはどの変だったろうか,と言ったことを。

これを見ていると,サンプルサイズがまだまだ小さいということはあるにせよ,項目母数の中にはひどいものがあるわけです。というか,ひどい方が多いかなあ。

まあしっかり能力推定,というより合格してもらうために,基礎的な知識を問う客観テストにしているし,何より持ち込み可でやるもんだから,精度を求めるもんではないんですが。

そんな中でも,これは綺麗なICCだなあというベスト3がこちら。

RplotICC

Qid7は「次の統計量を表す数式を数式群の中から選び,数式に付与された数字をマークしなさい」という問いのひとつ。

「妥当性」

で,数式群のなかに正解がないから,答えは「(8) 該当するものがない」です。

識別力がかなり緩やかで,困難度も低いけど,これでダメだったらダメだね,ってのがよく分かる問題じゃないかしら。

同様に困難度がもう少し低いのがQid43で,「プロクラステス回転は直交回転の一つである。正しければ1,間違っていれば2にマークせよ」です。綺麗なS字ですね。

お手本のようなS字カーブはQid105「因子分析の基本モデルについて,次の記号は何を意味するか。該当する番号を語群から選びマークしなさい」という問いで,u_{ij}は?というやつ。正解は「独自因子の因子得点」なんですけど,識別力3.11,困難度-0.184ぐらい。ちょうどええ。

 

こういう良問は残していって,悪問(識別力が負になるのが結構ある(´Д` ))を駆逐していく。項目はプールしてあって,Qidという統一のIDが振られているから,従来のデータに基づいて困難度を適当に選びつつ問題を構成してます。

 

被験者母数を線形変換して採点するんだけど,結局小数点は丸めるし,なにより合計点(正答数の総和)との相関が0.9以上になるんだけどね。

ええ,ただの趣味ですよ。ええ。

 



rstan2.6登場〜

rstan2.6が来ましたねえ。今度rstanの導入を人前で話すので,このタイミングでの登場はありがたいかなあ(直前にこられたら対応できないもんね)。

ということで,いつものベンチマーク。今回は,最近見つけたんだけど,rstanの本家サイトで並列化処理のやり方が書いてあったので,これは,と思って取り入れてみました。

関数の前と後ろにproc.time()関数で時間を取って引き算したので,コンパイルも含めて実際にかかった時間がわかるという寸法よ。

まずは母艦から。

rstan2.6Mac

 

やったぜ。速いぜ。15秒ぐらいで出来るようです。あ,数字の「経過」のところが所要時間。上が非並列,下が並列化した数字です。サンプリングそのものは遅いみたいだけど,全体としてはかなり早い印象。あと,並列化すると結果がいっぺんにドバッと出てきて面白いね。

次にUbuntu.MacのParallels10から使ってます。これに8コア,メモリはありったけ(仮想の上限?27764MB)与えてやってみたらこんな感じ。34〜37秒で終わっているようです。

rstan2.6Ubuntu

 

最後にWindows(via Parallels 10)。これも8コアで,メモリも仮想マシンにありったけ(27764MB)のせてます。で,並列処理の書き方が他とちょっと違うので,これで8コアちゃんと使えているのか自信がないけど。43〜44秒ってとこですね。

 

rstan2.6_win

 

ということで,結果はMac>Ubuntu>Windowsとなったわけです。今まではコンパイルの時間を入れてなかったから?Macが遅いかなあと思っていたんだけど,こうしてみるとそうでもないんだよねー。仮想マシンはやっぱり実機にかてるわけじゃないのか。

あと,共通して,並列処理させてもそんなに結果が変わらないってことがわかりますね。

ひとまず。



二分の一成人式

嗚呼…うちにも来たよ、二分の一成人式。

(null)

お手本のように、「皆様からお子さんへのメッセージを見せて、より一層、感謝の思いやつながりを感じて式に挑めるように企画しております」ってよ。

感動を仕込むのって、嫌いやねんなぁ。
夫婦そろって嫌いで、結婚式でも両親を泣かせないことをテーマにしたほどの俺らだぜ。
「さぁ感動しろ」みたいな感じが見えたらサブいやん。それがわからんメタ認知のできない人間にはなって欲しくないねんけどな。

何が辛いって、娘は悪気なく懸命に式の準備してるやろし、俺らが嫌やからという理由で、メッセージを拒否して、娘に嫌な思い出作るのも違うと思うねんな。
犯人探すとしたら、まちがいなく、こういう寒い企画したやつやねんけどな。

俺にできることといえば「これ、お祝いのメッセージっちゃあメッセージやけど、何なの?…」みたいなボケを仕込んであげることぐらいやわ。

学校にクレームつけるのも違う気がするしなぁ。

あーあ。こうやってつまらん人間になっていくんか、俺は。



今日も会社を休んでます

先週末から上の子2人が嘔吐、下痢で休んでいたが、出張帰りの疲れた体で抵抗が落ちていたのか、俺も一昨日から発熱。
久しぶりに寝て寝て、体力回復を目指してます。

昨日は修論審査会という、大イベントがあったのだけど、さすがに参加できなかった。残念です。

今日はそもそも代休をあててたし、子守の用事もあったので、同じく布団の上で生活してます。末っ子がなぜか3日ほど熱が下がらず、お休みに付き合ってくれてる。

明日には復帰できそうです。



今月のお知らせ

  • お知らせのページを管理運営するのが面倒なのでブログの中に入れました。
  • 第二回ベイズ推定ワークショップ-stanによるベイズ推定の可能性と課題-(2015.03.04)に登壇予定です。rstanの導入部分を解説します。ワークショップの詳細については「魁!!広島ベイズ塾」のサイトからお問い合わせください。



top