Kosugitti's BLOG

アンドロイドは正規分布の夢を見るか

この画面は、簡易表示です

2011 / 5月

クラスター前の下ごしらえ

このところ頭を悩ましていたのが,大規模データの分析。
デモグラフィック変数とか,複数の心理尺度などからなる調査データで,たくさんのデータはあるのだけど,どの角度からでも切り込めるというか,切ったら切っただけの解釈の仕方がある,というようなデータ。
よく言えば探索的,悪く言えば調査の設計が雑だったんだな。人の振り見て我が振り直せ,と言われてしまいそうだ。

ともかく,どこからどうやって手をつけたものか悩んでいた。従属変数は決まっているんだけど,独立変数が質的・量的にも色々ありすぎる。
まぁこういうときはクラスター分析で,ざっと回答者をグルーピングしてからやればいいや,ということになった。

さて,クラスターの数を決めるときは,mclustやpvclust(@takachikoさん,ご教示感謝します),clusterSim(@bob3bob3,ご教示感謝します)なんかがあるということで,色々やってみたのだけど,まぁうまくいかない!(笑)
理由は何かって,投入した変数が多すぎるんです。モデルフィットや情報量からクラス数を決めようにも,あまりにも計算量が多かったりするのでRがフリーズすることしばしば。出した答えが1componentとかだったら真実かも知れないけど放り投げられた感もあって。

そういう汚いデータの場合,コホネンの自己組織化マップなら何とかしてくれるかもしれない。と,分類させてみたら,これはまあソコソコうまく分類してくれるんだけども,これだって分類サイズ(第二層のユニット数)については何も教えてくれないわけで。マッピングしてみても変数が多すぎて,何でどう分類されたのやら。

という中で,今回思いついた方法。

  1. SOMで分類する第二層の数を数個〜数十個にして,とにかく「質量ごちゃ混ぜで分類するだけする」ことをして,
  2. 決定木やランダムフォレストで分類番号を従属変数とした分類をすると,分類に効いてる変数が見いだせる(ランダムフォレストのImportanceとか,決定木で最初に使われる分岐変数など)。
  3. 要はその他の「たくさんの変数」は分類に効き目がないってことだから,効いてる有効な変数(少数)に絞ってクラスタリングする。

という流れ。
SOMの実行はそれほど重たくならないし,収束したかどうかの判断も出来る。ユニット数を何パターンかやりながら,ランダムフォレストを使って「分類にもってこいの変数探し」をした。

これで使うべき変数を見つけてから,mclust,pvclust,clusterSimにお出まし願って,分類していけば良いのじゃないかというはなし。
クラスター分析前の下ごしらえとしての,一手法。まぁ素人が素人なりにもがいた結果といいましょうか。

これぞ,ザ・捨て多変量解析!

一応,簡単なコード。データのところなどはダミーにしてあります。

[crayon-5bcac3746a85a024089527/]

ちなみに,大山鳴動して鼠一匹といいましょうか,今回の結果一番効き目のあった変数は,態度尺度でもメディア接触頻度などでもなく,年収と勤務形態でした!
大事なことだよねぇ。心理尺度の値なんかよりも!(笑)



AKB勢力図を描いてみる

AKBがいま選挙中ですね。

クリギング手法の練習として,次のようなことをして遊んでみました。

まず,AKBトップ20名の顔写真を一組ずつ見ていって,類似度評定(七段階)。
これで作られる類似度行列を多次元尺度法で2次元空間にマッピング。
さらに,現在の得票数を三次元方向のデータと考えて,クリギングによる等高線マップを描く。

コードは次の通り。

[crayon-5bcac3746bfde443874795/]

出来た画像がこれ。

f:id:kosugitti:20110530161121j:image:right

白くなるほど高度が上がる=得票率が高い,ということ。
これを見ると,山が3つ,少なくとも2つあるということがわかる。つまり,単峰ではないのだ。グループの中でファンの好みが散らばるから,みんなそこそこ満足したりするんだろうね。
宝塚のスターを類似度評定して人気投票したとしても同じようになるかな?あっちは単峰なんじゃないかな。何となく。
ブランドイメージとしては,どちらの戦略が有効なんだろうか。

あるいは,AKBに入っていない人を類似度評定してマッピングした場合,予想される得票数なんかも算出できる。あたってるかどうかは別にして(笑)

今回は学生(サンプル1)が類似度評定したので,これで根拠のある何かが語れるわけではないけど,とりあえず技術はゲットしたぜ!
あとはバリオグラムの推定なんかについて,オプションを使いこなせるようにならないとね。



歯が抜けた

娘の歯が抜けた。記念すべき一本目。したの前歯。
しかし、寝ている間に自然に抜けたようで、抜けた歯の行方がわからない。
掃除したら出てくるのかな。あげたお布団に挟まっているのかな。

近々、隣の歯も抜けるだろう。大人になってく。



2011年度若手研究(B)の審査結果

↓この記事をみて,情報が開示されたことを知った。敗戦から何を学ぶかが大事。俺も自分の結果を顧みてみよう。
2011-05-17 – 発声練習

今回エントリした分野は社会学。若手Bの採択率が29.9%で,分科(社会学)内は38.3%。細目の中では37.4%。

俺のおおよその順位は「B」,つまり「応募細目における採択されなかった研究課題全体の中で、上位21%〜50%に位置していた」レベル。

前回,ほぼ同内容の研究計画で「A」だったので,下がったなぁ。Aを取った研究計画を推敲して下がった,というこの事実をどのように受け止めようか。こちらの変化なのか,評価者の変化なのか・・・うむぅ。

さて,「評定要素ごとの結果」である。結果は次の通り。

評定要素 あなたの平均点 採択課題の平均点
1.研究課題の学術的重要性・妥当性 3.25 3.39
2.研究計画・方法の妥当性 3.25 3.27
3.研究課題の独創性及び革新性 3.25 3.26
4.研究課題の波及効果及び普遍性 3.00 3.31
5.研究遂行能力及び研究環境の適切性 3.50 3.52
6.研究計画と研究進捗評価を受けた研究課題の関連性 (該当なし) (該当なし)

うーん,どこかが飛び抜けて悪い,というわけではないのかな。強いて言うなら,1.と4.か・・・
でもこれって,「テーマが全体的になんか駄目」ってことなんじゃないか?!Σ(ToT)

しかもその次の項,「(2)【審査の際「2(やや不十分である)」又は「1(不十分である)」と判断した項目(所見)】」は,どこにもチェックが入ってないという・・・

つまり,「何か・・・悪くはないけど・・・まぁ駄目」ってことなんじゃないか?!

最後に,

3.その他の評価項目の評定結果
 (1)人権の保護及び法令等の遵守を必要とする研究課題の適切性について
  ?「法令遵守等の手続き・対策に不十分な点がある」と評定した審査委員はいませんでした。
  ?「法令遵守等の手続き対策が講じられておらず、研究を実施すべきではない」と評定した審査委員はいませんでした。
  ?「記載内容が不十分であるため、法令遵守等の手続きが講じられているか不明であり判断できない」と評定した審査委員はいませんでした。

 (2)研究経費の妥当性について
  ?「研究計画の内容から判断し、充足率を低くすることが望ましい」と評定した審査委員はいませんでした。
  ?「研究経費の内容に問題がある」と評定した審査委員はいませんでした。

ですって。

つまり・・・どこが悪かったんだってばよ!(笑)

あー,どうしようかなぁ。
来年度もこれと同じ研究計画で行くか,この「全体的に否定された」テーマそのものを変えてしまうかだよなぁ・・・。

しばらく悩んで,次のチャレンジにつなげるとするか。



娘の登校事情

最近,泣いたり泣きそうになったりしながら,下校してくるらしい。
登校も楽しいシーンではないようである。

一緒に行ってくれる子,帰ってくれる子がいないというのがその理由。
登校については,近所の子がいるのだけど,ケンカしたのかソリが合わないのか,一緒には行けてないようだ。
今日も窓から娘の様子を見ていたら,娘はその子を待っているのだけど,その子が目の前をタタターッと駆けていって,それを呆然と見つめる娘。
少しうつむいているので,「泣きながら帰ってきたりするかな」と思ったけど,しばらくすると顔を上げて歩き出したのでまぁ良しとする。

下校については,お友達と一緒に帰ろう,と言ったけどその子達は走って帰っていって,また置いてけぼりを食らったという話。

まぁ,そういうこともあろうなぁ。要因はいくつか考えられる。

  1. 二月生まれで発育が遅め,足が遅いという娘の身体的特徴
  2. 長女気質で,周りの年上の遊びにはプライドがじゃまして?入っていけない娘の性格的特徴。
  3. 同年代の仲良しが皆引っ越してしまったという社会的要因。
  4. 周りの子供達は既に別の遊ぶグループを形成している(幼稚園が同じなどで)という集団的要因。
  5. まぁ両親が地域コミュニティに入れてない(入ろうとしていない),という集団的要因その2。

さて,この話,親としては「かわいそうだなぁ」と思うが,問題視してはいない。こういう問題は,どこにでもあることだし,社会的状況やタイミングの問題だったりと,彼女自身が変革できる話ではない。つまり,彼女自身がうまく対応していかなければならないのであり,しかもそれができている(顔を上げて歩き出している)。
聞けば,クラスの中ではお友達と遊んでいると言うし,それでなくても家庭内できょうだい関係,親子関係は良好である。であれば,家の中でしっかりと自己肯定観を高めてあげて(それが集団的要因にさらに影響することもあるのだけど),状況を突破するか,突破できなくても自分が壊れないようにガードするか,という解決する力の源としてもらえればよい。

もっと助けてあげるべき,といった声もあろうかと思うが(そして心の中では何とかしてやりたいとも思うが),見てるだけー,というのも親の仕事なのだ。

頑張って人生楽しめるようになりなさい,娘よ。



【読了】「動物にとって社会とは何か」

タイトルに「社会」とあるので,読まねばと思って読んだのですけど,こりゃあ面白いねぇ。

生物学はやっぱり面白いねぇ。
チョウもカエルもバッタも面白いねぇ。

特に,個体と種のことについて,明確な定義と共に書いてあるのが良い。
そして,同種異性を見つけることがいかに大切か,ということについて,しっかりと考えないとなぁ,という気になる。

これを読むと,社会というのは個体とは別のレベルに存在する,というのが明らかであるように思えるのだよな。それを人間社会に当てはめて良いのかどうか,批判的に検証しなければならないだろうけど。

人間は,他の動物とちがって,本能的にやっていることを社会化してしまって,自然のコントロールから外れている,というのが著者の主張。言い換えれば,人間は動物的でなくなっているっていうのが結論なのかもしれない。少なくとも,人口のコントロールが人工的にも出来てない,という点は読み手に「人間が作った社会というのは何か」という問いを突きつけるのだ。

それが,「心」「内部状態」「意識」「自己」「自我」というものの存在と表裏一体の関係にあるように,思えるのだ・・・。



科研費に落ち続けること早幾年

イヤー,今年もだめでした,科研(若手B)。
赴任してから自分の名前ではひとっつも通らない。やっぱり業績が薄っぺらいんですかねぇ。
研究計画書ももう少し書き直しましょうかねぇ。

今年は制度が変わったと言うことで,発表が一ヶ月遅れになった。なんだかんだで,若手Bの予算が増えたということもあって,ひょっとしたら・・・と一ヶ月ドキ☆ドキしておりましたが。
宝くじと一緒で,もう途中で「お金に振り回されている自分って,研究者として駄目だな」と思ったり。真実は一つでもとらえ方はいくつかあって,確かに外的資金獲得の有無みたいなもので研究者を評価するのも駄目だし,それに全く無頓着なのも駄目だと思うので,出来れば獲得してから「けっ,あんなもん関係ねぇ」と言いたいわけです。獲得してからでないと,ただの負け惜しみになっちゃう。
あと,自分のことを「研究者としてはたいしたことをしてませんので」と自己紹介するようにはなりたくないんだ。そうなったら,自分も自分が大人になったことを認めますけど,今の年齢でそういうこといってちゃぁ駄目だと思うので。

論文,書こう。研究にもっと精を出そう。反省するべきポイントは多すぎて困るほどだ。それもすべて,自己責任だ。この苦しみに耐えねばならぬ。

うーん,それにしても,研究・教育のやり方について,毎年徐々に自分が変化しているように思えるんだなぁ・・・。これを成長と言うかどうかは別にして。あと,この感覚って,なんか不思議なんだよな。どうやって言葉にすればいいのだろう。

俺が駄目になっていなければ良いんだけど。

「堕落はいかん。まぬけは仕方ないが堕落だけはいかん。」by鳥坂先輩



【読了】入門 哲学としての仏教

仏教を哲学的に見るのはよいが,科学的にまで納得できないことが残念。
すなわち,仏教にはこうある,と述べてあるだけで,ふむむ,とは思うけれども,最終的には信じるかどうかの問題になっちゃうんだよなぁ。

あと,歴史的流れをもう少し丁寧に説明してもらえればなおよし,というところか。こちとら教養がないものでね。



私論 被災者の心理を読んで-補遺

その人(Aさん)の豊かさは以前のまま100であり,私の豊かさが震災によって20になった場合,Aさんが100を120にし。120-100=20の20を私に支援してくれ後すると,Aさんにとっては20%アップの試みだが,私にとっては20が40になる100%アップなのである。つまり,支援する側は小さいと思っても,される側にとっては大きいのである。避難所のおばあちゃんが学生ボランティアにいう「勉強しいや」の言葉が意味しているのはこのことなのだが,被災者のまずもっての目標は以前んのAさんなみの100なのである。決して震災のあと残ったAさんの100と私に残った20の合計たる120を二分した,Aさんも私も60という平等性を求めているのではない。つまり,Aさんの100の状態を60にするといった単式簿記的な判断を被災者名することはできないのである。この意味で,「自分のことと受け止めて!」の言葉に込められた被災者の願いは,切実なアピールなのである。

本書より引用。この文言に,目が開かれる思いがした。
自粛することは被災しなかったAさんの100を80にして,被災地に20を送ることでしかなく,それでは全体のパイはかわらない。
日本に今足りないのは,人口が絶対的に減っていくことに起因する内需の縮小であって,税収を上げることで回復するとは考えられない。

そして,カウンセラーを志す学生たちも,是非考えてみて欲しいのだ。
自らが強くなることで,全体が良くなることを。
自らが手出できる,いわば見下した他社に施しをくれてやることで,自己満足することの浅はかさを。

イチローは,チームが不振なときほど,個人のプレーにこだわろうとする。個人の質を保とうとする。
チームになる前には,個人の質が求められていたはずだ。個人の質が高くなって,余裕ができるのでチームプレイが出来るのだ。チームプレイがうまくできないとき,個人に戻ればいいじゃないか。それを「独りよがりだ」とチームを前提にしたネガティブなことと捉えるのは,集団力学が悪い方向に働いたときの典型例なのである。

じつは,それは当然であり,いいことなのだ。少なくとも,維持可能な(sustainableな)方略であり,一時的にまとまったコンテンツ,パターンとして成立し得ない人生,生活,日常において,大事なアプローチなのである。

学問として,研究対象として自称をとらえようとする場合,どうしてもワンショットの,まとまりのあるコンテンツとして提示し,そこに原理,理論,方法,モデルが示されている必要がある。
実の生活は,もっと「どうしようもない」ことだらけである。
それに真面目に向き合わなければならない。

具体的な事例を研究対象にして,理想を追い求めたが,現実の壁に阻まれてうまくいかなかったところもある,というのなら,良い。
具体的な事例を研究材料にして,どうせ結果は同じだからと適当な研究をして適当な結果を出し,いたらないこともあるよね,というのは,駄目。

ポイントが,言いたくはないけど,研究者の「生き様」にかかっているのだ。
本当のところは評価のしようがないんだけれども,それを追い求めなければならないのだ,少なくとも個々人は。

そしてそれは研究のような「コンテンツ」だけでなく,人生においても同じスタイルが必要なのだ。




top