Kosugitti's BLOG

アンドロイドは正規分布の夢を見るか

この画面は、簡易表示です

2010 / 10月

「データ分析のための線形代数」は本当によい本です

データ分析のための線形代数

データ分析のための線形代数」は本当によい本です。5章,6章の辺りに多変量解析の秘密が全部書いてある。

秘密,というのは私にとっては本当に「秘密」とされていて欲しくて仕方のない情報だったからである。
学生時代,今は亡き辻岡先生に因子分析法を学んでいたところ,行列の演算は教わるのだが固有値解法は教わることがかなわなかった。行列がベクトルに分解できるのです,と言われても「それはなぜですか」と聞きたくなる。ので,聞いてみたら,「学部2年の君にはまだ早い」と言われた。専門家だけが知っている秘密があるのだな,とそのとき悔しかったのが未だに記憶に残っているのである。そこから自学自習して,固有値というキーワードを見つけ,線形代数の本をあたり,やっとその答えを見つけた。今から思えば,確かにいきなりこれを講義で教わったってわかんなかったよなー,と納得さえする。その悔しさもあって,拙著「社会調査士のための多変量解析法」では辻岡先生のノート+α,ぐらいまでは踏み込んで書いてみた。

私の本で,十分かどうかといわれるとそれはわからない。一つのヒントを増やした,というぐらいの意義しかない。むしろ,+αじゃなくてもっと教えてよ,となる(特異な?)人もいるかも知れない。

そんな人にはこれ。この本ですよ。「データ分析のための線形代数」は本当によい本です。5章,6章の辺りに多変量解析の秘密が全部書いてある。
固有値分解でどのように行列が分解されるのか,ベクトル空間をどうやって見つけ出すのか,それはどのような性質があるのか,データとどう対応しているのか。それぞれ図入りでていねいに解説してある。計算も出てくるが,そのプロセスを逐一表記してあるので,中学生程度の「文字と式」が出来る人は理解できるようになっている。

来年度の院の統計授業ではこれをテキストにする。臨床家を目指す数学嫌いの人間でも,これなら出来るはず。
久しぶりに間違いなくお薦めの一冊です。



ありがとう,AEON

先ほど,カード会社に電話したら,「既にそちらの旧カードを紛失されているということで,こちらで処理させていただきます。10日後には残高とポイントの引き継ぎが出来るようになります」とのこと。

うわーい,ありがとう!

これでこそ電子マネー



一万円をハサミで切って捨てた

先日新しいクレジットカードがきた。そろそろ期限切れになるからだ。
古いカードにハサミを入れて捨てた。

今日,買いものにいった。お金の支払は,そのクレジットカードについているWAON機能だ。
支払おうとしたら残額がゼロだという。おや,買いすぎたかなと思ったが,そうではなかった。ゼロなのだ。
その時にいっぺんに理解した。

前のカードに一万円ぐらい,電子マネーが入っていたのに,それにハサミを入れて捨てちゃったんだ!
残高はクラウドで管理しているんじゃなくて,物理的なカードにあるICで記録してあるんだ!

ぎゃぁぁぁぁ・・・


落ち着いて考えてみたら,コレで儲けたのはカード会社だよな。こうやって小銭を稼ぐのか。結構な稼ぎになるとおもうなぁ。チクショー!

(翌日訂正)ちゃんと対応して,帰ってくることがわかりました。ありがとうございました。会社名を伏せておいて良かったですw



念願の二色鍋

大人と子供で味が違っても大丈夫,なお鍋を買いました。これで気兼ねなく辛いスープのお鍋も楽しめる。

実際にやってみて,一つでメリットがある。
一方のだしが少なくなってきて追加するときなど,両方のだし温度が異なるときに火加減が難しい。

でもまぁ,それぐらいのデメリットを補って余りあるメリット!



見えない汚れ,みたいな

8月の末に肺炎だといわれ,その後熱は下がって普段の生活になんの支障もないようにはなったのだが,医者には「呼吸音に雑音が・・・」と言われて薬を処方されている。喘息の薬だ。

その後,ほぼ丸一月その薬を飲んでいる。で,飲み終わったら診察に行く。

今日も行ってきた。三回目かな。
そろそろ「治りましたよ」と言われるかと思ったが,「ぐっと良くなっています。薬はきいてます。この調子であと少しやりましょう」と言われた。

医者の言い方は「長期的な治療になって,根絶したい,この方針に賛同してくれますか。協力してください」という感じ。しっかりした口調で,目を見て力強く言ってくれるので,よし付き合うか,と思っているが,未だに薬が処方され続けるのでだんだん嫌になってきた。

「日常生活上は特に気づかないかもしれませんが,ぐっと良くなっている」と言われてもなぁ。
日常生活上気づかなかったら,別にええんちゃうんか。

「見えない汚れ」はもはや汚れでない,と思うんだが,違うのか。

しかし,途中でやめたら余計ひどくなるとか,完治しないと逆に良くないとか言われそうで,「痛みがなくなったら来なくなるバカ患者」とか言われたくないから,協力はするけどさぁ。モチベーションが上がらないんだよなぁ。

モチベーションを下げるもう一つの理由は,薬代の高さだ。今日も診察と薬代を足すと4000円ぐらいかかった。
これだったら,飲み会に行ってる方が心理的に健康なのだ。

「医者に行くから病気になる」というのは紛れもない真実だ。

釈然としないまま,もう少し医者を信用してみるか,と諦めの境地です。



事務と制御と効率化

公的資金の不正利用禁止に関する講習会に参加してきた。というか,参加させられた。

うちの大学は,最近,研究費の不正利用で有名になっており,今月の上旬に学内報告書がでた。
処分も既になされているが,お上らの処分がまだであり,ひょっとしたらすごい処分があるかもしれないので,学内はこんなにも改善しているのですよ,ということを猛烈にアピールする必要がある人のこと。

身内の恥をさらすようだが,1億9千万円の不正利用があって,それに関与していたのが30余名。
うち1億6千万はひとりの犯行だという。
ほなそいつだけの問題やんか・・・と思うのだが,そうもいかないそうで。

問題は,研究者と業者の癒着にあるという。ほとんどが現場発注で,そこで不正が行われていたというのだ。
で,今後の方針は「現場発注の原則禁止」
(電子システムに)入力,承認をまって,財務部契約課が発注,業者から大学に納品,研究室に届けられる,という順番になる。

しかし,こまったのは数十万円しか研究費をもらってない文系の我々にも同じルールが課せられるということだ。
不正のしようがない程度の少額なのだが・・・
これでは,ペン一本,消しゴム一個買うのにも,数週間前からの発注手続きがいるということだ。
さぁて今から採点の祭典だ,売店に行って赤ペン買うか,となっても対応できないので,自腹で買うことになろう。
そしてこれは,給料が目減りしていることに等しいのだ(F先生談)。嗚呼。
めんどうだなぁ。

このプロセス,誰も幸せにならないというところがミソ。

こういうことをするのなら,同時にシステムに対応した便宜というのをはかってもらいたい。
真っ先に思ったのは,秘書が欲しいということだ。
別に不正利用したいわけではないので,秘書に○○かっといてー,で済むのならそうしたい。その秘書係を事務がやってくれてもいいよ。とにかく,研究者の研究にかかる時間をこれ以上削らないでほしいのだ。

そうでなければ,せめて,せめて!書類に印鑑を付く手間を省かせてくれ。
書類は書くので,それをメールで送れるようにしてほしい。
いまは,書類を書いて,うち出して,判子をついて事務に提出,なのだ。事務までちょっと歩いていく時間が無駄で面倒なのだ。入力システムがIT化しても,それをオフラインで運用する箇所が残っているのなら意味が無い!

なんか,ルールの作り方が下手くそだと思うんだよな。そうすると,制御も効かなくなると思うのだが・・・。

ヤレヤレである。



「若者殺しの時代」と生きたシステムの設計

若者殺しの時代 (講談社現代新書)

若者殺しの時代 (講談社現代新書)を読んだ。若者論,時代論としてかなり面白い良本。オススメの逸品です。
著者のホリイ氏は週刊文春で連載「ホリイのずんずん調査」でも有名で,本書もそこの調査データを一部,再編して用いているそうだ。
この調査,社会心理学の業界で言う「社会調査」とは違う。どちらかというと,社会学的。面白い切り口からデータを持ってきて議論するスタイル。

例えばラブホテルの歴史的変遷を論じた「愛の空間 (角川選書)」のようなアプローチ。本書にも,若者の恋愛事情の変遷を雑誌記事やその見出しなどから探っているので面白い。

基本的なテーマは若者。「未熟な大人」から「若者」という消費者層の形成。今の時代は団塊の世代が作った右肩上がりの成長をもとにしたシステムであり,このシステムが80年代に消費者層としての「若者」を発見,形成し,取り込んだ,と。90年代はそれに引きずられ,今もそのシステムを何とか延命させようと社会中が躍起になっている,という見方は,90年代前半に大学生=若者になって,バブルの残り香しか嗅いだことのない私も,非常に共感できる。
それから比べると,今大学生をやっている最中の世代は,上の世代から「もっと楽しめよ」とよくわからない雰囲気を強制され,かわいそうっちゃぁかわいそうだよな。生まれてこの方,好景気という時代を知らないのだから。

この本の評としては,Chikirin氏のブログにもいくつかある(例えばこれとかこれとか)ので,参考にしてみてください。

私が一番興味を持ったのは,最終章だ。それは,社会をシステムとしてとらえ,そのシステムの平均寿命についての考察だ。

日本が近代国家を始めたのが1868年。そのシステムをやめたのが1945年。これは78年もった。大敗戦後のシステムは1945年に始めて,さてどこまで延命できるだろうか。
早いとこ2015年。もって2030年だ。

と氏はいう。ちなみにエンゼルバンク ドラゴン桜外伝(1) (モーニングKC)でも日本というシステムがもう限界に来ているよ,と論じている。
そしてその感覚は,正しい。

ただ,例えば江戸時代は300年ぐらい続いたわけで*1,長生きするシステムの作り方が無いわけではない。
あるいは,うまく作ればもっとハッピーに死を迎えられるシステムだって,考えられるかもしれない。

そういう「長生きするシステム」のヒントは,安定しないこと,柔軟性と安定性のバランスが取れていること,にあるに違いない。
樹齢数百年の樹は,堅さと柔らかさをうまく使い分けて,時にはねじねじしながら,時には力強く踏ん張って,長生きしている。
支柱をたくさんいれてガチガチにした建物は,壊れにくいかもしれないが変更もきかない。機能的にうまくいかないことを構造が許さない。

生きたシステムを作るための,構造の設計はどうあるべきか。社会心理学者にとって,こういった視点から集団力学を捉え直していきたいと思うわけである。

*1:詳細に見ていくと一つの時代ではない,という意見も歴史家にはいわれそうだが。



料理にたとえる

最近,研究指導に当たって,料理をたとえに出すことが多い。

研究レベルについての説明では,以下のように言う。

学部生はまず,材料とか調理法のイロハを教える。目標である卒論は,おいしい家庭料理。
うちのカリキュラムでは卒論の前にミニ卒論(プレ卒論)を書かせるが,それは飯ごう炊さんのレベル。材料を集めて,何とか食べられたら良し。味は問わない。
修論のレベルは,商品として振る舞えるレベルの料理が目標。おいしいこととお金を取れること=意義があること,が目標。

研究プロセスについての説明でも結構つかえるメタファーなのだ。
前回のエントリー,心理尺度集は何が悪いかというと,「お肉 100gあたり30円」というものがスーパーで売っている,という感じだから。

先日,院生が「心理尺度集を見たら該当する物がいっぱいありすぎて困った」といって相談に来たので,「よかった」と言った。皮肉でもなんでもない。
心理尺度集をつかって論文を書くというのは,いわばカレーを作ろうと思ってスーパーに行ってやすいお肉を買ってきた,というものだ。その「お肉」も,牛なのか豚なのか鶏なのかによってできあがる物が違うわけで。まだ何カレーか決まってないのに,まずスーパーに行くなよ,と。そこで「お肉って,こんなに種類があるんだ」と思って手が止まったのは良いことですよ。

もちろんカレーですらなく,「なんかおいしいもんをつくろう」という段階でスーパーに行くのは,言語道断。家庭料理でも何を作る科ぐらいは決める。修論なら,お品書きが決まって,大体どれぐらいの値段がつきそうかということも把握しておかないと行けない。

逆に,材料とか調理法にこだわりすぎて,手が動かないこともある。なんかすごい料理を作ってやるぜ!と色々考えて,その中でこれは食材が駄目だ,これは調理法が駄目だ,これは思ってた味と違いそうだ,と悩みすぎて一品も出来ない,というやつ。締め切りギリギリになって,インスタントが出てきたら,それはそれでアウトでしょ(家庭料理なら許されるけど)。

そんな感じで指導しています。

余談)統計法を調理法にたとえたのは木下冨夫大先生が最初?



心理尺度集は使うな

後期に入って,学生や院生が指導を求めてやってくることが増えた。

指導していて嫌になるのは,「ある概念AとBを思いついた,尺度集を見たら尺度があったので,それを両方いれて調査票を作った」という計画の場合だ。
これで有意差が出るでしょうか,関係があると思うのですがどうでしょうか,と相談されると辛い。辛いを通り越して,立腹することもあるし,憤死しそうになることもある。ちなみに,最も困るのは「やったのですけどどうでしょうか」と調査データがある場合だ。やっちゃったらどうもこうもねえよ。

関係があるか,といわれたら,個人内の反応である限り完全に独立していることは少ないだろうから,どこかに有意なパスぐらいひける。Nが多ければなおさらだ*1

何が困るのか,というと,それが明らかに研究計画と実際のデータに整合性がない,ということがほとんどだからだ。

研究の相談に来られると,まず研究計画を聞く。どういう概念を重要視していて,それらがどのような関係になると考えているのか,を問う。ここが明確に答えられない場合は,問い詰める。俺は調査屋と思われているようだが,質問紙調査は始める前に,デザインの段階で九割方成功するかどうかが決まっている。もちろん実験でもなんでもそうだけど。

心理学的な構成概念というやつは,目に見えないものだけに,しっかり定まったかどうかの判断ができるかどうかがキーになる。多くのつまらない研究は,構成概念的な妥当性がないものを追い求めていることに起因している。
たとえば自尊心,ストレス,対人相互作用という初歩的な?一般的な?概念一つとっても,本当にそんなモンを想定する必要があるのかどうかは議論が分かれるところだ*2。専門性のレベルがあがると余計にその存在基盤を明確にしなければならない。

専門性の高い=聞き慣れない構成概念は,なんだかすごいことを言っているような気がするみたいである。「あ,これだ!」と思わせる力があるようだ。それでその概念をどうやってはかるのか?を調べてみたら,なんと心理尺度集という本が出ていて,そこに測り方を書いてある。あぁ,先行研究があるんだ,測定法まで確立されているんだ,じゃあ間違いない,と思いこむ。で調査票をつくる・・・。

でも実際に研究計画を聞いてみると,考えている概念Aは本来A’あるいはBとも言うべきものであって,Aを測るらしいと持ってきた尺度はαを測るもので・・・というズレが重なり,研究計画ではA’→B’がしたいようなのに,調査票に載っているのはα,β,γである*3,という状況になっていたりする。

原因は色々あるだろうけれども,一つは「尺度集を見たら載っていたので正しいと思う」という箇所だろう。
心理尺度集は使わない方が良い。理由の一つは,質が悪いから,である。
根拠の一つは,分析方法が古いことだ。主因子法バリマックス回転してでた結果に基づき,確認できたので,下位因子ごとに項目の素点を足して因子得点とする,こんなやり方もう古いぜ。多次元項目反応理論ぐらいつかえ。間隔尺度水準が仮定できなさそうなのもある。
さらにいえば,論拠・出典が登校論文レベルでないものがあるからだ。概念的妥当性が怪しいのもある。少なくとも,特定の文脈を離れると怪しい概念がある。
それのに,それっぽい名前がついているので,ついつい手が出てしまうんだろう。

社会学者の(故)木村洋二先生は,概念(や因子)に命名するときはすごく慎重になるように,とよく言っていた。一度命名してしまうと,今度はその名前をつかって考えるようになるからだ。名が体を表していなかったら,思考全体が間違ったことになるからだ。これは本当に大事なことだ。
心理尺度集をつかってはいけない第二の理由は,このラベルにミスリードされる可能性が高いからである。

研究はよくよく考えてから始めなければならない。調査であれ実験であれ,協力してくれる人がいるのだから,その人達の善意をこちらの無能で無にするのは,反社会的行為ですらある。
当たり前のことだが,「勢いでチョイチョイ」と研究してはいけないし,そんな学生を認めない。

*1:こういう手合いのヤツに限って,Nは多ければ多いほどよい,と努力を重ねる。Nが少なかったら話にもならないのだが。一番困るのは,少ないNのデータが既にあって相談に来られる場合。

*2:例えば俺は,自尊心なんかないと考えている。

*3:この第三の概念はどこから来たんだ,というとなんか関係あるかと思っていれておいた,という答えが返ってくることも少なくない。




top