Kosugitti's BLOG

アンドロイドは正規分布の夢を見るか

この画面は、簡易表示です

2015 / 10月

例えばポートフォリオ

例えば「ポートフォリオ」。

これは自分の学習の記録,自己評定の記録をつけ続けて,自分の実績を振り返るということをするものなのだけど,この背後にある考え方はやはり社会的構築主義的発想です。つまり,自分で自分の物語をどう作るか,を尊重する。それが真だと言ってもいいじゃないか。だって自分の外に真実があるという素朴実証主義的な考え方は,カントから始まり現象学を経て否定され続け,「お前がそう思うんならそうなんだろう,お前ん中ではな。」というオチまでついたわけでしょ。で,外にあると言われている真実だって,信じている人数が多いだけで,本当かどうかはわからないんだから,自分の自分語りが自分そのものじゃないかってことなわけです。

そこから,「自分で学んだ自分の記録が自分なんだ」という言い方になる。百歩譲って,それの妥当性は社会的に判断するとして,真実性は個人の中のものだから反論できないだろうと。だから「自分の学び」(こういう名詞化大嫌い)が大事なんだという話になるわけです。

そうするとすぐに反論が出て,モリタイシの漫画にあるように「自分のことを悪く言いながら自分という商品を勧めるバカがいるか」というという話になって,要領がいいやつは「自分は満点です,信じたお前が悪い」という話になるし,要領が悪いやつはバカ真面目に「私はそこまでではありませんので」という言い方になって,前者の方が評価が高くなったりする。戦略的にやっているかどうかってのはこれまた本人の自覚によるものだから弁別のしようがないんだけど,「うまくやったもん勝ち」と思っている人がたくさん出てきた反動として,「面接なんかやめて筆記試験だけでいいよ,学歴の高いやつだけでいいよ」という話になっている。

 

やはりここは,何を持って妥当かとか,何を持って信憑性が高いかという話をせなあかんと思うのです。 前提として,「人は間違う」「人は易きに流れる」「人は環境に適応しようとする」ということをおいて,かつ,「評価というのは他人が社会的に決めるものである」という至極まっとうな公理を置くべきだと思うんですよね。

で,何を持って能力や性質を正しいものとするか,ということになるのですけど,「本当に能力があるかどうか」ということを査定することから逃げてはいけないと思うのです。「自分ができたかどうかは自分が一番よくわかっている」というのは,単に評価から逃げただけだということをはっきりさせるべきです。

じゃあどうやって測るのか,という問題になりますが,能力の場合そこは「わかっているとは何か」という問題に帰着します。コミュ力とか女子力とかいう場合はそれが何を定義しているのかをはっきりさせることが先決なので一旦おきます。

 

わかっているとは何か。今の所の私の答えとしては,それは,「問われている対象に対して無数の解説の仕方ができること」だと思っています。ある事象Aに対して,教わった教わり方,あるいは一つの自分の考え方でしか他者に説明できないのでは,それはまだわかったことになっていない。説明するルートが多ければ多いほど,その事象Aについてわかっていると言えるのではないか。

学生が就職面接で,大学で何を学んできましたか,と言われた時に,通り一遍の耳障りのいい一通りの説明しかできないようでは,それはやはり大学で何も学んでいないわけです。例えば卒論に真面目に取り組んだ人は,自分が取り組んだ事象に対して,素人向けから玄人向けまで,様々に答えることができるんではないでようか。できなければいけないと思います。つまり,説明の可能性が多ければ多いほど「わかっている」わけです。

だから,ポートフォリオで記録を取る=そいつの学んだことが目に見えて評価できる,という解釈は,たった一つの評定者がわかる評価軸だけで評価し,しかもその責任を自己評定した評定者に帰するという意味で,最低の戦略です。つまり,評価すべき人が評価していない,何を評価するかがわかっていないのです。そんなもん学生に義務化せんでよろしい。学生は忙しいんだ。

ポートフォリオ,取るのはよろしい。ただし,その場合は,そのデータをたくさん集めて授業評価,カリキュラム評価につなげるという前提があって初めて意味があります。入学願書がWebでできるようにするかどうか,そんなもんは瑣末な問題です。大事なのは,入学願書提出時点から,試験の成績,在学中の成績,卒業後の収入や満足度や幸福度の予測に使えるかどうか,というデータの紐付けがあって初めて意味があるのであって,そういう「紐付け」ができていないデータはただのゴミなんだということをもっとわかってほしい。エビデンスベースドの前に,統計の基礎中の基礎「取ったデータのなかでの関係性しかわからない。取ってないことはわからない。関連付けられていないとわからない」という話を,そこらへん歩いているおっさんおばさんレベルで理解されているようにならないと,日本社会は決してまともな社会にならないですよ。

ちなみに,コミュ力というのはうちのゼミで考えたところ,「異世代のメンバーが含まれているなかで,会話が途切れないこと」と操作的に定義するだけで,かなりのところまで説明できるんじゃないかというところまで考え至りました。もちろん間違っているかもしれませんが,操作的定義すらせずに新入生に「コミュ力をつけてください」とかいうなバカ。

ついでに。

例えば面接。AO入試とか。

「面接ではなかなか違いががつけられなかったので,全部4点にしました」とかいう人に対して,「無理を承知でやっているんだから何としてでも差をつけてもらわなねば困る」とかいう意見が出ることがあるけど,それもアホかと思いますよ。差がつかないものを無理やり差をつけて,その差がついたのは評定者の直感。評定者の責任の下だからええんや,というのは,制度設計者の責任逃れでしょうが。誰が図っても175cmのやつを,分散0では困るからてめえの責任で176にしろとかいうのは無茶苦茶だ,って何でわからない。違いがないものはないんだよ。

人間が人間を評定するときに,どれほどのsensitivitiyで評価できるかって問題なの。それを「うそでもつけた評定値が行動だ」と買うのは三流心理学者ですよー。操作的定義を抱いてどっかにいけ。

そういうのは制度設計が間違えているんです。AO入試を増やしても,差がつかないものはつかないし,だいたいそれで取った人がどうなったかの分析もしてないのに(エビデンスに基づいてないのに)議論してどうするんだ。AO入試で入った人と,一般入試で入った人と,卒業後の年収に統計的有意差があるんだったら考えてやるけどよ。なかったらどうなるかって?入試ではわからないということがわかるんですよ。 測りたいものは何か。ちゃんと測れてるか。測って意味があるか。考えるのを放棄するなよと言いたい。

なーんてね。



初めてのスクレイピング

スクレイピングとぞいふもの

へー,webからデータを取ってくることをスクレイピングっていうんだ,というレベルから始めたのですがね。

毎年,データ演習の授業では色々なデータを使うのだけど,分布が偏ってるのもあって,適度に関係性が見られて,カテゴリカル変数もあって,それでいて身近な例で,というような丁度いいデータってのが欲しいもんなのですよ。

なので私はいつも,プロ野球データFreak さんのデータをコピペして,データを作っていました。
が,これが簡単にできるパッケージがあるらしい。のでやってみた。

[crayon-5c0ea837ac83f212221112/]

[crayon-5c0ea837ac850753943346/]

同様に読み込んでデータ化していけばいいんだけど,残念ながらデータによっては数字じゃないところがあったり,最後にも変数名が入っていたりして,全部chr型になってたりする。

面倒だけど,これを修正する作業を行いました。

ピッチャーの年俸データを整える

文字列操作パッケージstringrの解説を参考に,文字列操作をしていく。

[crayon-5c0ea837ac856150853640/]

[crayon-5c0ea837ac85d730204072/]

バッターの年俸データを整える

同じような作業。

[crayon-5c0ea837ac884591776560/]

[crayon-5c0ea837ac88c566366971/]

成績のデータを整える。

最後の一行に変なのが入っているせいで全部キャラクターになっちゃってる。

[crayon-5c0ea837ac892960444029/]

成績と年棒を合わせる

ホームラン一本おいくら万円とか知りたいじゃないですか。
名前でマージします。

[crayon-5c0ea837ac899563050193/]

これで出来上がり。あとはwrite.tableでもなんでもどうぞー。



キングオブコントの評価軸

先週末に行われたキングオブコント2015。リアルタイムで観て,昨日また録画したものを見直して。
いやー,なかなかいい戦いをしていますね。

ところで今回は評価方法が変わって,5人の審査員が100点ずつ持ち寄って500点満点で評価するというスタイルになりました。
私も見ながら採点して行ったんだけど,振り返ると「世界観の完成度」「突発的な面白さ」「タイミングの良さ」「オリジナリティ」など,自分の中でも幾つかの評価次元があって,0-100の一次元に落とすのがとても難しいなと感じました。

で,審査員たちはどういう評価をしているんだろう?と思いますよね。
こういう話(「キングオブコント2015」採点データ分析で見た意外な真実。さまぁ〜ず三村が鍵を握っていた)がホットエントリーになってて,楽しく読ませてもらったんですが,残念,平均と標準偏差出したところまで。

では私の出番ですね(謎

まずデータを入れます。

[crayon-5c0ea837ae10b181611320/]

審査員も口々に(最初の演者を評して)「これが基準になっちゃうからね」とか「少し高めで始めちゃったから(大竹)」と言ってたように,個人の中での相対的な基準でしかないと思うので,これを相関行列に変えて,相関の高さ=近い,と距離行列にしたMDSをしてみます。

まずは相関行列。

[crayon-5c0ea837ae14c474855332/]

[crayon-5c0ea837ae15a083038485/]

これを見ると,最低でも0.46ぐらいの相関はあるということだから,やはり皆さんお笑い芸人として共通するところを持っている,と判断していいんじゃないかな(目安として0相関が.3より大きくなると関係がある=独立ではない,とするのが社会科学では一般的かと)。
最大で三村さんと日村さんの0.84。コンビ同士の相関がバナナマンで0.64,さまぁ〜ずで0.54と中程度の相関があるのも妙に納得。

さて地図を描こう。

MDS-1

 

これを見ると,日村さんが意外と中心的というか,当たり障りのない評価をしていて,三村–設楽軸と松本–大竹軸があるんですなぁ。
コメントから考えると,三村さんは当日の笑いの多さ,設楽さんはここに至るまでの努力や練習量を評価するという違いがあったのかも。
松本さんと大竹さんは,キャラクター的には似ているのかと思ったけど,評価次元という意味ではオリジナリティ重視vs基本重視,という違いがあったのかしらん。

いや,正直ちょっと評価に迷います。
ほな評定者の分類だけじゃなくって,演者のスタイルと掛け合わせてみたらわかりやすくなるんでしょうか。やってみましょう。
行と列の両方を弄るのなら,双対尺度法,まあスコアが連続変数だから対応分析っていうべきかな。

[crayon-5c0ea837ae167051084620/]

[crayon-5c0ea837ae172930200762/]

[crayon-5c0ea837ae17c781738958/]

 

unnamed-chunk-1-1

最初の二次元で80%の説明ができているから,これはこれでいいとして。
こうしてみると,やっぱり三村–設楽軸ははっきりしてて,設楽さんの「シュール・若手」好み,三村さんの「ベタ・渋・古参」好みが見られたかな。日村さんと大竹さんが意外と近くなるのね。

ボキャブラ天国の軸でいうと,横軸は シブい–インパクト ,縦軸が 知的–バカ で,松本さんのシブ知,日村さん・大竹さんのバカパク,設楽さんのインパク知,三村さんのバカシブ好み,ってところかなぁ。
で,第一次元の寄与率が62%あることから,やはりインパクトがあるかどうか(インパクトの反対はシブいと言うよりスタンダードかどうか,かな)が大きくて,

皆さんも自分の採点結果をここに入れて,楽しんでみてください。




top