線形か?線形なのか?

昨日のニュースで,文科省が「人間力判断する入試を」とか言い出してうんざりしているんだけど,これにちょっと違う方向からツッコミを入れてみたいと思う。

人間力とは何か,というのが多分真っ先に攻撃されるポイントになるんだろうけど,そうなると鳥取大学みたいに,「本学では、「人間力」を、「知力」、「実践力」、「気力」、「体力」及び「コミュニケーション力」の5つの構成要素から成り立つ総合的かつ人格的能力として定義する。」といった公式回答が出てくることになるわけです。

出だし(人間力)が既におかしいのに,それにまじめに答えちゃってるんだからもうギャグだと思った方がいいんだけど,一応「心理教育測定法」という目に見えないものをどうやって測るかという授業を担当しているメトリシャンとしては,きちんと問題点を指摘しておこうかな,と思っている。

第一に,人間力,知力,実践力,気力,体力,コミュ力・・・それぞれの目に見えないものを「力」と称するのは,構成概念的に妥当かどうか,ということが問題。俗にいう「女子力」というのは,下手したら(しなくても?)セクハラや性差別につながるような話なのに,「人間力」「コミュ力」というのが,その妥当性の検討を抜きにスルーされているのが不思議だわ。

とまあ妥当性の問題が一番大きいんだけど,次に気になるのは最後のところだよね。「総合的かつ人間的能力として定義する」の件ですが,前半の「総合的」というところ,をよく考えてほしいのです。

総合的,包括的,統合的・・・他にもいろいろな表現があるでしょうが,これは基本的にぼかし表現であって,「〜など」と言っているようなもの。成績評価のところでも,〜や〜などを総合的に評価して・・・ということが多いけど,それは何かということをしっかり考えてもらいたい。

私自身,公的な文書の素案を書くときに総合的って書きますけど,これははっきりいって「わかってません」とか「逃げています」ということを誤摩化して書いているんですよ。それぐらいのことはわかってます&わかられてますよね,当然ね?

ただ,私は成績評価のときに総合的に判断する,というのは嫌だし学生に対して誠実ではないと思うので,テストの点数で評価し,出席点や努力点,理解の程度や態度は0です,と断言しています。

総合的,という言葉を他の人が使っていると,
「線形か?線形なのか?」
と聞いてやりたくなります。

実際,複数の採点を総合する,というときはせいぜい合計,平均点を使っているわけで,その場合の計算は,
score=X_1+X_2+X_3+...+X_n
という線形結合になっている。平均はこれを割っているだけだから,同じことね。
いやいや,そんな簡単なもんじゃないよ,と。大学でやる人間力(score)ってのは知力(X1)がちょっと高く評価されて,体力(X4)はちょっと低くても良くて・・・,といった傾斜配分をするというのであれば,
score=w_1X_1+w_2X_2+w_3X_3+...+w_nX_n
ということになっていて,これも結局線形結合になっていますね。一般に,この重みwは何の制限もかけなかったらどんどん数字が大きくなっていっちゃうから,
\sum_{i=1}^n w_i = 1.0
という制限をかけて,割合の問題にしますけど。

もしそうでない場合。つまり,知力,実践力,等々はあるんだけど,それだけじゃなく,それ以外にあるから総合的に,なんだ!とか言い出すのであれば,
score=w_1X_1+w_2X_2+w_3X_3+...+w_nX_n+w_e E
これでいいでしょうか。だって知力,実践力,等々は測っているし,それらは人間力の一部なんだもんですから,それ以外の部分(E)をつけてやればいいわけでしょ。

問題は,この時の相対的な重みで,それ以外の部分,の割合が30%ぐらいであれば,人間力ってのは上の五つの力で70%を占めているんだから,そこをのばしていきましょう,でいいんですよ?それ以外の部分がもし60%もありますよ,ということであれば,大学としてはそっちをのばすべきで,知力や実践力を伸ばしている暇はないよねえ!

ちなみにこのモデルは,因子分析モデルと基本的に同じ形をしていて,因子分析ではこのその他の部分(E)を誤差因子,と呼ぶのです。能力を複数の因子に分解し,テストで測定している部分(共通因子)には命名できるんだけど,できない部分は誤差。で,この誤差というのは,共通するところと無相関である,というのが前提。だって,相関する=関係するのであれば,共通因子(この話で言うと他の力の部分)に取り込まれるべきで,知力や実践力「以外の」「その他の」力,というのが「総合的の意味」なのであれば,それは知力や実践力とは何の関係もない力な訳です。そしてそういう何の関係もない力,というのを教育によって育てることができるのか?そこの重みが大きすぎたりしてないか?というのが問題になります。

力(因子)の正体がはっきりしているからこそ,そこをどのように教育すれば,どのような変化が望めるかというのがはっきりしてくるのであって,伸ばせるところは伸ばすけれども,伸ばしようのないところが結構な重みでありますよ,というのは教育できないよ,といっていることに等しい。もしそういう謎の総合的な判断,というのが入ってくるのであれば,行き着くところはランダム(さいころを振って加点する)か,属人的判断(かわいいから加点する,生まれがいいから加点する)になってくるのではないかな。危険な考え方ですよ。

学問というのは思想・信条・人種・性別などの区別に関わらず門戸が開かれていて,何を教えてどのように測定するかというのがはっきりしており,測定値が上がることが能力が上がることであって,目に見えなうプラスαの部分で判断してはいけないのです。

ただ,高等教育のような専門性の高い話になってくると,専門家,その人でないと判断できないことというのが出てくる。なので,大学での評価はその人に任せる,というスタイルをとる。教員免許とか持っている必要なくて,ただの有名人でも,その大学がこの人の基準でもってOKとしたらそれでいい(というしかないじゃない),ということです。つまり,プラスαの部分を評定者個人内の一貫性(評定者の判断次元)としてある程度fixする(誤差因子をさらに独自性と真の誤差にわけるようなもの)ことができるようになります。

さっきと言ってることと違うじゃないか,教員個人の好みで点数がブレブレになったりするんじゃないか,あの教員はわがままに採点しているんじゃないか,という反論が出てきそうですが,基本的に専門家というのは専門家集団のなかでピアレビューをうけて,こいつはちゃんとしているな,という専門家集団による緩い保障がされています。大学の中でも,一人の教員が卒業までの全ての単位(124単位)を出すわけではなく,せいぜい4〜10単位ぐらいでしょう。大学全体の教員プールの中でその独自性がなるべく影響しないようにデザインされているのです。もちろん,教員自身も自分の直感だけで判断しようと思っている人ばかりじゃなくて,客観的に測る部分(説明可能な部分)+自分の判断,で評価しようとしている人が普通。

だらだらと書いてきましたが,総合的に,というのが下位概念の線形結合である,というのであればまだわかるのです。下位概念で説明できる割合がどうなっているか,という重み付けまでしっかり計算されていればいいのです。
そうではなくて,それ以外の部分が半分以上の説明率を持っているとか,「そういう線形結合じゃなくって・・・もっとこう!総合的に!全体的に!」という説明ができないのであれば,じゃあどういうモデルなのかを表現すべきです。

線形結合ではない,複雑な関数でscore=f(X_1,X_2,X_3,X_n)な何かだ!というのであれば,果たしてそれは理解(解釈)できるものなのでしょうか?教育できるものなのでしょうか?知力と体力があるレベルに達すると急激に人間力は落ちます!とか,知力レベルが〜で,実践力レベルが〜で,気力レベルが〜の時はコミュ力が爆発的にのびるけど人間力は逆になくなるんです,とかいった現象が生じてしまったら,怖くてものを教えてられないですよw

我々が知ったり,測ったり,予測したり,制御したりできるのは,基本的に線形結合しているところであって,その説明率が高くなくとも,少なくとも学力については積み重ねられる,教育効果がある,ということで教育業界は成立しているのであって,制御もできない,予測もできない,いわんや理解も計測もできないものを社会システムの中に組み込むのは全くまぬけなことなのです。