強制分類法(Forced Classification)再考

西里先生の双対尺度法(dual scaling)の発展系、強制分類法は、以下二つの出典がある。

Nishisato,S. 1984 Forced Classification: A Simple application of a quantification method. Psychometrika,49(1),25-36.
Nishisato,S. and Baba,Y. 1999 On Contingency,Projection and Forced Classification of Dual Scaling, Behaviormetrika,26(2),207-219.

この方法は、ある変数を説明次元とした場合、他の変数がどのように付置されるかを検証するためのものである。目的とする空間があって、そこに写像するプロクラステス回転みたいなもの。それがカテゴリデータでできるというのが面白い。

そのときに習った例では、子どもに動物のグルーピングをさせる。子どもはたとえば、首が長いとか、大きいとか、目がかわいいといった次元でグルーピングするが、もちろんこれは生物学的な分類とは全く異なる。子どもも低学年の場合はよりそうであり、高学年になるにつれて、科や目の分類に沿った分け方ができるようになるらしい。そういう子ども達の分類法と、生物学的な分類法を対応づけるためにこれを使う。生物学的分類による動物のプロット空間に、子ども達のデータをマッピングすると、いかにずれているかがわかる。あるいは学年ごとに徐々にあってくるのがわかる、ということだそうだ。
ともかく、解釈の次元が決まっている場合はそれに沿わせればよく、探索的に使われがちな数量化三類(対応分析、双対尺度法。この三つは数学的には同義)に対するアプローチである。

二番目の、Nishisato and Baba(1999)を見ればわかりやすいのだが、やり方としては以下の三種類がある。いずれも計算方法はかなり簡単である。個人的には、西里先生の集中講義で直接習ったので、そのときに聞いた第三の方法がわかりやすいと思う。が、そのとき配付された資料にミスプリがあって、どうも計算ができなかったんだけど、この度その問題が解決したので記しておく。

  1. 元の分割表Fから目的となる変数Fjを抜き出した行列F0をつくり、Fj’F0の行列を分析対象とする
  2. 元の分割表Fから得られる結果を、目的とする変数Fjが作る空間に写像する行列Pを算出する
  3. 元の分割表FにおけるFjをアホほど水増しすると、Fjの説明率がやたらと高くなって同じ結果になるじゃろおめぇ*1

面白い手法だと思うのだが、あまり応用例が多くない。いい例を思いつくのが難しいんだろうな、と思う。でもかなり遊べる方法なんだよなぁ・・・。

*1:西里先生は非常に紳士的な方で、関西弁なんか使わない