研究は失敗を積み重ねるものだよ,という例

こういう話があって,
相関係数を出しているんだけどどう見てもU字に分布しているから,このままじゃダメだよね,というのは誰でも思いつく話。

ちょっとだけ遊んでみる。ちょっとだけね。

<code class="r">dat &lt;- read.csv(&quot;bast.csv&quot;,head=T)
cor.test(dat$B, dat$ratio)    #相関検定
</code>
## 
##  Pearson&#39;s product-moment correlation
## 
## data:  dat$B and dat$ratio
## t = 1.4936, df = 25, p-value = 0.1478
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  -0.1052417  0.6008773
## sample estimates:
##       cor 
## 0.2862191
<code class="r">plot(dat$B, dat$ratio, xlab=&quot;バストサイズ&quot;, ylab=&quot;R-18タグの割合&quot;) #点の表示
</code>

plot of chunk unnamed-chunk-1

相関係数が0.28,一応回帰分析をしてみたけれども,まぁこういう感じです。

<code class="r">result.lm &lt;- lm(B~ratio,data=dat)
summary(result.lm)
</code>
## 
## Call:
## lm(formula = B ~ ratio, data = dat)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -13.2677  -3.7489  -0.5229   5.2768  10.3810 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(&gt;|t|)    
## (Intercept)  77.1833     2.3719  32.541   &lt;2e-16 ***
## ratio         0.3045     0.2038   1.494    0.148    
## ---
## Signif. codes:  0 &#39;***&#39; 0.001 &#39;**&#39; 0.01 &#39;*&#39; 0.05 &#39;.&#39; 0.1 &#39; &#39; 1
## 
## Residual standard error: 6.335 on 25 degrees of freedom
## Multiple R-squared:  0.08192,    Adjusted R-squared:  0.0452 
## F-statistic: 2.231 on 1 and 25 DF,  p-value: 0.1478

ということで,ここで21世紀の相関係数MICに登場していただこうじゃないか。

参考

## $MIC
## [1] 0.3158828
## 
## $MAS
## [1] 0.05830438
## 
## $MEV
## [1] 0.3158828
## 
## $MCN
## [1] 2
## 
## $`MIC-R2`
## [1] 0.2339615

・・・イマイチ改善されんか。ちぇ。

データは自分で作ったわけじゃないけど,isHeroineっていう変数はきっとヒロインかどうか,というダミー変数だよな。であればここの違いがあるかもしれないので,試してみるか。

<code class="r">require(lme4)
result.lme4 &lt;- lmer(B~ratio+(1|isHeroine),data=dat)
summary(result.lme4)
</code>
## Linear mixed model fit by REML [&#39;lmerMod&#39;]
## Formula: B ~ ratio + (1 | isHeroine)
##    Data: dat
## 
## REML criterion at convergence: 173.4
## 
## Scaled residuals: 
##      Min       1Q   Median       3Q      Max 
## -2.09451 -0.59182 -0.08255  0.83303  1.63881 
## 
## Random effects:
##  Groups    Name        Variance  Std.Dev. 
##  isHeroine (Intercept) 4.013e-13 6.335e-07
##  Residual              4.013e+01 6.335e+00
## Number of obs: 27, groups:  isHeroine, 2
## 
## Fixed effects:
##             Estimate Std. Error t value
## (Intercept)  77.1833     2.3719   32.54
## ratio         0.3045     0.2038    1.49
## 
## Correlation of Fixed Effects:
##       (Intr)
## ratio -0.858
<code class="r">AIC(result.lm,result.lme4)
</code>
##             df      AIC
## result.lm    3 180.2295
## result.lme4  4 181.4163

・・・イマイチだなぁ。ちぇ。