まめトーーク!

バイオマーカー開発やパスウェイ解析のための統計解析・インフォマティクス技術に関するメモ。

2008-06-07

握手会

家の近くのショッピングモールにイアン・ソープが来ました。ヤクルトのスポーツ飲料のプロモーションで。事前に告知していなかったようで、人はそれほど多く集まっていなかった。トークショーとクイズ大会と握手会でした。握手後、サイン色紙を貰いました。すでに引退してますが、体つきが水泳に最適化されている印象。胸板がとてもあつく、なで肩、特に印象的だったのがひざです。ひざ間接が柔らかいので、逆(前)方向に大きく曲がっていました。26歳だそうです。好青年といった感じでした。

shikishi.jpg
2008-06-05

偏相関係数(その2)

以前、偏粗関係数をもとに条件付き独立性を評価することにより、相関係数では検出されてしまう偽相関を取り除くことができることをしめしました。偏相関係数をみることで直接的な強い相関構造を得る事ができます。しかし、偏相関係数による直接相関の検出は必要条件ではあるが十分条件ではありません。

net.png

図のような因果関係をもとにデータを発生させてみます。

g<-function(n){
A<-rnorm(n,0,0.5)
B<-rnorm(n,0,0.5)
C<-0.5*A+0.5*B+rnorm(n,0,0.1)
m<-matrix(c(A,B,C),ncol=3,byrow=F)
m
}
d<-g(100)

cor(d)
[,1] [,2] [,3]
[1,] 1.0000000 0.0419679 0.6797696
[2,] 0.0419679 1.0000000 0.7144819
[3,] 0.6797696 0.7144819 1.0000000

相関係数行列により変数1と2は独立ということがわかります。では、変数3を条件付けた変数1と2の偏相関係数を計算してみます。

r1<-lm(d[,1] ~ d[,3])
r2<-lm(d[,2] ~ d[,3])
cor(r1$residuals,r2$residuals)
[1] -0.8646989

相関係数0.0419679であった変数1と2の間の偏相関係数は -0.8646989と強い負の関係性が生じてしまっています。これを”選択の偏り”と呼び、図のような合流構造で合流点を固定すると起こる現象です。例え、多次元正規分布しているデータでも偏相関係数だけみていれば直接相関構造が担保されるわけではないので注意です。

 | HOME | 


PROFILE

CALENDAR

MONTHLY

RECENT ENTRIES

にほんブログ村 科学ブログへ にほんブログ村 科学ブログ 自然科学へ

CATEGORIES

OTHERS


ホームページ アフィリエイト レンタルサーバーFC2ブログ 専門学校

検索エンジン登録.com

検索エンジン Mono Search