KAIST

[알림판목록 I] [알림판목록 II] [글목록][이 전][다 음]
[ KAIST ] in KIDS
글 쓴 이(By): guest (guest) <cs2866-5.austin.>
날 짜 (Date): 2001년 6월  8일 금요일 오전 08시 45분 24초
제 목(Title): Re: Correlation에 관한 질문입니다. 심심�


그냥 10개의 주사위가 나타낼수 있는 수열을 생각하면

사건 1 : 수열 A = a1, a2, .. , a10
사건 2 : 수열 B = b1, b2, .. , b10

이렇게 볼 수 있죠.

Correlation factor란것은 두 변수의 짝 (a1,b1), (a2,b2), ...
을 2차원 평면에 놓고 볼때 그 데이타 포인트들의 중심을 지나는 
직선을 그었을때 그 직선의 기울기로 정의 할 수 있는데 .예를 들어
점들이 기다란 타원형의 구름을 형성하면서 45도 방향으로 길게 늘어
서있다고 합시다. 그러면 긴쪽 축을 지나가는 직선의 기울기가 1이
되겠죠. 이 경우 a_i가 중가함에 따라 b_i가 같은 양 만큼 증가하는
경향성이 있으므로 correlation을 1이라고 할 수 있겠죠.

하여간, 이 기울기를 구해주는 식이 Pearson's r, 또는 Linear correlation
coefficient 라고 하는데 

Correl(A,B) = Cov(A,B) / (Std_A*Std_B)

이렇게 구해줍니다. 여기서 Cov(A,B)는 Covariance로 

sqrt(sum((a_i-mean_a)(b_i-mean_b)))/N

이고 Std_A Std_B는 A와 B의 표준편차입니다.

그래서, 여기서 한가지 중요한것은, 이 수치는 B수열에서 몇개를 집어
던졌나에 따라서 변하고, 또, 던져서 나온 주사위 눈에 따라서도 달라집니다.

예를 들어

A = 3  3  2  2  1  4  1  1  0  2
B = 0  3  2  2  1  4  1  1  0  2 

이경우 Corr(A,B) == 0.70436

하지만 똑같이 처음 주사위를 집어서 던졌는데 주사위 눈이 1이 나온 경우

A = 3  3  2  2  1  4  1  1  0  2
B = 1  3  2  2  1  4  1  1  0  2

Corr(A,B) == 0.91962 가 나옵니다. 직관적으로 생각하면 0보다는 1이 3에
가깝기 때문에 처음 경우가 Correlation값이 작게 나온다는걸 알 수 있습니다.


[알림판목록 I] [알림판목록 II] [글 목록][이 전][다 음]
키 즈 는 열 린 사 람 들 의 모 임 입 니 다.