| [ KAIST ] in KIDS 글 쓴 이(By): guest (guest) <cs2866-5.austin.> 날 짜 (Date): 2001년 6월 8일 금요일 오전 08시 45분 24초 제 목(Title): Re: Correlation에 관한 질문입니다. 심심� 그냥 10개의 주사위가 나타낼수 있는 수열을 생각하면 사건 1 : 수열 A = a1, a2, .. , a10 사건 2 : 수열 B = b1, b2, .. , b10 이렇게 볼 수 있죠. Correlation factor란것은 두 변수의 짝 (a1,b1), (a2,b2), ... 을 2차원 평면에 놓고 볼때 그 데이타 포인트들의 중심을 지나는 직선을 그었을때 그 직선의 기울기로 정의 할 수 있는데 .예를 들어 점들이 기다란 타원형의 구름을 형성하면서 45도 방향으로 길게 늘어 서있다고 합시다. 그러면 긴쪽 축을 지나가는 직선의 기울기가 1이 되겠죠. 이 경우 a_i가 중가함에 따라 b_i가 같은 양 만큼 증가하는 경향성이 있으므로 correlation을 1이라고 할 수 있겠죠. 하여간, 이 기울기를 구해주는 식이 Pearson's r, 또는 Linear correlation coefficient 라고 하는데 Correl(A,B) = Cov(A,B) / (Std_A*Std_B) 이렇게 구해줍니다. 여기서 Cov(A,B)는 Covariance로 sqrt(sum((a_i-mean_a)(b_i-mean_b)))/N 이고 Std_A Std_B는 A와 B의 표준편차입니다. 그래서, 여기서 한가지 중요한것은, 이 수치는 B수열에서 몇개를 집어 던졌나에 따라서 변하고, 또, 던져서 나온 주사위 눈에 따라서도 달라집니다. 예를 들어 A = 3 3 2 2 1 4 1 1 0 2 B = 0 3 2 2 1 4 1 1 0 2 이경우 Corr(A,B) == 0.70436 하지만 똑같이 처음 주사위를 집어서 던졌는데 주사위 눈이 1이 나온 경우 A = 3 3 2 2 1 4 1 1 0 2 B = 1 3 2 2 1 4 1 1 0 2 Corr(A,B) == 0.91962 가 나옵니다. 직관적으로 생각하면 0보다는 1이 3에 가깝기 때문에 처음 경우가 Correlation값이 작게 나온다는걸 알 수 있습니다. |