| [ QuizWit ] in KIDS 글 쓴 이(By): guest (guest) <hydra.kaist.ac.k> 날 짜 (Date): 2000년 2월 7일 월요일 오후 02시 30분 32초 제 목(Title): [중요한 질문] Principle Component Analys 제 졸업과 관련해서 너무나 중요한 거라 이렇게 도움을 요청합니다. 혹시 아시거나, 아니면 아는 분을 알고 계시면 꼭 연락 바랍니다. Principle Component Analysis에 대한 것입니다. 저는 전공이 통계학이 아니고, 전산이라서 PCA를 잘 모릅니다. 다만 저랑 비슷한 일을 하는 사람과 유사한 실험을 하였고 그 실험 결과를 PCA로 분석하려고 합니다. 변수는 X1, X2, ... X10 10개 입니다. 각 변수는 0 부터 1 사이의 값을 가지는 것도 있고, 0 이상의 값을 가지는 것도 있습니다. SAS를 이용해서 다음과 같이 분석을 수행하였습니다. proc factor data=work.ivpca rotate=varimax nfact=9 simple; run; 결과를 요약하면 다음과 같습니다. PC1 PC2 PC3 PC4 PC5 eigenvalue 4.82 2.75 0.80 0.59 0.52 proportion 48.2% 27.5% 7.9% 5.9% 5.1% cumulative 48.2% 75.7% 83.6% 89.5% 94.6% 제가 원하는 결과는 제가 새로 제안한 변수 예를 들어 X10이라고 하면, X10이 PC에서 loading으로 나타나는 것입니다. 운 좋게도 X10은 PC4에서 dominant variable로 드러났습니다. 그런데 문제는 PC4가 너무 작은 eigenvalue를 가지고 있는 것입니다. 통계학 기초 책을 보면 PC의 갯수를 정할 때 일반적으로 사용하는 방법이 eigenvalue가 1 이상인 PC들을 택하는 것으로 나와있습니다. 제가 원하는 것은 X10이 loading인 PC4를 어떤 의미가 있는 결과로 보고 싶은 것입니다. 즉 PC4는 eigenvalue가 작지만 PC로서 선택될 수 있는 근거를 찾고 싶습니다. 저한테 너무 너무 중요한 부분입니다. 아시는 분은 또는 관련 자료를 아시는 분은 제발 연락 주시기 바랍니다. hschae@salmosa.kaist.ac.kr 채흥석 |