[ OpenDiary ] in KIDS 글 쓴 이(By): deepsky (햅쌀) 날 짜 (Date): 2010년 10월 11일 (월) 오전 09시 49분 05초 제 목(Title): 0 과 missing value 자꾸 깜짝 깜짝 나를 당혹스럽고, 드러내진 않지만 경악하게 만드는 일이 있는데, 0과 missing value를 구별하지 않는 일이다. 다차원의 관측치가 있다. 유클리드 거리를 계산한다고 생각해보자. 어떤 축의 값이 관측되지 않은 것과, 그 대신에 0을 집어 넣고 계산한 거리가 동일하지 않다. 관측되지 않은 자리에 임의 값을 넣을 수는 있다. (imputation의 다양한 방법론을 적용해서 합리적으로 값을 속일 수는 있으니까) 왜 그딴 생각을 하냐고 이상한 눈으로 쳐다본다. 내가 최선으로 타협할 수 있는 점은 단순 내삽인데, 이마져도 먹혀들어가질 않는 경우가 많다. 0이라고 기록된 cell과 missing value가 있는 cell을 모두 0으로 두고 계산한 통계치를 그냥 발표하고 판단기준으로 쓴다는 것이 날 당혹스럽게 한다. 책임을 지고 싶진 않은데, 보조의 길은 험난하다. 이래도 내잘못, 저래도 내탓이잖어. |