[ CnUnix ] in KIDS 글 쓴 이(By): qkim ( NGI Lab. ) 날 짜 (Date): 2004년 5월 13일 목요일 오전 09시 32분 20초 제 목(Title): [Q] popfile 쓰시는 분들.. 문제라 여겨지는 현상은... '자석'에 여러 필터링 대상 용어를 등록해서 spam 버킷으로 아주 잘 분류가 되고 있습니다. (버킷은 spam 하나만 만들었습니다.) '자석'에 의해 spam으로 분류되지 않은 것들은 'unclassified'로 표시되고.. 스팸 메일들은 spam 버킷으로 재분류하면서 훈련시키고 있습니다. 그런데.. 3일동안 500여개의 스팸 메일들을 unclassified에서 spam으로 재분류하면서 꽤나 훈련을 시켰다고 생각되는데.. 결과는.. 단 한 개의 스팸 메일만 '자석'이 아닌.. 스팸으로 분류시킨 학습 결과에 의해 spam으로 자동 분류가 되었습니다. 그러다 보니.. 이거 하나도.. 혹시 착각했던 건 아닌가 싶기도 하고.. 재분류시킨 학습 결과가 제대로 반영이 안 되고 있는 건 아닌지.. 제가 뭔가 잘못하고 있는 건 아닌지.. 또는.. 너무 성급하게 욕심을 내는 건지.. 조언 부탁드립니다. |