CultureOfKids

[알림판목록 I] [알림판목록 II] [글목록][이 전][다 음]
[ CultureOfKids ] in KIDS
글 쓴 이(By): sugbong (표정연습)
날 짜 (Date): 1993년11월13일(토) 04시33분25초 KST
제 목(Title): 직업분석하는 방법.


일단 포스팅 통계를 내기 위해 script로 받아 놓은 전체유저 화일에서

직업에 대한 란만 뽑아 내어 새로운 화일을 만듭니다.

그리고 영어 소문자를 모두 대문자로 바꾸어 줍니다.

그리고 grep에 해당하는 program을 짜는데,

다만 여기서는

특정한 문자가 있는 line과 그렇지 않은 line을 다른 화일에 저장하게합니다.

그리고 `ST`, `학` 등의 문자가 있는 라인을 따로 모읍니다.

또한 `Univ`, ` coll` 등등의 문자도 검색합니다.

이러한 것을 모은 것이 학생의 수입니다.

`연`, `Res`등이 연구원에 해당하고,

`컴`, `콤`, `com`등이 컴퓨터 관련업종,

`회`, `Off` 등이 회사원...

대충 이정도 추려내고 나면 800명 정도가 남는데,

그때는 화일을 쭈욱 훑어본 후에 눈에 자주 띄는 직업을 다시 추려냅니다.

그렇게 몇번하다보면,

도저히 분류할 수가 없는 직업들이 나오는데

그런 것을 그냥 `이상한 직업들'로 올리면 됩니다. 재미있는 직업이 많으니까...

프로그램을 짜고 실행시켜 결과를 얻는데까지 1시간 20분이 걸리더군요.

앞으로 또 이런 통계를 내게된다면 더 시간이 단축되겠죠.

일단 프로그램은 다 있으니까...

생각보담 그다지 노가다가 아니에요.

뭐. 실험실에서 12시간 내내 시료앞에 앉아서 꼼작달삭 못할때도 있는데...

그리고 제 분류방법에 근본적인 오류는

`학생아님`도 `학'자 가 들어 있기때문에 `학생'으로 분류된다는 것이지요.

쩝... 사람이 3,000명이 모이니까 별 희안한 직업들이 많아서...

일일이 읽구 분류할수도 없구...

어쩐지 궁금하구...

그래도... 대체적인 직업의 윤곽은 볼 수 있지요...

그정도면 만족해야죠... 완벽하려다가는 코피터지겠으니... :)
 
[알림판목록 I] [알림판목록 II] [글 목록][이 전][다 음]
키 즈 는 열 린 사 람 들 의 모 임 입 니 다.