WWW

[알림판목록 I] [알림판목록 II] [글목록][이 전][다 음]
[ WWW ] in KIDS
글 쓴 이(By): haebang (해방)
날 짜 (Date): 2000년 3월  7일 화요일 오후 08시 53분 00초
제 목(Title): 웹문서 언어 분류방법은??



다국어 웹로봇을 만들고 있습니다.
그런데 긁어온 문서가 한글문서인가 영어문서인가 중국어 문서인가
일본어 문서인가를 구분을 해야 합니다.
보통 2가지 정도의 언어가 섞어사용되지만 그런거는 일단 고려하지
않는다고 볼때 한,일,중,영어 문서를 구분하는 방법은 무엇입니까?

영어는 쉽게 된다고 보고... 한,일,중국어 문자들을
바로 구분할 수 있는가요?
문서의 내용을 읽을 필요는 없고 그냥 한글인가, 일본어인가, 중국어
인가만을 구분하면되는 데 어떻게 해야 하나요??




[알림판목록 I] [알림판목록 II] [글 목록][이 전][다 음]
키 즈 는 열 린 사 람 들 의 모 임 입 니 다.