[ KAIST ] in KIDS 글 쓴 이(By): gelgel () 날 짜 (Date): 2006년 7월 26일 수요일 오전 12시 18분 29초 제 목(Title): Re: AI와 인간의 미래 SIFT(scale invariant feature transform)은 그져 좋은 feature point를 찾아내는 방법중 하나입니다. SIFT의 성능을 좌우하는 keypoit 설정방법과 keypoint 주변지역의 feature descriptor를 얻어내는 과정이 지속적으로 개선의 여지가 있어서 개선된 알고리즘들이 paper로 나오고는 있습니다. 하지만 의외로 간단한 color 정보 추출과 업데이트만으로 객체 인식과 추적은 상당히 잘 되기도 하죠.(occlusion과 같이 지능을 필요로하는 상황을 제외하면..) 최근에 statistical inference를 이용한 high level 정보를 추적하는 분야가 점점 세를 확장하고 있고, 보다 근본적이고 새로운 feature를 얻어내기위한 노력도 있고... 최근에 이슈화 되는 알고리즘들이 많이 있기는 하지만... SIFT나 Monte Carlo같은 방법들이 대부분 color information에 많이 의존하고 있고, 그외에도 video의 motion 정보에 의존하는등의 방법들에 집중되는 경향이 있습니다... 개인적으로, 가장 기본적인 객체의 shape(texture를 포함하는..)정보를 잘 이용할수 있는 방법을 찾아내는쪽으로 가야 발전이 있을것으로 생각하구요.. 그렇게 가는 과정인것 같기도 합니다. 물론 말씀하신데로 아무리 객체 인식이 잘되어도, 이를 해석하는데에는 다른 분야의 발전을 필요로 하죠. 예를 들어 정지영상이든 video든간에 color 정보와 약간의 frame difference 정보 그리고 DataDriven-MCMC 같은 방법으로 사람의 각 관절의 움직임을 상당부분 정확하게 추적할수 있습니다. 다만 이렇게 얻어진 사람 관절의 세부적인 움직임 정보를 이용해 이 사람이 밥을 먹고 있는건지, 글을 쓰고 있는지..아니면 난감하다는 제스춰를 취하는건지..등등을 깔끔하게 해석하는데까지는 아직 이르지 못한것 같습니다. 무엇보다 어떠한 움직임을 난감하다는 제스춰로 정의하고 표현할것인지에 대한 descriptor set의 정의 자체가 쉽지 않다는데에 문제가 있겠죠. ** 안녕 친구들~~~ ** |