Human-Understanding Computer Vision(HUCV)
인간을 이해하기 위한 visual intelligence를 탑재하는 것이 궁극적 목표
Human Pose Estimation: HUCV의 핵심 연구 분야
여기서 human pose란 사람 관절의 좌표, 회전
2D Human Pose Estimation
: 입력 이미지로부터 사람의 관절을 2D 공간에 위치화
관절은 dataset마다 정의 되어있음
Challenges
- 사람끼리의 가려짐
- 복잡한 자세
- 관절의 가동범위가 넓어서 → 일반적이지 않아서 추정하기 어려움
- 작은 해상도
- 한 이미지에서 scale이 다 다름
- 가까운 사람은 크게 먼 사람은 작게
- 멀리 있는 사람은 너무 작아서 픽셀이 너무 적음
- ex) CCTV 분석
- 모션 블러
- 입력 이미지 정보가 불안정함
- 사람이 빨리 움직이거나 카메라가 움직이거나
- 빠르게 움직이는 분야
- 잘림
- 전신이 아닌 상반신만 처럼
- 보이지 않는 부분에 대한 추정은?
Training
(x, y) Regression 접근
- (2013) DeepPose
- CNN regressor를 통해 key-points 좌표값 추정
Heatmap 접근
- (2015) Efficient Object Localization Using Convolutional Networks
- output을 (x, y) 좌표 대신, Heatmap을 통해 상대적인 빈도, 확률 값으로 가져가도록 함