분류
2026년 2월
작성일
2025.10.16
수정일
2026.02.20
작성자
전민수
조회수
144

시공간 정보 토큰을 활용한 3D Human Pose Estimation

제목 : 시공간 정보 토큰을 활용한 3D Human Pose Estimation

 

요약 : 3차원 인체 자세 추정 (3D Human Pose Estimation)은 깊이 모호성과 가려짐(occlusion), 비디오 시퀀스 내 시간적 불일치로 인해 여전히 난제로 남아있다. 기존의 방식은 관절 간 종속성을 간과하거나 노이즈에 민감하여, 복잡한 상황에서 비현실적인 자세를 예측하는 한계가 있다. 기존 연구는 자세를 토큰으로 표현함으로써 관절 간 종속성을 명시적으로 모델링하여 이런 문제점을 해결하였다. 하지만 관절 간 시간적 연관성을 모델링하지 못한다는 문제점이 여전히 남아있다. 이로 인해, 프레임 간 관절의 위치가 미세하게 떨리는 현상(jittering)이 발생하여 추론 결과의 품질을 떨어뜨린다. 본 논문은 토큰 기반 자세 표현법을 시공간 영역으로 확장하여, 자세 정보를 이산적인 공간 및 시간 토큰으로 압축하는 새로운 프레임워크를 제안한다. 제안하는 모델은 두 단계로 구성된다. 첫 번째 단계는 3차원 시퀀스를 입력받아 공간적 부분 구조와 시간적 흐름을 각각의 코드북을 통해 이산화하는 토크나이저를 학습한다. 두 번째 단계는 2차원 관절 입력으로부터 앞서 학습된 토큰 인덱스를 예측하는 분류 문제를 수행하며, 이를 위해 ST-GCN 기반의 분류기를 설계하였다. Human3.6M 데이터셋에 대한 실험 결과, 제안 모델은 기존 SOTA 방법론과 대등한 성능을 보였으며, 특히 가려짐이 심한 환경에서도 강건한 복원 능력을 입증하였다. 또한, 절제 연구를 통해 긴 시퀀스와 적절한 토큰 클래스 개수가 미세한 움직임 포착에 기여함을 확인하였다. 또한 관절 정보를 인코딩한 후, 시간 정보 처리 과정을 거치는 것이 더 우수한 성능을 보였다. 본 연구는 자세 추정을 연속적인 회귀가 아닌 시공간 토큰 분류 문제로 재해석함으로써, 추정의 안정성과 시간적 일관성을 확보하는 새로운 방향을 제시한다.

학위연월
26년 2월
지도교수
박진선
키워드
Computer Vision ; Human Pose Estimation ;
소개 웹페이지
https://sites.google.com/view/spatial-temporal-token-pose/%ED%99%88
첨부파일
첨부파일이(가) 없습니다.
다음글
드론 기반 광역 모니터링 지연 시간 최소화를 위한 효율적 데이터 전송 프로토콜 및 선택적 이미지 정합 기법 연구
박동진 2025-10-17 10:37:47.023
이전글
격자기반 양자내성암호 ML-KEM 하드웨어 설계 및 검증
강은세 2025-10-15 14:16:39.28
RSS 2.0 823
게시물 검색
석사학위논문
번호 제목 작성자 작성일 첨부파일 조회수
823 RAG를 적용한 컨테이너 기반 마이크로서비스의 오류 식별 방법 조대영 2025.12.15 0 218
822 Interpretable Cancer Risk Prediction with a Knowle 박한얼 2025.12.11 0 131
821 스토리지 분리화 환경에서 데이터 이동 최적화를 위한 Near-Data processing 도건우 2025.10.23 0 154
820 Learning a Differentiable Multi-Branch Decision Tr 박한얼 2025.10.21 0 317
819 분산 사이드카 아키텍처 기반 클라우드-네이티브 시스템 콜 모니터링 윤건우 2025.10.19 0 183
818 전시 환경에서의 관람객 행동 분석을 위한 Depth-Aware Zero-Shot HOI 조수현 2025.10.17 0 133
817 멀티모델 통합 선검출 기법의 환경 변화 강건성을 위한 베이지안 최적화 기반 파라미터 김정호 2025.10.17 0 165
816 레이더 기반 사람 행동 인식을 위한 경량 딥러닝 모델 설계 및 구현 곽도균 2025.10.17 0 146
815 메쉬 리깅 기반 안면 3D Gaussian Splatting의 부분 편집 기법 박현수 2025.10.17 0 171
814 가상현실에서 변형형 프록시가 감각 통합 및 일치감에 미치는 영향 연구 김민성 2025.10.17 0 125
813 이상 음향 탐지를 위한 경량 Diffusion Transformer 모델의 설계 및 구현 구동한 2025.10.17 0 156
812 VR 제자리걸음 중 주변부 시각 흐름의 위치와 속도가 비의도적 위치 이동에 미치는 영향 연 은승우 2025.10.17 0 164
811 실시간 공유화면 AI 분석을 통한 온라인 코딩 시험 부정행위 탐지 시스템 정해원 2025.10.17 0 275
810 지식 그래프 기반의 LLM 수학 추론 성능 향상 기법 박재현 2025.10.17 0 236
809 Autonomous Driving Agent Identification Under Host 도현철 2025.10.17 0 161
808 드론 기반 광역 모니터링 지연 시간 최소화를 위한 효율적 데이터 전송 프로토콜 및 선택적 박동진 2025.10.17 0 147
807 시공간 정보 토큰을 활용한 3D Human Pose Estimation 전민수 2025.10.16 0 144
806 격자기반 양자내성암호 ML-KEM 하드웨어 설계 및 검증 강은세 2025.10.15 0 315
805 배리어프리 전시 서비스를 위한 대화형 수어 질의응답 거대언어모델 연구 허석용 2025.10.15 0 157
804 Long-Axis Guided Diffusion Autoencoder for Through 김준희 2025.10.15 0 151