부산대학교

분류: 2026년 2월

작성일: 2025.10.16

수정일: 2026.02.20

작성자: 전민수

조회수: 144

시공간 정보 토큰을 활용한 3D Human Pose Estimation

제목 : 시공간 정보 토큰을 활용한 3D Human Pose Estimation

요약 : 3차원 인체 자세 추정 (3D Human Pose Estimation)은 깊이 모호성과 가려짐(occlusion), 비디오 시퀀스 내 시간적 불일치로 인해 여전히 난제로 남아있다. 기존의 방식은 관절 간 종속성을 간과하거나 노이즈에 민감하여, 복잡한 상황에서 비현실적인 자세를 예측하는 한계가 있다. 기존 연구는 자세를 토큰으로 표현함으로써 관절 간 종속성을 명시적으로 모델링하여 이런 문제점을 해결하였다. 하지만 관절 간 시간적 연관성을 모델링하지 못한다는 문제점이 여전히 남아있다. 이로 인해, 프레임 간 관절의 위치가 미세하게 떨리는 현상(jittering)이 발생하여 추론 결과의 품질을 떨어뜨린다. 본 논문은 토큰 기반 자세 표현법을 시공간 영역으로 확장하여, 자세 정보를 이산적인 공간 및 시간 토큰으로 압축하는 새로운 프레임워크를 제안한다. 제안하는 모델은 두 단계로 구성된다. 첫 번째 단계는 3차원 시퀀스를 입력받아 공간적 부분 구조와 시간적 흐름을 각각의 코드북을 통해 이산화하는 토크나이저를 학습한다. 두 번째 단계는 2차원 관절 입력으로부터 앞서 학습된 토큰 인덱스를 예측하는 분류 문제를 수행하며, 이를 위해 ST-GCN 기반의 분류기를 설계하였다. Human3.6M 데이터셋에 대한 실험 결과, 제안 모델은 기존 SOTA 방법론과 대등한 성능을 보였으며, 특히 가려짐이 심한 환경에서도 강건한 복원 능력을 입증하였다. 또한, 절제 연구를 통해 긴 시퀀스와 적절한 토큰 클래스 개수가 미세한 움직임 포착에 기여함을 확인하였다. 또한 관절 정보를 인코딩한 후, 시간 정보 처리 과정을 거치는 것이 더 우수한 성능을 보였다. 본 연구는 자세 추정을 연속적인 회귀가 아닌 시공간 토큰 분류 문제로 재해석함으로써, 추정의 안정성과 시간적 일관성을 확보하는 새로운 방향을 제시한다.

학위연월: 26년 2월

지도교수: 박진선

키워드: Computer Vision ; Human Pose Estimation ;

소개 웹페이지: https://sites.google.com/view/spatial-temporal-token-pose/%ED%99%88

첨부파일: 첨부파일이(가) 없습니다.

다음글: 드론 기반 광역 모니터링 지연 시간 최소화를 위한 효율적 데이터 전송 프로토콜 및 선택적 이미지 정합 기법 연구
박동진 2025-10-17 10:37:47.023

이전글: 격자기반 양자내성암호 ML-KEM 하드웨어 설계 및 검증
강은세 2025-10-15 14:16:39.28

분류

RSS 2.0 823 건

게시물 검색

게시글 리스트

석사학위논문
번호	제목	작성자	작성일	조회수
823	RAG를 적용한 컨테이너 기반 마이크로서비스의 오류 식별 방법	조대영	2025.12.15	218
822	Interpretable Cancer Risk Prediction with a Knowle	박한얼	2025.12.11	131
821	스토리지 분리화 환경에서 데이터 이동 최적화를 위한 Near-Data processing	도건우	2025.10.23	154
820	Learning a Differentiable Multi-Branch Decision Tr	박한얼	2025.10.21	317
819	분산 사이드카 아키텍처 기반 클라우드-네이티브 시스템 콜 모니터링	윤건우	2025.10.19	183
818	전시 환경에서의 관람객 행동 분석을 위한 Depth-Aware Zero-Shot HOI	조수현	2025.10.17	133
817	멀티모델 통합 선검출 기법의 환경 변화 강건성을 위한 베이지안 최적화 기반 파라미터	김정호	2025.10.17	165
816	레이더 기반 사람 행동 인식을 위한 경량 딥러닝 모델 설계 및 구현	곽도균	2025.10.17	146
815	메쉬 리깅 기반 안면 3D Gaussian Splatting의 부분 편집 기법	박현수	2025.10.17	171
814	가상현실에서 변형형 프록시가 감각 통합 및 일치감에 미치는 영향 연구	김민성	2025.10.17	125
813	이상 음향 탐지를 위한 경량 Diffusion Transformer 모델의 설계 및 구현	구동한	2025.10.17	156
812	VR 제자리걸음 중 주변부 시각 흐름의 위치와 속도가 비의도적 위치 이동에 미치는 영향 연	은승우	2025.10.17	164
811	실시간 공유화면 AI 분석을 통한 온라인 코딩 시험 부정행위 탐지 시스템	정해원	2025.10.17	275
810	지식 그래프 기반의 LLM 수학 추론 성능 향상 기법	박재현	2025.10.17	236
809	Autonomous Driving Agent Identification Under Host	도현철	2025.10.17	161
808	드론 기반 광역 모니터링 지연 시간 최소화를 위한 효율적 데이터 전송 프로토콜 및 선택적	박동진	2025.10.17	147
807	시공간 정보 토큰을 활용한 3D Human Pose Estimation	전민수	2025.10.16	144
806	격자기반 양자내성암호 ML-KEM 하드웨어 설계 및 검증	강은세	2025.10.15	315
805	배리어프리 전시 서비스를 위한 대화형 수어 질의응답 거대언어모델 연구	허석용	2025.10.15	157
804	Long-Axis Guided Diffusion Autoencoder for Through	김준희	2025.10.15	151

석사학위논문

번호

제목

작성자

작성일

첨부파일

조회수

823

RAG를 적용한 컨테이너 기반 마이크로서비스의 오류 식별 방법

조대영

2025.12.15

218