용어집 (Glossary)

A~Z 순 핵심 용어. `(Ch N)`은 해당 용어가 도입되거나 집중 논의된 챕터.

정의는 모노레포의 공통 마스터(`glossary/master_ko.md`)와 동일하게 유지된다.

A

ACT (Action Chunking with Transformers): Transformer 기반 행동 청킹 — 시연에서 연속 행동 시퀀스를 학습하여 지연 보상 작업을 안정화. (Ch1, Ch4, Ch5, Ch6, Ch7, Ch8)

C

Closed-loop: 폐루프 — 실행 결과를 피드백으로 받아 계획을 갱신하는 구조. (Ch3, Ch8)

Compliance (유연성): 외력에 대한 기계적 순응. 접촉이 풍부한 조작에서 필수. (Ch5)

Co-training: 사람 데이터와 로봇 데이터를 함께 학습시켜 상호 보완적 표현을 얻는 전략. (Ch1, Ch2, Ch3, Ch4, Ch5, Ch6, Ch8, Ch9, Ch10, Ch11)

Cross-embodiment gap (교차 체현 격차): 인간과 로봇, 또는 서로 다른 로봇 간의 운동학적·시각적·촉각적 차이에서 비롯되는 전이 간극. (Ch3)

D

DEXOP: 사람 손 데이터로부터 조작 정책을 학습하는 프레임워크. (Ch1, Ch5, Ch11)

Dexterous manipulation (다지 조작): 다지 핸드를 이용한 정밀 물체 조작 — in-hand rotation, assembly 등. (Ch1, Ch2, Ch3, Ch4, Ch5, Ch6, Ch7, Ch8, Ch9, Ch10, Ch11)

DexUMI: 인간 시연을 로봇 정책으로 변환하는 프레임워크. (Ch2, Ch3, Ch7, Ch8)

Diffusion Policy (확산 정책): 조건부 잡음 제거 확산 과정으로 행동 분포를 학습하는 정책 학습 방법. (Ch1, Ch4, Ch5, Ch6)

DoF (Degrees of Freedom, 자유도): 관절의 독립적 운동 축 수. 인간 손은 약 27 DoF. (Ch2, Ch5, Ch6, Ch7, Ch8, Ch10, Ch11)

E

Embodiment Retargeting (체현 재타겟팅): 한 체현(예: 인간 손)의 동작을 다른 체현(예: 로봇 핸드)의 관절 공간으로 매핑. (Ch5, Ch8)

F

ForceVLA: 힘 센싱을 VLA에 결합한 모델 — MoE 라우팅으로 접촉 모드를 분기. (Ch3)

Foundation Model: 대규모 데이터로 사전학습된 범용 모델 — Sparsh(촉각), pi0(VLA) 등. (Ch1, Ch4, Ch6, Ch8, Ch11)

F-TAC Hand: 고해상도 촉각 센싱을 통합한 로봇 손 플랫폼. (Ch2, Ch3, Ch8, Ch11)

G

GelSight: MIT에서 개발된 광도 입체법 기반 비전 촉각 센서. (Ch3, Ch6, Ch11)

I

In-hand manipulation (손안 조작): 파지 상태에서 물체의 위치·자세를 변경하는 작업. (Ch3, Ch7, Ch11)

M

MANO: 1,000개 3D 스캔으로 학습한 통계적 인간 손 모델 (778 정점, 16 관절). (Ch6, Ch7, Ch8)

MoE (Mixture of Experts): 여러 전문가 네트워크를 동적으로 라우팅하는 아키텍처 — ForceVLA가 대표적. (Ch3)

O

OpenVLA: 오픈소스 VLA 기반 모델 — 7B 파라미터, Open X-Embodiment로 학습. (Ch1, Ch4)

OSMO: 사람 손 모션에서 로봇 policy를 학습·전이. (Ch2, Ch3, Ch5, Ch6, Ch7, Ch8, Ch9, Ch10, Ch11)

P

pi0 (π₀): Physical Intelligence의 flow-based VLA 기반 모델. (Ch1, Ch3, Ch5, Ch9, Ch11)

R

RL (Reinforcement Learning, 강화학습): 보상 최대화를 통한 정책 학습. (Ch1, Ch2, Ch3, Ch4, Ch6, Ch8, Ch9, Ch10, Ch11)

RT-2: 구글 DeepMind의 VLA 모델 — 웹 VQA와 로봇 조작을 통합 학습. (Ch1)

S

Sim-to-Real: 시뮬레이션에서 학습한 정책을 실세계로 이전하는 과정·전략. (Ch3, Ch4, Ch8, Ch11)

T

TacGlove: Park Y.-L. 그룹의 고해상도 촉각 글러브 하드웨어 — 관절각 + 촉각 동시 측정. (Ch1, Ch2, Ch3, Ch4, Ch5, Ch6, Ch7, Ch8, Ch9, Ch10, Ch11)

TacPlay: 사람 촉각 데이터로부터 Play-style 정책을 학습하는 제안 연구. (Ch1, Ch2, Ch3, Ch4, Ch5, Ch6, Ch7, Ch8, Ch9, Ch10, Ch11)

TacTeleOp: 원격 조작과 촉각 co-training을 결합한 제안 연구. (Ch1, Ch2, Ch3, Ch4, Ch5, Ch6, Ch7, Ch8, Ch9, Ch10, Ch11)

Tactile foundation model: 대규모 촉각 데이터로 사전학습된 범용 표현 — Sparsh, UniTouch 등. (Ch8, Ch11)

Tactile skin: 손·팔을 덮는 대면적 유연 촉각 센서 어레이. (Ch2, Ch3, Ch11)

Taxel: 촉각 감지점(tactile pixel). 예: Digit 360 ≈ 8.3M taxels. (Ch3, Ch7)

Teleoperation (TeleOp, 원격 조작): 인간이 로봇을 원격으로 조작하여 시연 데이터를 수집. (Ch1, Ch7)

U

UV map: 3D 표면을 2D 평면으로 전개한 좌표 맵 — MANO UV map 등. (Ch5, Ch6)

V

VLA (Vision-Language-Action): 시각·언어 입력에서 로봇 행동을 직접 출력하는 통합 모델. (Ch1, Ch3, Ch4, Ch5, Ch7, Ch8, Ch9, Ch11)