Chapter 10: 실험 설계와 검증 계획
요약
TacGlove [#26]/TacTeleOp과 TacPlay [#27]의 가설을 검증하기 위한 실험 설계를 제시한다. 3개 파일럿 공정(캡핑, 라벨, 포장), 필요 하드웨어(글러브, 로봇, 스마트글래스), 정량 평가 지표(성공률, 수렴 시간, 일반화, 비용), 그리고 핵심 ablation 실험(3축 vs binary, co-training 조건별, 촉각 잔차 분해)을 정의한다.
10.1 파일럿 공정 3개
공정 1: 용기 캡핑 (난이도: 높음)
- 동작: 용기를 한 손으로 잡고, 다른 손(또는 같은 손)으로 캡을 시계 방향 회전
- 촉각 요구: 법선력(그립 유지) + 전단력(회전 토크) 정밀 제어
- 3축 vs binary 차별점: Binary는 접촉 여부만 감지, 토크 부족/과다 구별 불가
- 성공 기준: 캡이 완전히 닫히고 규정 토크 범위 내
공정 2: 라벨 부착 (난이도: 중간)
- 동작: 라벨을 용기 표면에 부착하고 균일하게 눌러 기포 제거
- 촉각 요구: 균일 압력 분포 유지
- 3축 vs binary 차별점: 힘 불균형 감지에 3축이 유리
- 성공 기준: 라벨 위치 정확도 ±2mm, 기포 없음
공정 3: 조립 포장 (난이도: 높음)
- 동작: 여러 부품을 정해진 순서로 상자에 배치하고 고정
- 촉각 요구: 다방향 힘 + 정밀 위치 (snap-fit, 끼워넣기)
- 3축 vs binary 차별점: 끼워넣기 시 힘 feedback이 정밀 위치 조정에 필수
- 성공 기준: 모든 부품 올바른 위치, 고정 확인
10.2 필요 하드웨어
| 장비 | 수량 | 용도 | 비고 |
|---|---|---|---|
| TacGlove | 3+ 벌 | 교대 교체 + 여분 | 박용래 교수님 그룹 제작 |
| 3축 자기 촉각 센서 | 8개/글러브 × 3 = 24+ | 촉각 데이터 수집 | BMM350 + 자기 elastomer |
| Allegro Hand 또는 LEAP Hand | 1~2대 | 로봇 실험 | 16-DoF dexterous |
| 스마트글래스 (Aria 또는 동급) | 2대 | Egocentric RGB + head pose | 시간 동기화 필수 |
| 화장품 공정 재현 셋업 | 1세트 | Lab 재현 | 실제 용기, 라벨, 포장재 |
| GPU (A100 × 4+) | 1세트 | Co-training + RL | Isaac Sim 호환 |
| MuJoCo + TACTO | 라이선스 | Sim 환경 | TacPlay sim-first |
10.3 평가 지표
주 지표
| 지표 | 정의 | 목표 |
|---|---|---|
| 성공률 | 공정별 50회 trial 중 성공 비율 | 캡핑 >85%, 라벨 >90%, 포장 >80% |
| 수렴 시간 | 목표 성공률 도달까지의 학습 시간 | TacPlay: 물체별 <4hr |
| 새 물체 일반화 | 학습에 없던 용기/라벨에서의 성공률 | >70% (seen 대비 -15%p 이내) |
| 비용 효율 | 단위 성공률당 인간 노동 시간 | Teleop 대비 3x+ 효율 |
Ablation 지표
| ablation | 비교 조건 | 목적 |
|---|---|---|
| 3축 vs binary | 8센서 3축 vs 8센서 binary | H3 촉각 해상도의 marginal gain |
| Co-training 조건 | A only, B only, A+B(vision), A+B(vision+tactile) | H2 co-training + 촉각의 가치 |
| Scaling curve | Data B 10hr, 50hr, 200hr, 800hr | Tactile scaling law |
| 촉각 잔차 전이 | \Delta_{capping} → 라벨 vs \Delta_{label} 새로 학습 | H3 cross-task 일반화 |
| 잔차 분해 | 기구학 성분 vs 태스크 성분 vs 물체 성분 | 잔차의 구조 이해 |
10.4 실험 프로토콜
Phase A: TacGlove/TacTeleOp 검증 (Month 1~6)
M1~M2: 3손가락 글러브 + 촉각 센서 프로토타입 제작 및 스마트글래스 동기화.
M3: Lab 파일럿 수집 50시간. 캡핑 태스크로 co-training 초기 실험.
- Go/No-Go 체크: co-training(A+B) > A only? 촉각 추가 효과 +5%p 이상?
M4: 5손가락 확장 (가능한 경우). 3축 vs binary ablation 실행.
M5: 200시간 이상 수집. Scaling curve 분석 (10, 50, 200hr). 모든 co-training ablation 완료.
M6: TacGlove/TacTeleOp 논문 작성 및 제출.
Phase B: TacPlay 검증 (Month 3~8)
M3~M4: MuJoCo + TACTO에서 촉각 목표 RL 환경 구축. 보상 함수 설계 및 수렴 검증.
- Go/No-Go 체크: 3개 태스크 중 2개 이상에서 sim 수렴?
M5~M6: Real 환경에서 글러브 장착 play 실험. 캡핑 태스크 최우선.
M7: 촉각 잔차 cross-task 전이 실험 (캡핑 → 라벨).
M8: TacPlay 논문 작성 또는 workshop paper 준비.
Go/No-Go 의사결정
| 조건 | Go | Pivot | Stop |
|---|---|---|---|
| Co-training (A+B > A) | 통계적 유의미 | 트렌드만 | 역효과 |
| 촉각 추가 효과 | +10%p 이상 | +5~10%p | +5%p 미만 |
| Sim RL 수렴 | 3태스크 중 2+ 수렴 | 1개만 수렴 | 0 수렴 |
| 글러브 안정성 | 8hr+ 연속 | 4~8hr | 4hr 미만 |
10.5 예상 결과와 해석
최선의 시나리오
- TacGlove/TacTeleOp: 800hr 촉각 데이터로 co-training → 캡핑 90%+. Tactile scaling law가 log-linear로 확인. 3축이 binary 대비 +10%p 이상.
- TacPlay: 촉각 목표 RL이 sim과 real에서 수렴. Cross-task 잔차 전이 성공. Teleop 0hr로 85%+ 달성.
현실적 시나리오
- TacGlove/TacTeleOp: 200hr 규모에서 co-training 효과 확인, 3축과 binary 차이가 캡핑에서만 유의미. Scaling law는 부분적 검증.
- TacPlay: Sim에서 수렴 확인, real에서 부분적 성공. Cross-task 전이는 limited. Workshop paper 수준.
최악의 시나리오
- TacGlove/TacTeleOp: 촉각 co-training 효과가 vision-only 대비 미미. Binary와 3축 차이 없음. → 하드웨어 contribution(stretchable) + 데이터셋 contribution으로 전환.
- TacPlay: RL 수렴 실패. → "촉각 목표 RL의 도전과 한계" negative result paper.
10.6 우리의 방향과의 연결
이 실험 설계는 Chapter 7(TacGlove), Chapter 8(TacTeleOp), Chapter 9(TacPlay)의 모든 가설을 체계적으로 검증하도록 구성되었다. 특히 3축 vs binary ablation은 Ye et al.[1]의 "binary 85%" 결과에 대한 직접적 대응이며, tactile scaling curve는 EgoScale [2]의 vision scaling law에 대한 촉각 도메인 확장이다. 다음 장에서는 이 실험을 넘어선 장기적 전망을 논의한다 (Chapter 11).
참고문헌
- Ye, Q., et al. (2026). Visual-Tactile Learning for Dexterous Manipulation. Science Robotics. scholar
- Zheng, R., et al. (2026). EgoScale: Egocentric Video Pretraining. arXiv. scholar
- Yin, J., et al. (2025). OSMO: A Large-Scale Tactile Glove. arXiv. #18 scholar
- DexH2R (2024). Task-Oriented Residual RL. arXiv. scholar
- Si, Z., et al. (2025). ExoStart. arXiv. #9 scholar
- Kareer, S., et al. (2024). EgoMimic. arXiv. scholar