Chapter 11: 산업 적용과 미래 방향
요약
TacGlove [#26]/TacTeleOp/TacPlay [#27]의 화장품 공정을 넘어선 산업 확장 가능성, 촉각 scaling law의 검증이 가지는 장기적 의미, 공장 환경에서의 자율 탐색 안전 프로토콜, 그리고 이 분야의 10개 열린 문제를 논의한다.
11.1 화장품 너머: 산업 확장
전자 조립
- 태스크: 커넥터 삽입, 나사 조이기, 소형 부품 배치
- 촉각 가치: 삽입 시 정밀 힘 제어(과도한 힘 = 부품 파손), 나사 토크 감지
- TacGlove/TacTeleOp 적용: 작업자의 조립 패턴 수집 → 로봇 전이. DEXOP [4] [#10]이 teleop drilling 0%를 보고한 영역에서 촉각 목표 RL이 대안
- 도전: 마이크로미터 수준 정밀도 요구, ESD(정전기 방전) 위험
식품 포장
- 태스크: 유연 포장재 handling, 식품 배치, 밀봉
- 촉각 가치: 변형 물체(과일, 빵 등)의 손상 없는 파지. 경도/숙성도를 힘 피드백으로 판단
- TacGlove/TacTeleOp 적용: 식품 작업자의 handling 패턴 수집. "이 정도 힘이면 멍이 든다"는 촉각 경계를 학습
- 도전: 식품 안전 규제, 위생 요구(글러브 세척/교체 필수)
의료 기기
- 태스크: 수술 도구 조립, 임플란트 부품 검사, 멸균 포장
- 촉각 가치: 극도의 정밀도와 일관성 요구. 힘 과다 = 부품 손상/환자 위험
- TacGlove/TacTeleOp 적용: 숙련 기술자의 조립 패턴을 촉각 포함하여 수집
- 도전: FDA/KFDA 규제, 클린룸 호환성, 실패 허용 범위 극히 낮음
배포 지표
산업 현장에 실제 배포할 때, 단일 에피소드 성공률만으로는 지속적 운용 능력을 평가하기 어렵다. Habilis-β[9] [#33]는 단일 에피소드 성공률 대신 TPH(시간당 태스크 수)와 MTBI(평균 개입 간격)라는 배포 지표를 제안했다. 실제 환경에서 π0.5 대비 6.53배 TPH, 2.98배 MTBI 향상을 보고했다. 이러한 지속적 운용 효율 지표는 TacTeleOp의 산업 적용 검증에도 적합한 평가 프레임워크이다.
산업별 적합성
| 산업 | 촉각 필요도 | 규제 장벽 | TacGlove/TacTeleOp 적합도 |
|---|---|---|---|
| 화장품 | 높음 | 낮음 | 최적 (1차 대상) |
| 전자 조립 | 매우 높음 | 중간 | 높음 (2차 대상) |
| 식품 포장 | 높음 | 높음 | 중간 |
| 의료 기기 | 극도 | 매우 높음 | 장기적 |
11.2 촉각 Scaling Law의 장기적 의미
UMI-FT(Chapter 5)가 보인 결과 — 2개의 F/T 센서 추가만으로 화이트보드 닦기 16%→92% — 는 촉각/힘 데이터의 한계 효과가 시각 데이터보다 클 수 있음을 시사한다. EgoScale [1]이 시각 데이터에서 log-linear scaling law(R² = 0.9983)를 실증한 것은, 데이터 투자의 ROI를 사전에 계산할 수 있게 한 전환점이었다. EgoScale의 시각 log-linear scaling(R²=0.9983)에 대응하는 '촉각 scaling curve'를 실증하는 것이 TacTeleOp의 핵심 과학적 목표 중 하나이다. TacTeleOp이 촉각 데이터에서 유사한 scaling law를 확인한다면:
- 투자 예측 가능성: "캡핑 성공률 95% 달성에 촉각 데이터 X시간 필요"를 사전 계산 가능
- Tactile Foundation Model의 근거: 대규모 촉각 데이터로 pretrain한 범용 촉각 모델의 가능성
- Vision + Tactile 결합 scaling: 시각과 촉각을 결합할 때 scaling curve가 어떻게 변하는가 — 상승작용인가 포화인가
- 산업 의사결정 도구: 공장 관리자가 "촉각 글러브 투자 대비 자동화 수준"을 계산할 수 있는 정량적 근거
만약 촉각 scaling이 시각보다 빠르게 수렴한다면(적은 데이터로 큰 효과), 촉각의 정보 밀도 우위가 입증되며, "800시간의 촉각 데이터 > 10,000시간의 시각 데이터"라는 TacTeleOp의 가장 강력한 차별화 논거가 확립된다.
11.3 손바닥 중심 하드웨어의 진화
2024년 이후의 로봇 손 연구는 하나의 뚜렷한 흐름을 보인다 — 손바닥이 "보조 표면"에서 "결정 지점"으로 이동하고 있다. 오랜 기간 손가락(특히 손끝)에 집중됐던 연구 초점이 손바닥으로 옮겨오면서, 하드웨어 설계 공간이 네 단계의 스펙트럼으로 정리된다.
1단계 — Passive compliant palm. [12]의 ROMEO는 수동적으로 휘어지는 compliant 손바닥 위에 GelSight형 시각 촉각을 결합했다. 1-DOF passive joint를 구조 자체로 emulate하여 enveloping grasp 시 접촉 면적을 크게 늘리는 접근이다. "손바닥은 actuated일 필요가 없다, 단지 순응만 해도 큰 이득"이라는 명제를 제시한다.
2단계 — High-density tactile palm. [13]의 TacPalm SoftHand는 손바닥에 1280×800 micro-camera 기반 시각 촉각을 내장하여 유효 밀도 181,000 units/cm²(사람 손 ~750배)를 달성하고, Indentation Contour Area(ICA)로 finger inflation을 자동 트리거한다. [14]의 F-TAC Hand는 17개 VBTS로 palmar 70%를 0.1 mm 해상도로 커버, multi-object delivery에서 53.5%→~100%의 적응률 점프를 보였다. 이 단계의 메시지는 "손바닥 센싱 밀도가 곧 정책 성공률"이다.
3단계 — Articulated palm. [15]의 ISyHand는 손바닥 자체가 관절을 갖도록 설계되어, 손바닥의 굽힘·펼침이 독립 DOF로 추가된다. 시뮬레이션에서 fixed-palm 기준선 대비 cube reorientation 성능이 우위를 보였으며, $1,300 수준의 저비용으로 articulated palm이 가능함을 입증했다.
4단계 — Active palm. [16] (npj Robotics)은 손바닥에 actuation과 고해상도 VBTS를 동시에 결합하고 reconfigurable fingers와 능동 협조시키는 active palm 개념을 공식화한다. "Most prior work has concentrated on fingertips, leaving the functional role of the palm largely overlooked"라는 지적은 분야 차원의 축 이동을 선언하는 성격이다.
이 네 단계를 관통하는 종합 리뷰가 [17]의 "Actuated Palms for Soft Robotic Hands: Review and Perspectives"로, passive vs active, pneumatic/cable/tendon, rigid/compliant/hybrid의 taxonomy와 함께 손바닥의 네 가지 기능(force 분배, workspace 확장, 파지 안정성, conformability)을 정리한다. 이와 더불어 [18]의 Sparsh-skin은 magnetic 모달리티로 368채널 whole-hand 촉각을 구현하면서 손바닥 센서의 기여를 어블레이션으로 정량화했고, [19]은 DRL 환경에서 손바닥 위치가 손끝과 동등(혹은 소형 객체에서는 더 중요)함을 정량 입증했다. 즉 하드웨어의 진화와 센싱 정책의 진화가 동시에 손바닥 쪽으로 수렴하고 있다.
TacGlove 관점에서의 다음 진화 축
이 흐름 위에서 TacGlove/TacTeleOp/TacPlay의 다음 방향은 세 축으로 수렴한다.
- 손바닥 센싱 밀도의 단계적 증가. 현재의 3 palm sections(thenar/hypothenar/central)를 넘어, 손바닥 영역에 더 많은 채널을 배치하는 설계 반복. Sparsh-skin의 4×6 grid가 현실적 상한이며, 그 사이 어느 좌표가 비용 대비 효과 최적인지는 TacTeleOp의 ablation 질문이다.
- Palm–finger 능동 협조. HX5-D20 자체는 fixed palm이지만, TacGlove가 제공하는 24채널 손바닥 신호를 상위 정책의 action trigger로 사용하면 active palm의 대부분 기능을 소프트웨어 층에서 에뮬레이트할 수 있다. 이는 TacPlay가 자율 play로 자동 학습할 수 있는 공간이다.
- Palm-down multi-object 시나리오의 정복. 화장품 공정의 실제 팬텀은 palm-up이 아니라 palm-down이다. 이 방향에서 손바닥은 중력 도우미가 아니라 능동적 힘 조절 지점이 된다. F-TAC Hand의 palmar 70% coverage가 multi-object에서 decisive했던 것은 이 전환의 직접 증거이며, TacGlove가 magnetic 저비용 모달리티로 이를 재현할 수 있는지가 TacTeleOp의 가장 야심찬 열린 질문이다.
종합하면, "손바닥이 주인공인 시대"가 이미 시작됐고, TacGlove는 인간 착용 가능한 폼팩터에서 이 흐름을 구현하는 가장 실용적 경로다.
11.4 안전한 자율 탐색 프로토콜
TacPlay의 자율 play는 산업 현장에서 안전 문제를 수반한다. 현재까지 공장 환경에서의 로봇 자율 탐색 안전 프로토콜을 다룬 연구는 전무하며, 이 자체가 연구 기여 영역이다.
제안 프로토콜
Level 1 — 시뮬레이션 (안전)
- MuJoCo + TACTO에서 모든 새 태스크를 먼저 실행
- 물리적 제약 검증: 최대 힘, 속도, 작업 영역
- 수렴 확인 후에만 Level 2로 이전
Level 2 — 감독 하 실세계 (제한적 안전)
- 인간 감독자 1인 상시 대기
- 힘 한계: OSMO 범위(0.3~80N)의 70% = 0.3~56N
- 속도 한계: 정상 작업 속도의 50%
- 비상 정지: 촉각 이상(급격한 힘 변화 >20N/100ms) 시 즉시 정지
- 1시간 안전 이벤트 없으면 Level 3로 이전
Level 3 — 자율 운영 (모니터링)
- 힘 한계를 정상 범위로 확대 (0.3~80N)
- 원격 모니터링 (촉각 데이터 실시간 스트리밍)
- 야간 무인 운영 가능
- 이상 탐지 시 자동 정지 + 알림
안전 지표
| 지표 | 허용 범위 |
|---|---|
| 최대 접촉력 | <80N (OSMO 센서 범위) |
| 급격한 힘 변화 | <20N/100ms |
| 작업 영역 이탈 | 0회 |
| 물체 파손 | <1% (100회 play당 1회 미만) |
| 글러브 센서 이상 | 감지 후 5초 내 정지 |
11.5 10개 열린 문제
이 서베이에서 식별된, TacGlove/TacTeleOp/TacPlay를 넘어서는 분야 전체의 열린 문제:
1. 촉각 Foundation Model은 가능한가?
EgoDex(829hr), BuildAI(10,000hr) 규모의 촉각 데이터셋이 구축되면, 시각의 CLIP/DINOv2에 해당하는 범용 촉각 표현 모델을 학습할 수 있는가? 촉각의 cross-domain 전이(식품 → 전자 → 의료)가 가능한가?
2. 촉각에서 Emergent Alignment이 발생하는가?
pi0 [2] [#2]에서 관찰된 시각적 emergent alignment이 촉각에서도 발생하는가? 발생한다면 어느 규모에서? 시각보다 적은 데이터로 가능한가?
3. 센서 표준화
OSMO의 자기 센서, VTDexManip의 piezoresistive, TacCap의 FBG 등 센서별 데이터가 호환되지 않는다. 센서 무관(sensor-agnostic) 촉각 표현을 정의할 수 있는가?
4. 시뮬레이션의 촉각 정확도
MuJoCo, Isaac Gym의 접촉 역학 시뮬레이션이 실세계 촉각 센서 읽기를 얼마나 정확히 재현하는가? Sim-to-real gap이 시각보다 크다면, TacPlay의 sim-first 전략이 제한적일 수 있다.
5. 인간 피부 17,000 vs 글러브 8~12: 최적 밀도는?
Ye et al.의 binary 85%가 보여주듯, 현재는 센서 수가 적어도 작동한다. 그러나 최적의 센서 밀도는? 태스크 복잡도에 따라 필요 밀도가 달라지는가?
6. 촉각 잔차의 수학적 구조
TacPlay의 cross-task 일반화 가설은 "기구학 차이 = 물리적 상수"라는 직관에 기반한다. 이 직관을 수학적으로 정식화하고, 잔차가 일반화 가능한 조건을 명시할 수 있는가?
EquiTac[11] [#37]은 촉각 데이터의 수학적 구조를 활용한 첫 번째 체계적 접근이다. GelSight 표면 법선맵의 SO(2)-등변성을 이용해 10개 시연만으로 90% 성공률을 달성했다. 이 결과는 촉각 데이터에 내재된 기하학적 대칭성을 활용하면 데이터 효율성을 극적으로 높일 수 있음을 시사하며, TacGlove의 분산 촉각 데이터에도 유사한 구조적 정규화가 존재하는지는 중요한 열린 문제이다.
7. Multi-fingered Coordination의 촉각 역할
현재 촉각 연구는 개별 손가락의 접촉에 집중한다. 다손가락 협조 작업(in-hand rotation, bimanual manipulation)에서 촉각의 역할은? 여러 손가락의 촉각 신호가 동시에 조율되어야 하는 태스크에서의 학습은?
8. 작업자 변동성의 활용
5명의 작업자가 같은 태스크를 다르게 수행할 때, 이 변동성은 노이즈인가 아니면 유용한 다양성인가? 변동성이 클수록 일반화가 좋아지는가, 아니면 학습이 어려워지는가?
9. 촉각 데이터의 프라이버시
공장 작업자의 촉각 패턴은 개인 생체 정보에 해당할 수 있다. 힘 프로파일에서 개인 식별이 가능한가? 촉각 데이터의 익명화 방법은?
10. 촉각 기반 Quality Control
학습된 촉각 정책이 생산 과정에서 품질 검사에도 활용 가능한가? 캡 토크가 규정 범위 내인지, 조립이 완전한지를 촉각 피드백으로 실시간 판단하는 것이 가능한가?
11.6 결론
본 서베이는 "사람 손에서 로봇 손으로"라는 cross-embodiment tactile transfer의 현재 위치를 분석하고, TacGlove, TacTeleOp, TacPlay라는 세 연구 방향을 제안했다.
Part I에서 텔레오퍼레이션의 구조적 병목(Chapter 1), 대안적 수집 하드웨어의 촉각 공백(Chapter 2), 촉각의 contact-rich 필수성(Chapter 3)을 확인했다. Part II에서 Data B만의 가능성과 한계(Chapter 4), co-training의 확립된 효과와 촉각 미포함(Chapter 5), embodiment gap의 촉각 차원 미해결(Chapter 6)을 분석했다. Part III에서 이 gap들을 공략하는 TacGlove(Chapter 7), TacTeleOp(Chapter 8), TacPlay(Chapter 9)를 제안하고, Part IV에서 실험 설계(Chapter 10)와 장기 전망(Chapter 11)을 제시했다.
이 연구의 성공은 세 가지 조건에 달려 있다: (1) stretchable 촉각 글러브(TacGlove)의 하드웨어 실현, (2) 다물체 파지와 촉각 co-training(TacTeleOp)의 실험적 검증, (3) 촉각 잔차 학습을 통한 텔레오퍼레이션 완전 제거(TacPlay)의 장기적 실현. 올해는 (1)과 (2)에 집중하고, (3)은 내년도 후속 연구로 추진한다. 기존 연구(OSMO, DexH2R, EgoScale)가 각 구성요소의 가능성을 보여주었기에, 통합 시스템의 실현 가능성은 합리적으로 기대할 수 있다.
참고문헌
- Zheng, R., et al. (2026). EgoScale: Egocentric Video Pretraining. arXiv. scholar
- Physical Intelligence (2025). pi0. arXiv. #2 scholar
- Yin, J., et al. (2025). OSMO. arXiv. #18 scholar
- Fang, H.-S., et al. (2025). DEXOP. IEEE RA-L. #10 scholar
- Ye, Q., et al. (2026). Visual-Tactile Learning. Science Robotics. scholar
- DexH2R (2024). Residual RL. arXiv. scholar
- Hoque, R., et al. (2025). EgoDex. arXiv. scholar
- BuildAI (2025). Egocentric-10K. Hugging Face. scholar
- Habilis Team (2026). Habilis-β: On-Device VLA. arXiv. #33 scholar
- Zhang, H., et al. (2025). UMI-FT: UMI on Legs with Force/Torque. arXiv. #36 scholar
- Rong, Z., et al. (2025). EquiTac: SO(2)-Equivariant Tactile Policy. arXiv. #37 scholar
- Liu, S. Q., & Adelson, E. H. (2024). A Passively Bendable, Compliant Tactile Palm with RObotic Modular Endoskeleton Optical (ROMEO) Fingers. ICRA 2024. https://arxiv.org/abs/2404.08227 scholar
- Zhang, N., Ren, J., Dong, Y., Gu, G., & Zhu, X. (2025). Soft Robotic Hand with Tactile Palm-Finger Coordination (TacPalm SoftHand). Nature Communications 16:2395. https://doi.org/10.1038/s41467-025-57741-6 #40 scholar
- Zhao, Z., et al. (2025). Embedding high-resolution touch across robotic hands enables adaptive human-like grasping (F-TAC Hand). Nature Machine Intelligence. https://arxiv.org/abs/2412.14482 #39 scholar
- Richardson, B. A., Grüninger, F., Mack, L., Stueckler, J., & Kuchenbecker, K. J. (2025). ISyHand: A Dexterous Multi-finger Robot Hand with an Articulated Palm. IEEE-RAS Humanoids 2025. https://arxiv.org/abs/2509.26236 scholar
- Zhou, Y., Lee, W. S., Gu, Y., & She, Y. (2026). Tactile-reactive gripper with an active palm for dexterous manipulation. npj Robotics, 4, 13. https://www.nature.com/articles/s44182-026-00079-y scholar
- Pozzi, M., Malvezzi, M., Prattichizzo, D., & Salvietti, G. (2024). Actuated Palms for Soft Robotic Hands: Review and Perspectives. IEEE/ASME Transactions on Mechatronics, 29(2):902–921. scholar
- Sharma, A., et al. (2025). Self-supervised perception for tactile skin covered dexterous hands (Sparsh-skin). arXiv. https://arxiv.org/abs/2505.11420 scholar
- Almeida, J. D., Falotico, E., Laschi, C., & Santos-Victor, J. (2025). The Role of Touch: Towards Optimal Tactile Sensing Distribution in Anthropomorphic Hands for Dexterous In-Hand Manipulation. IEEE ICNSC 2025. https://arxiv.org/abs/2509.14984 #41 scholar