
관측-행동 토큰 표현 및 인과적 트랜스포머 (Observation-Action Tokens and Causal Transformer)
→ 보행(gait)이나 지면 접촉 상태(contact state)와 같은
→ **중요한 정보를 추론(infer)하는 데 도움을 준다
시퀀스 내 각 토큰의 위치 정보(positional information)**를 반영하기 위해
→ **사인파 기반 위치 인코딩(sinusoidal positional encoding)**을 추가로 더한다.