본문 바로가기
일반상식/기술

로봇이 시나리오를 통해 스스로 수행 (feat. 로봇 시장의 혁신)

by MINK0903 2024. 2. 12.
728x90
반응형

로봇이 이제 문도 알아서 열고 다니기 시작 (feat. 로봇 시장의 혁신)
로봇이 이제 문도 알아서 열고 다니기 시작 (feat. 로봇 시장의 혁신)

 

얼마 전 스탠퍼드와 구글의 Mobile ALOHA가 서비스 로봇 시장에서 새로운 혁신을 보여주었는데, 이후로도 흥미로운 발표들이 계속되고 있습니다. 이 이동식 로봇은 문, 서랍, 냉장고를 열 수 있으며, 훈련 시간에는 볼 수 없었던 장면까지 일반화할 수 있습니다. 기술은 ALOHA보다 덜 인상적이지만 실제로는 완전히 자율적입니다. 핵심 아이디어는 간단합니다.

 

학습된 보상 기능으로  OpenAI에서 개발한 컴퓨터 비전 모델인 "CLIP(Contrastive Language–Image Pre-training)"을 사용하여 강화학습(Reinforcement Learning)을 수행합니다. ChatGPT가 사전 훈련 → 강화학습을 통한 인간 피드백(Reinforcement Learning from Human Feedback)을 수행하는 것처럼, 로봇은 원격 제어를 통해 사람이 수집한 궤적에 대한 사전 훈련을 수행한 다음 새로운 시나리오를 통해 스스로 RLHF를 수행할 수 있습니다.

https://x.com/HaoyuXiong1/status/1750884921306947961?s=20

 

X의 Haoyu Xiong님(@HaoyuXiong1)

Introducing Open-World Mobile Manipulation 🦾🌍 – A full-stack approach for operating articulated objects in open-ended unstructured environments: Unlocking doors with lever handles/ round knobs/ spring-loaded hinges 🔓🚪 Opening cabinets, drawer

twitter.com

 

기존 데이터로는 50% 정도 성공률이 나오는데, 추가적인 데이터 인풋 없이 그대로 강화학습을 거쳤더니 성공률이 95%까지 올라갔다고 하네요. 사람이 원격제어를 통해 문을 열게 한 데이터를 샘플로 주고 실제 상황에서 이를 반복시켰더니, 문을 여닫는 과정에서 AI 모델이 알아서 최적화를 진행했다는 뜻입니다.

반응형

 

 

P2P 전자화폐시스템 (feat. 비트코인의 화폐 변화 가능성)

임일섭이라는 분이 "사토시 나카모토의 프로젝트는 실패다. 그가 구상한 것은 2008 페이퍼의 제목에도 등장하듯이 P2P 전자화폐시스템이다. ETF의 기초자산이 되는 투자대상 자산이 도대체 어떻게

mkpark02.tistory.com

 

 

 

2024년 로봇 산업의 5가지 주요 트렌드

1. Generative AI가 로봇을 더 똑똑하고 사회적으로 만들 것 Generative AI는 로봇이 언어를 이해하고, 빠르게 배우며, 복잡한 조작 작업을 수행할 수 있게 해 줄 것이다. 2. 로봇이 창고에서 나와 새로운

mkpark02.tistory.com

 

 

짐 사이몬스의 명언들 (feat. 과학 분야 전반의 인재들과 아이디어 공유)

짐 사이몬스는 과학 분야 전반의 인재들과 아이디어를 나누고 그들을 고용하는 일에 굉장히 적극적인 인물이다. 그러나 언론의 관심을 받는 것은 달가워하지 않으며, 인터뷰도 많이 하지 않는

mkpark02.tistory.com

728x90
반응형

댓글