Login
Get access
在机器人领域应用深度强化学习,目前主流的一些思路是什么? - 知乎
在机器人领域应用深度强化学习,目前主流的一些思路是什么? - 知乎
zhihu.com
updated
9mo ago
Related
Highlights
基于物理引擎的仿真器,如Pybullet、Mujoco、Isaac Gym等,为获取大量机器人交互数据提供了一个有效的方式。研究者们可以先在仿真器中进行训练,之后再迁移到真实机器人上。
from
Article
by
小米技术
Darren LI
added
整个sim-to-real过程如图4所示,共分为四步:
(1)识别出机器人的物理参数,并对机器人进行刚体运动学/动力学建模;
(2)收集真实的关节电机执行数据,训练一个Actuator Net;
(3)在仿真中,利用Actuator Net建模关节电机,并结合第一步中的刚体运动学/动力学建模,进行强化学习;
(4)将第3步中训练得到的策略部署到真机上。
from
Article
by
小米技术
Darren LI
added
目前做大模型+机器人的 最大难点,在于获取数据 。谷歌和微软都选择了从收集家用动作入手,未来其他场景,比如办公室、街道、商场、工厂,如果能训练出来一个个小模型,融入到底层大模型里面,将会是创业公司的重要壁垒。
from
Article
by
siwei
Darren LI
added
Unlock unlimited Related cards