在机器人领域应用深度强化学习,目前主流的一些思路是什么? - 知乎
样本效率做到了之前的deepmind的5-6倍。预计能在10h内实现双足的实机学习
在机器人领域应用深度强化学习,目前主流的一些思路是什么? - 知乎
sim2real确实不是大问题了,但是zero-shot/few-shot sim2real永远是大问 题,因为zero/few-shot learning本身就是大问题
在机器人领域应用深度强化学习,目前主流的一些思路是什么? - 知乎
在机器人领域应用深度强化学习,目前主流的一些思路是什么? - 知乎
RL最大的问题就是data,sim中的充分的data有利于减少我们现实世界的成本
在机器人领域应用深度强化学习,目前主流的一些思路是什么? - 知乎
模拟训练、现实finetune,显然是有意义的,以前使用model-based的奇怪人也喜欢用