【重磅综述】用于机器人操作的深度强化学习- 知乎

zhuanlan.zhihu.com

RelatedHighlights

来自耶鲁大学的顶级 Paper！一篇 150 页的关于机器学习在金融领域应用的综述论文🔥 详细了解如何在金融领域应用机器学习解决实际的资金，投资等内容，包括各种现成的案例，最佳实践和未来研究方向！⚡️ https://t.co/VPKmfqtqJa... See more

Tom Huang

x.com

AI研究的历史表明,相对简单、能够随着数据规模扩大的算法总是胜过那些复杂却无法随数据规模扩大的算法

渣大米 • Article

对于locomotion,外界环境大多可以视为一个刚体,物理特性基本可以忽略。这使得可以花费更多时间来建立机器人本体的精确物理模型,以及设计更复杂的物理引擎。这是为什么RL更适合Locomotion

渣大米 • Article

Alexandre Kantjas’ Post

Alexandre Kantjas linkedin.com

The Bitter Lesson

hyperthesis incompleteideas.net

整个sim-to-real过程如图4所示,共分为四步:

(1)识别出机器人的物理参数,并对机器人进行刚体运动学/动力学建模;

(2)收集真实的关节电机执行数据,训练一个Actuator Net;

(3)在仿真中,利用Actuator Net建模关节电机,并结合第一步中的刚体运动学/动力学建模,进行强化学习;

(4)将第3步中训练得到的策略部署到真机上。

渣大米 • Article

渣大米 • Article

Alexandre Kantjas’ Post

The Bitter Lesson

小米技术 • Article