当前位置: 锂电网 > 百科知识 > 马斯克又来搞事情 OpenAI要用VR训练机器人

马斯克又来搞事情 OpenAI要用VR训练机器人

发布日期：2019-05-28 21:58:32 浏览次数：64

核心提示：2019年05月28日关于马斯克又来搞事情 OpenAI要用VR训练机器人的最新消息：今天，OpenAI宣布了一种新型算法：“一次性模拟学习(one-shot imitation learning)”，当人类在VR中演示一次某个动作后，机器通

今天，OpenAI宣布了一种新型算法：“一次性模拟学习(one-shot imitation learning)”，当人类在VR中演示一次某个动作后，机器通过学习这一动作就可以执行出相同的结果。

OpenAI是Elon Musk于2015年12月宣布成立的非盈利AI项目，科研人员会将大部分研究成果开源共享；主要关注增强学习和无监督学习——谷歌此前名声大噪的围棋程序AlphaGo用的就是增强学习；而无监督学习需要机器处理大量没有标记的数据，自己找到区分不同数据子集、集群、或者相似图像的办法，有点像婴儿学习世界的方式，一直被视作人工智能的真正潜力释放点。

卷积神经网络之父Yann LeCun有一个经典比喻：如果人工智能是一块蛋糕，增强学习(Reinforcement Learning)就是蛋糕上的一粒樱桃，而监督学习(Supervised Learning)是蛋糕外的一层糖霜，但无监督学习(Unsupervised Learning)才是蛋糕本身。目前我们只知道如何制作糖霜和樱桃，却不知道如何做蛋糕。

一次性模拟学习

OpenAI宣布的这种新型算法“一次性模拟学习(one-shot imitation learning)”指的是，当人类在VR中演示一次某个动作后，比如将桌面蓝色的小盒子叠放在红色小盒子上这个动作，机器通过学习这一动作就可以执行出相同的结果，并且不论桌面盒子摆放的顺序如何，机器都可以准确执行。

这套学习系统由两个神经网络组成：一个视觉网络(vision network)和一个模仿网络(imitation network)。

视觉网络(vision network)获得的图像来自机器人的摄像机，此前，这个视觉网络经过数十万张模拟图像的训练，每张都具有不同纹理、光影效果等(但是从未使用真实图像进行训练)；

模拟网络(imitation network)则必须生成一个与VR演示动作一致的执行步骤，并且推断出该任务的意图，使得在初始设定变更时(如盒子的摆放顺序调乱时)依旧可以找到蓝色的盒子并把它叠在红盒子上。

目前，学术界与产业界都在寻找使用各种训练机器人的手法，比如英伟达CEO黄仁勋在上周的GTC大会上也宣布了一款名为ISAAC的增强学习世界模拟器，创造出一个完全虚拟的、专为训练机器人而打造的世界。

这是一个遵循物理法则但不遵循时间法则的世界，在现实生活中，你想要训练一台机器学会打冰球，你要将这个冰球放在机器前面，一遍一遍地教会它；而在虚拟世界里，机器可以在一秒内重复众多次这样的动作，而且你还可以同时训练一堆机器学习打球，然后找到里面最聪明的一个，将它的“大脑”程序复制出来，创建一堆同样的机器再继续训练筛选。

来源：智东西

关键词： 机器人 vr openai

下一篇：浅谈交流充电桩与直流充电桩
上一篇：全球首款智能汽车前灯问世可穿透特大雨雪

[ 锂电网搜索 ] [ 打印本文 ] [ 违规举报 ]

• PSA与nuTonomy开展自动驾驶合作	• 开源汽车公司OSVehicle将推全球首款模块化自动
• 风挡上的进阶革命？一篇文章读懂 AR-HUD	• 加速技术落地英特尔无人驾驶研发中心落地
• 导电电极对快充电池意味着什么？	• AI/大数据/自动驾驶一大波黑科技亮相2017亚洲C
• 合格率翻倍提升第二期电动汽车传导充电系统互操	• 详解电动汽车锂离子电池管理系统的关键技术
• 锂电池阳极材质膨胀难攻克美中研发团队各推出	• 无仪表板又怎样? 触控平板让Model 3行驶照样玩
• 宝马自动驾驶车中国实测1.6万公里，他们在解决	• 天津50辆纯电动共享汽车上线，采用双重计费模式
• 三分钟让一辆电动车满血复活？这家共享用车的玩	• 滴滴正在考虑接受软银60亿美元投资，部署自动驾

石墨烯电池技术是噱头	纯电动汽车续驶里程存
超级电容器碳材料的研	手机电池技术详解：锂