李飞飞斯坦福大学团队最新引入两个全球平台进行机器人训练

  • 时间:
  • 浏览:2
  • 来源:大发pk10_pk10网址_大发pk10网址

由斯坦福大学人工智能实验室主任李飞飞和她的丈夫斯坦福大学副教授Silvio Savarese领导的新研究项目,引入了三个小 新的全球平台,即RoboTurk和Surreal,旨在提供高质量的任务演示数据,以帮助从事机器人操纵工作的研究人员。

RoboTurk是三个小 众包平台,正在采集人类对“拣选”和“装配”等任务的演示。而Surreal是开放源代码的强化学习框架,可加快机器的学习过程。

研究表明人类怎么控制机器人模拟器

“人类教学机器人”概念你这名 并必须三个小 新概念。模仿学习的最新进展证明了在机器人操纵任务中应用的将会性。去年,OpenAI创建了三个小 机器人系统,该系统都能否从虚拟现实环境中的单另一方类演示中学习行为和动作,因此在现实世界中进行qq克隆好友 。与此一起,伯克利人工智能研究(BAIR)展示了观看视频的一击模仿,这是你这名 训练过程,使机器人才能从人类示例视频中学习技能,并将其学到的知识与日后对目标物体的理解相结合。

OpenAI robotics system

然而,采集相关的高质量人类演示数据仍然是三个小 挑战。 BAIR研究人员指出:“基于视觉的技能的模仿学习通常必须极少量演示技能的专家。”较早的BAIR研究表明,从虚拟现实远程操作中对繁复操作任务进行淬硬层 模仿学习可不是效地训练机器人,以达到最佳的视觉效果。使用原始像素输入来达到单个固定对象的范围将会必须多达30次人类演示。

可见的手— RoboTurk

Li的团队创建了RoboTurk作为众包平台,以获取高质量的人类演示。用户都能否通过智能手机或浏览器轻松访问RoboTurk,并通过即时反馈实时地远程控制机器人仿真。你这名 新颖的可访问性功能旨在扩大全球用户群体。在系统的22小时试运行测试期间,在以下三个小 任务上采集了超过2,220个成功的演示:拾箱和螺母和钉子装配。此外,该测试还证明了即使在地球的另一侧,用户才都能否在加利福尼亚州的斯坦福实验室有效控制机器人的仿真。

看不见的手—超现实主义

该项目转过身的第五个重要框架是Surreal:具有可重现性的可扩展的开源分布式强化学习框架。为了确保Surreal提供持续的控制,Li和她的团队使用了PPO(近端策略优化)和DPG(确定性策略梯度)算法,它们是分布式强化学习算法的淬硬层 可扩展的实现。

超现实世界所含五个分布式组件:参与者,缓冲区,学习者和参数服务器。演员负责产生经验,而缓冲区负责存储经验。一起,学习会在参数服务器存储参数日后从Experience更新参数。另三个小 就消除了对全局同步的需求,一起将数据生成和学习的分离提高了可伸缩性。

更重要的是,Surreal为策略内和策略外强化学习算法提供了全面的支持。四层计算基础架构可确保轻松实施RL实验。开发人员都能否在任何商业云提供商或另一方计算机上部署Surreal系统。

机器人技术中的“ ImageNet”?

斯坦福大学的研究启发了AI社区中的有些人,将RoboTurk描述为机器人的ImageNet。 RoboTurk和Surreal都将高质量数据集集成到高级强化学习中。 希望将来哪几个平台才能采集有关各种任务的数据。 另外,都能否扩展平台以帮助真正的机器人手臂进行远程遥控操作。 该研究小组还认为,都能否开发出更繁复的算法来利用更大的数据集进行策略学习。

毫无什么的问题,RoboTurk和Surreal将会会成为可重复性研究的重要集成平台。