凭借Google新算法机器人自学行走平均只需35小时

雷锋网注:图为 Rainbow Dash 在镂空门垫上运动

在机器人领域,让机器人保持站立并进行平稳的运动一直是一个棘手的挑战,因为这需要超高的专业知识和设计水平。尽管一些传统的机器人能在人工控制的情况下完成站立和运动,但它们的活动范围也充满了各种局限性。

我们对照二级市场整个股价走势图来看,其在去年9月20日发生的第一笔以集中竞价方式的减持,从当时的股价走势看,为图中A所标识的位置,为当时股价的阶段性高点。

具体来说,该机器人使用深度强化学习,即结合了深度学习和强化学习两种不同类型的 AI 技术。通过深度学习,系统可以处理和评估来自其身处环境的原始输入数据;通过强化学习,算法可以反复试验,以学习如何执行任务,并根据完成的程度来获得奖励和惩罚。也就是说,通过上述的这种方式,机器人便可以在其不了解环境中实现自动控制策略。     

Google 在该研究中的负责人 Jan Tan 告诉媒体,这项研究花费了大约一年的时间才完成。他说道:

最近飞轮海的风波要从吴尊开始说起。也许他天真地以为互联网是不存在记忆的,所以才会带着太太参加综艺节目《婚前21天》秀恩爱,并且在节目里公布两人早在2004年就已经注册结婚。

雷锋网原创文章,。详情见转载须知。

飞轮海的另一个成员炎亚纶也不消停。最近参加蔡康永和小S的访谈节目《花花万物》时,直言飞轮海成员私下没有联络,“只是队友,朋友还要再进一个层次”。这种正面刚的耿直人设时下比较受欢迎,但是免不了蹭热度的嫌疑。去年炎亚纶来济南签售写真集时接受媒体采访,活动虽然不大,但是对方的派头却不小。声明不接受任何合影,所有的问题必须经过其经纪人提前过审,并且明确要求,不能提任何涉及飞轮海的问题。但是现在炎亚纶又在节目里对着飞轮海侃侃而谈、评头论足,所以这是踩着节点,隔断时间就要拿飞轮海的话题出来遛一遛吗?

不过,环境虽然容易建模,但通常耗时长,而且现实环境中充满了各种意想不到的情况,因此,在模拟环境中训练机器人的意义有限。毕竟,此类研究的最终目标恰恰是让机器人为现实世界的场景做好准备。

有人说刘德华也是隐婚多年,怎么就可以被接受?那是因为人家至少不会带着老婆孩子出来营业圈钱,而是关起门来过好自己的小日子。像吴尊这样真是有些贪心,挣完了当年当偶像时候的那份钱,又来挣当“好老公”这份钱。殊不知你所追忆的似水年华、青梅竹马、两小无猜,就是对粉丝们当年疯狂追星的侮辱和嘲笑。

不过当时的舆论环境真的很宽容,到了2014年吴尊就带着女儿neinei参加了亲子综艺《爸爸回来了》,节目中吴尊带娃真是一把好手,大家立马就忘记了他的隐婚,而记住了他“居家好爸爸”的新人设。在2017年吴尊又带着儿子女儿一起参加了《爸爸去哪儿》第五季,“好爸爸”的人设进一步巩固,接了一大把居家生活品之类的广告代言。也许是因为亲子节目受限,吴尊如今又开始要打造“好老公”的新人设,才会带着老婆参加婚恋综艺。没想到出现大型“翻车”,被盖章“扯谎精”。

网友们掐指一算,飞轮海组合是在2005年年底才成立出道的,那么吴尊早在出道前就已经结婚了,而且隐婚长达15年!由此许多网友变身“飞学考古家”,翻出吴尊当年接受采访时说过的话,那个脸真是啪啪啪打得生疼。一边和一起拍偶像剧的女主角炒CP搞暧昧,一边极力否认已经结婚、力证单身——“希望35岁前能结婚,父母还在催婚想抱孙子”。当2011年被媒体曝光他已经娶妻生娃,吴尊还在否认说被拍的是自己的大嫂。到了2013年吴尊出版新书《决定勇敢》,才在新闻发布会上鞠躬道歉,承认自己2009年已经结婚并且有两个孩子,而道完歉转头又很“勇敢”地卖书,这画风的转变真是让人猝不及防。

我们通过上述明细可以看到,整个减持期间交易时间段最多的时间为去年的11月、12月与今年的2月、5月。而在去年的9月、10月与今年的1月、3月也有减持,但相比较而言,数量不是很大。

为了解决这个问题,Google 近日和佐治亚理工学院以及加州大学伯克利分校的研究人员联合发表了一篇论文,详细介绍了他们如何成功地构建了一个通过 AI 以自学走路的机器人。他们给这只四足小机器人起了个可爱的代号“Rainbow Dash”。     

从整个减持交易明细与二级市场股价走势图对照来看,多数阶段性高点的位置发生的交易,整个时间点把握的也太巧合了吧?是刻意的配合而为之,还是其本人是资本运作的高手,我们不得而知。

在以往的此类实验中,研究人员最初都会让机器人通过模拟来学习真实世界的环境。在仿真环境中,机器人的虚拟体首先与虚拟环境进行交互,然后,算法接收这些虚拟数据,直到系统有能力对这些数据“应对自如”,一个搭载系统的物理形态的机器人才会被放置到现实环境中进行实验。这种方法有助于避免在试错过程中对机器人及其周围环境造成损害。    

Google 和佐治亚理工学院以及加州大学伯克利分校的研究人员并没有“守旧”。在他们的实验中,从一开始就在真实环境中对 Rainbow Dash 进行训练,这样一来,机器人不仅能够很好地适应自己所处的环境,也能够更好地适应相似的环境。    

料显示,耐威科技成立于2008年,以传感技术为核心,紧密围绕物联网、特种电子两大产业链,一方面大力发展MEMS、导航、航空电子三大核心业务,一方面积极布局无人系统、第三代半导体材料和器件等潜力业务,主要产品及业务包括MEMS芯片的工艺开发及晶圆制造、导航系统及器件、航空电子系统等,应用领域包括通信、生物医疗、工业科学、消费电子、航空航天、智能交通等。近年来,耐威科技不断布局和完善第三代半导体领域的布局。

再看去年10月份到11月份的这个期间,这个期间共发生15笔交易,10月份减持仅有一笔,其中14笔均发生在11月份。除去10笔的大宗交易外,其中几笔以集中竞价减持的方式也是几乎在股价的阶段性高点位置,其中以11月5日与11月22日发生两笔数目较大的额度,从明细中的减持均价也可以看出,分别对应图中B与C的位置。

也许是为了反击炎亚纶的言论,辰亦儒今天又在社交网站上发话,“生活中的大小事,笑一笑,没什么大不了”,随后吴尊和汪东城回复互动。网友说,“搞这一出我以为他们不是三十岁而是十三岁。”一帮中年男人玩起女中学生抱团排挤孤立的戏码,把一个解散男团活成了一部宫斗戏,也真是出了奇了。

我们查看明细与之二级市场股价走势对比发现,实控人杨云春这段时间的减持套现路,其减持在阶段性高点占比相当大,交易可谓是准得“离奇”。

尽管 Rainbow Dash 能够独立运动,这并不代表研究人员可以对其“撒手不管”。在一个环境中学习行走的最开始,研究人员仍需要对 Rainbow Dash 手动干预上百次。为了解决这个问题,研究人员限定了机器人运动的环境,让其一次性进行多重动作训练。    

并且公布了其权益变动通过集中竞价和大宗交易方式进行的明细:

根据世界纪录,婴儿从爬行到学会行走的最快速度是 6 个月,而根据论文中的测试数据显示,Rainbow Dash 平均只需要大约 3.5 小时来学习向前、向后和左右转弯等运动——在坚硬平坦的地面上,该机器人学习走路需要 1.5 个小时,在由记忆海绵材质的床垫上大约需要 5.5 个小时,在镂空的地毯上大约需要 4.5 个小时。   

耐威科技2019年年度报告显示,公司2019 年实现营业收入 7.18 亿元,同比增长 0.77%;净利润 1.21 亿元,同比增长 27.62%;扣非后净利润 6,692.61 万元,较上年下降 18.60%。(非经常损益主要来源于出售股子公司重庆航天新世纪(002280,股吧)公司 40.12%股权。)

据了解,因疫情影响,深圳海运行业受到冲击。为稳住深圳外贸基本盘,深圳海关积极协调盐田港集团等各方主体,将深圳盐田现行运作的“盐田港—赣州港”平盐海铁联运与“赣欧”中欧班列优化组合,打通深圳地区货物通过铁路运输经赣州转关至欧洲的物流大动脉。

当年还是红极一时的顶流偶像男团时,飞轮海就在舞台上创造了多次“车祸”现场,被评价为“唱跳俱差”。好在他们赶上了台湾偶像剧的最后黄金时期,靠着青春颜值出演了几部热门偶像剧,才得以保持高位人气。如今偶像们人到中年,停止了青春期的营业,换了种身份和人设继续营业。并且通过抹杀过去的方式,把大家当年共同拥有的青春记忆全盘推翻、概不负责,对于这样的偶像,不得不谴责他们的失职。

时间到5月份,从5月6日开始发生的第一笔大众交易。而在二级市场上,5月6日的前一个交易日4月30日,耐威科技股价又是涨停板,而其后的几笔减持均在5月股价的阶段高点了。

雷锋网了解到,接下来,研究人员希望他们的算法能适用于不同种类的机器人,或适用于多个机器人在同一环境中同时进行学习。研究人员相信,破解机器人的运动能力将是解锁更多实用机器人的关键——人类用腿来走路,如果机器人不会使用腿,它们就不能在人类世界中行走。    

二级市场股价走势图反应,耐威科技从去年12月2日开始启动,走出一波主升的走势,在12月19日冲高回落此后一段时间股价在一个高位区间震荡。而我们看12月的减持明细,12月均以大宗交易的方式减持,而在股价高位震荡中,12月最大的三笔全是在这个区间,这难道又是“巧合”?

我们有兴趣让机器人能够在各种复杂的现实世界环境中运动。不过,要设计出能够灵活处理多样性和复杂性的运动控制器十分困难。    

再看3月的减持明细,其中有三笔减持,三笔减持均在26元左右。

在 Rainbow Dash 自学行走之后,研究人员可以通过连入控制手柄来操控机器人实现理想的运动轨迹,将机器人控制在设定的环境内。此外,机器人在识别到环境的边界后,也会自动往回走。在特定的环境之外,机器人可能会重复摔倒导致机器损坏,那时候就需要另一个硬编码算法来帮助机器人站起来。

然而,让机器人在人类世界中行走是一个至关重要的课题,它们可以代替人类探索地球上不同的地形或未被人类探索过的地区,比如太空。但由于该机器人依赖于安装在其上方的动作捕捉系统来确定位置,该装置暂时还不能直接用于现实世界。    

时间到2020年,通过明细可以看到,在1月仅有一笔减持,而从整个明细表来看,这一笔为整个期间价格次高的一笔。进入2月,期间大宗交易与集中竞价几乎间隔发生,在这个时间段产生了整个期间以32.27元/股最高的一笔,而从股价走势图上来看,在这一笔发生的前一天,股价是涨停的。