科学技术/NEWS CENTER

阿尔法狗之父:AlphaGo Zero 3天走完千年棋史

发布时间:2017-12-30

  阿尔法狗的父亲:AlphaGo Zero 3天内走过千年象棋历史

  (原标题:阿尔法之父的秘密最强“狗”如何制作:3天走过人类千年象棋历史)#EndText .video-info a {text-decoration:none; color:#000;} #endText。 video-info a:hover {color:#d34747;} #endText .video-list li {overflow:hidden;向左飘浮; list-style:none;宽度:132px;身高:118px;位置:相对; margin:8px 3px 0px 0px;} #entText .video-list a,#endText .video-list a:visited {text-decoration:none; color:#fff;} #endText .video-list .overlay {text-align:left; padding:0px 6px;背景颜色:#313131; font-size:12px; width:120px;位置:绝对;底部:0px; left:0px; #fff;} #endText .video-list .on {border-bottom:8px solid#c4282b;} #endText .video-list .play {width:20px; height:20px;背景:url(http:// image。right:12px; top:62px; opacity:0.7; color:#fff; filter:alpha(opacity = 70); _background:none; _filter:progid:DXImageTransform。Opacity:1;过滤器:alpha(opacity = 1)100);澎湃新闻记者余涵琦王欣欣伦敦当地时间10月18日在十八号(北京时间十九日凌晨一点),Google的DeepMind团队宣布AlphaGo最强大版本AlphaGo Zero的演变,AlphaGo的新版本功能强大,AlphaGo击败了Li Shih Shih以3000万游戏作为训练数据,AlphaGo Zero使用了490万游戏数据,经过3天的训练,AlphaGo Zero以100:0赢得了与Alpha Stone的比赛。DeepMind联合创始人兼首席执行官AlphaGo的父亲Demis Hassabis ,AlphaGo团队负责人Dave Sliver等也在官方博客上发表了一篇文章,解释了如何制作狗狗的最强版本,以及它们与前人的不同之处。不同于上一代,开始研究大量人体检查的AlphaGo,AlphaGo Zero从“宝贝般的白皮书”开始,通过三天数百万次的自我演练完成了千百年来的人类进步游戏和探索了很多,竟然移动法律。 Hassabis等人,“AlphaGo Zero:从零开始”席尔瓦在武进人机峰会上的发言从人工语音识别和图像分类到基因和药物研究,人工智能发展迅速。这些专家系统中的许多是使用大量的人员经验和数据开发的。但是,在一些具体问题上,人类的知识要么太昂贵,要么不可靠,要么缺乏。因此,人工智能研究的长期目标之一就是跳过这一步,创造在没有人类输入的最具挑战性的领域内达到超人类水平的算法。我们在“自然”杂志上发表的最新论文显示了实现这一目标的关键一步。本文介绍了AlphaGo计算机程序的最新发展,AlphaGo计算机程序打败了人类进步冠军。 AlphaGo Zero更强大,可以成为历史上最强大的玩家。前几代的AlphaGo最初是经过数千名业余和专业的国际象棋棋手的训练,学习如何下棋。 AlphaGo Zero跳过这一步,玩下棋,完全摆脱混乱。就这样,它迅速赶上了人类,赢得了上一代AlphaGo连胜100场,击败人类冠军李世石。 AlphaGo Zero能够成为自己的老师,就是使用一种叫做密集学习的新模式。该系统从一个对Go一无所知的神经网络开始,将神经网络与强大的搜索算法和自我游戏相结合。在游戏过程中,神经网络会不断调整,升级,预测一举一动和最后的赢家。升级的神经网络和搜索网络结合成为一个更强大的新版本的AlphaGo Zero,实现了往复循环。每一轮,系统的表现都有所提高,自我游戏的质量也有所提高。神经网络越来越准确,AlphaGo Zero版本越来越强大。这种技术比AlphaGo以前的所有版本更强大。这是因为它不再受人类知识的限制,而是从宝宝的白色状态,直接到世界上最强大的玩家,AlphaGo本身。AlphaGo Zero与上一代相比有一些明显的不同:首先,AlphaGo上一代只包含一小部分设计特性输入,其次,AlphaGo Zero只使用一个单一的神经网络,在以前的版本中,AlphaGo使用“策略网络”来选择下一步以及“价值网络”来预测每一步之后的胜利者,在新版本中,两个神经网络结合在一起,可以更有效地进行训练和评估;第三,AlphaGo Zero不使用快速随机游走在以前的版本中,AlphaGo使用快速步行的方法来预测哪个玩家会从目前的情况中获胜,相反,新版本依靠高质量的神经网络来评估国际象棋的情况。所有这些差异都会提高系统的性能并使其更加普及。但是,算法的变化使系统更加强大和高效。经过短短三天的自我演奏,AlphaGo Zero赢得了先前击败世界冠军李世石100:0的AlphaGo版本。经过40天的自我发挥,AlphaGo Zero变得更加强大,超越了AlphaGo这个“主”版本此前击败了世界第一人克杰。通过数百万次的自我游戏,AlphaGo从头开始学习了Go,并在几天内积累了数千年的人类知识。 AlphaGo Zero也发现了新的知识,并制定了打破常规的策略和策略,超越了与李石和高基斗争时创造的策略和策略。这些创造性的时刻让我们相信,人工智能将成为人类智能的增强者,并帮助我们解决人类面临的一些严峻挑战。虽然刚刚出现,AlphaGo Zero已经迈出了实现这一目标的关键一步。如果类似的技术可以应用于蛋白质折叠,降低能耗和寻找新材料等其他结构性问题,则可以创造一个社会有益的突破。

新天地娱乐官网

2017-12-30

更多内容,敬请关注:

新天地娱乐官网官网:/

新天地娱乐官网新浪官方微博:@新天地娱乐官网

新天地娱乐官网发布微信号: