1:3,人机大战李世石扳回一城,这场牵动了中韩两国数千万网友的“找BUG”大赛也出现了逆转态势。
昨天结婚纪念日输掉比赛的世界围棋冠军李世石,在今天的比赛中先抑后扬,执白的他在面对劣势时,78手下出“神之一手”最终赢下比赛。其实本场比赛开始阶段,李世石布局非常保守,被多名专业棋手认为信心不够,即使在前半盘也一直处于劣势,搜狐科技直播间内很多网友也纷纷惋惜的表示李世石有可能再次失败。
但在下午2点半左右剧情发生大逆转,在李世石还剩不到15分钟就进入读秒时,李世石在第78手下出“神之一手”,而AlphaGo的应对方式也堪称诡异,连续下出判断自己胜率极低的昏招,麦克雷蒙九段甚至认为AlphaGo累了,最终在“犯了人类棋手不会犯的(很多)错误”之后,AlphaGo在接近自己读秒时宣布认输。
在赛后的新闻发布会上,DeepMind团队的负责人表示“我们非常开心,AlphaGo一开始是自己跟自己比赛,这就意味着它在算法上会存在缺陷。我们来到这里就是为了测试它的极限,并找到弱点来不断地提高AlphaGo。我们回到英国之后会找出失败的原因,并找出改变的方法”。
他们还表示,AlphaGo仍处于原型阶段,并没有进化到Beta阶段。但参与比赛的机器人版本是分布式版本的第17个版本,计算能力要强于单机版本的AlphaGo。在它判断出自己的胜率低于一定数值时,就会主动认输。
而李世石谈到本场比赛胜利时很谦虚,认为“神之一手”对于自己来讲只是当时唯一能想到的一步棋。但他表示AlphaGo是有弱点的,只是自己还没发现,可能在它执黑先行的时候会有一些缺陷,挣扎的部分也更多。
对于信息不平等的问题,李世石表示如果能更多了解机器人的信息,可能会容易一些,但这并不是成败与否的关键。DeepMind的负责人也表示并没有针对李世石对AlphaGo进行培训,他们做的只是针对广泛人群的围棋培训。即使要针对李世石进行培训,也需要几百万甚至上亿场比赛数据,这基本是做不到的。
不要被人机世纪大战的噱头冲昏头
科大讯飞董事长刘庆峰曾表示,虽然围棋需要的计算量非常大,但本次人机大战对于人工智能带来的影响力,并不比IBM深蓝电脑与人类进行象棋大战、以及Watson电脑参加脱口秀节目大。本次AlphaGo与李世石的大战之所以引发广泛关注,媒体传播的成熟是主要原因。
DeepMind团队负责人也表示,这仅仅是一步步测试的过程,他们从英国起步,到横扫欧洲,再到韩国本土,甚至下一步挑战中国棋手,都是谷歌逐步测试自家机器人的过程。
所以在AlphaGo赢下第一盘之后,我们就应该相信,人工智能已经可以在围棋领域战胜人类了。此后的几番大战,输赢都已经不太重要,寻找AlphaGo机器人算法弱点的意义反而更大一些。
而李世石“神之一手”之的出现,也恰恰说明了AlphaGo还存在着弱点:策略神经网络在产生可能的落子点时,并没有看到这一点,在这里存在误区和弱点。简单说就是算法的误区给了李世石下出“神之一手”的机会。
而此前很多人工智能专家都表示,连环劫很可能是蒙特卡洛算法的致命弱点,甚至两个劫都有可能对机器人的计算造成极大障碍。这也是在昨日对战中,众多人工智能专家和职业棋手都期待AlphaGo能够打劫的原因。
重新认识深度学习技术的价值
AlphaGo的战绩已经引起了谷歌公司的高度重视,作为谷歌联合创始人的谢尔盖昨天也专门跑到韩国现场“督战”,并在取得胜利后兴奋异常。小米科技CEO雷军昨晚在微信上表示,尽管自己站在AlphaGo这边,但AI赢得如此利落还是远超过自己想象。
人工智能在短暂火爆后曾因为遇到瓶颈而进入低谷期,而随着近几年深度学习技术的成熟,人工智能也重新赢来了高关注度。
中国人工智能学会常务理事刘成林教授在接受媒体采访时表示,AlphaGo的研发团队采用了最先进的深度学习技术,利用深度神经网络对棋盘的局势进行了预测,并且在前期搜集了大量围棋对弈的历史数据,其中包括很多围棋名人的棋谱。它已经具备了从大规模数据中学习的能力,所以几个月内就实现了人类若干年才能够达到的学习效果,这是惊人的学习能力。
而在深度学习技术出现之前,过去采取的方法就是人类耗费巨大的精力编写程序,输入机器及其然后执行预定的功能。而现在人类只需要编写让机器人深度学习的程序,机器就能够实现在庞大的数据积累过程中通过学习来实现智能化操作,并且其水平可以在数据增加的过程中不断得到提升
华盛顿大学电子工程博士,脸书机器学习深度学习研究员谈钊表示,程序应该不会有严重bug,只会有一些边角情况可能没有被考虑到。如果发现了这种边角情况,可以产生一些相关数据,扔给AlphaGo训练一小段时间就行了。(微信号 志明说 文/崔鹏)
您需要登录后才可以评论, 登录| 注册
甜找出15个字是什么?汉字找茬王找字甜关卡2023-04-10
闽南网推出专题报道,以图、文、视频等形式,展现篮球比分直播:在补齐养老事业短板,提升养老服