据报道,2016年谷歌人工智能“阿尔法围棋”(AlphaGo)机器人和韩国围棋高手李世石之间的围棋人机大战今日上演,备受世界关注。
谷歌人工智能“阿尔法围棋”(AlphaGo)机器人与韩国围棋高手李世石之间的五盘对局今日在首尔拉开序幕。李世石8日在首尔举行的记者会上表示,仍对这次对弈有自信,但以5比0全胜并不容易,我应该要紧张起来。
当天,阿尔法围棋研发商谷歌DeepMind公司在记者会上介绍阿尔法围棋的技术原理。李世石听取公司的说明后表示,我以前不懂阿尔法围棋的算法,但现在有了一点了解。因为马上要对弈,我有点紧张。
李世石曾在2月22日举行的记者会上表示,这次比赛我有信心,我的目标是实现五盘全胜。但李世石在今天的记者会上则“调低”了目标,表示“全胜并不容易”。对此,李世石解释说,我认为人工职能的直觉力和感觉无法达到人类的水平,但今天了解阿尔法围棋的算法后,觉得人工智能在一定程度上可以模仿人类的直觉力。
李世石表示,当然有输给阿尔法围棋的可能性,但计算机下棋时体会不到围棋的美和人的美,因此即使我输给它,围棋的价值不会受损。明天我会开心地下棋。
李世石和阿尔法围棋的五盘对局将于3月9日、10日、12日、13日、15日在首尔四季酒店进行。比赛用时为每方2小时,1分钟读秒3次,比赛采用中国围棋规则。这场对弈的胜者将夺得100万美元的奖金,若阿尔法围棋获胜,奖金将捐给联合国儿童基金会和STEM教育及围棋相关公益团体。
IT界观点不一
作为人工智能界的专家,李承镐的观点与韩国近六成民众一致:李世石会获得压倒性的优势。他认为,即便是机器人有其独有的优势,依然无法对于状态良好的李世石产生巨大威胁。他笑称:“毕竟很少会有顶级的专业选手,连续好几场出现致命失误,除非他不愿意继续对决下去。”
创新工场CEO、谷歌前全球副总裁兼大中华区总裁李开复也在知乎上表示,AlphaGo这次要打败李世石比较悬,但是1~2年之内必然完胜人类。
李开复指出,樊麾只是职业二段,而李世石是职业九段,差别是巨大的,“就比如说一个人乒乓球打败了非洲冠军,并不代表他就可以成功挑战中国冠军。”
与上述观点不同,搜狗CEO王小川认为,人工智能将会完胜。他提出了自己的两个断言:AlphaGo将会完胜李世石;除了围棋,人工智能在其他博弈类的封闭游戏里也会横扫人类。“我认为谷歌的那套深度学习的方法加上搜索空间的方法,大体上可以覆盖人的思考,而且它可能做得更好。”王小川表示。
AlphaGo的研究者戴维·席尔瓦表示,AlphaGo系统的关键是,将围棋巨大无比的搜索空间压缩到可控的范围之内。为了达到这一目的,AlphaGo系统将最先进的蒙特卡洛树状搜索技术与两个深层神经网络相结合,每个深层神经网络均包含许多层,每层又包含数以百万计的神经元一样的连接。
在AlphaGo两种不同的神经网络中,“策略网络”的作用是预测下一步,并用来将搜索范围缩小至最有可能触发的那些步骤;另一个神经网络“价值网络”则是用来减少搜索树的深度,每走一步估算一次获胜方,而不是搜索所有结束棋局的途径。
上述方法使得AlphaGo的搜索方式相比之前的方法更人性化。例如,深蓝采用强力方法搜索的棋子位置要比AlphaGo多数千倍。而AlphaGo则相反,它通过想象下完剩余棋局来对下一步进行预判,如此多次反复。在上述模拟游戏中,策略网络提出下一步的智能建议,而价值网络则对走过的每个位置进行评估。
具体而言,谷歌首先采用围棋专业棋手的3000万步下法对“价值网络”进行训练,直到该网络对人类下法预测准确率达到57%(AlphaGo之前的纪录是44%)。
但AlphaGo的目标是击败水平最高的人类棋手,而不仅仅是模仿他们。为了做到这一点,AlphaGo学会自己发现新策略,通过自身两个神经网络之间成千上万的对弈,采用被称为强化学习的试错法逐步进行改善。这种方法提高了“策略网络”的效率,以至于最原始的“神经网络”可以击败最尖端、构建有巨大无比的搜索树的围棋软件。
“在与樊麾二段比赛后,我们对AlphaGo进行了多次更新。请大家关注AlphaGo以什么样的方式与最优秀的棋手李世石对弈。”哈萨比斯昨日预计,“再过大约5年时间,AI将全面超越最顶尖人类棋手。”
围棋界:人肯定赢
对于人机大战结果的预测,中韩围棋界都站在人类一边。
3月7日晚,棋圣聂卫平向包括《第一财经日报》在内的媒体表示,人工智能缺乏判断力,与人类棋手对弈很难取胜。
“很多职业棋手,包括最顶尖的职业选手,(对于局势的)看法会有很多分歧,比如李世石认为形势可以,而柯洁可能认为不行。对于围棋的判断,是计算机的大难题,我不相信现在有电脑能突破这个,所以人和电脑下,百分之一百是人赢。”聂卫平表示。
聂卫平的依据在于,围棋变化可以归结为361的阶乘,本身就是一个无限大的数,其中还包含打二还一、打三还一、打结、倒扑等各种技法,可以说是变化无穷。
“李世石最近的状态非常好。”同一天,中国围棋选手柯洁表示。言下之意,目前的人工智能还不足以挑战现役一流围棋棋手。
此前,柯洁曾多次击败李世石,并在不久前收到了来自国内异构智能公司围棋AI“异构神机”的挑战。但他并未应战。
韩国女棋手尹英敏(音译)也站在李世石这边。被誉为“韩国围棋推广第一人”的她昨日向本报记者表示:“按照双方水平来看,李世石九段不仅会胜出,而且会以压倒性的优势胜出,如果李世石输掉一场都会被认为是重大失误。”
“但我们需要注意到,本次比赛的赛制设计对于AlphaGo比较有利。”尹英敏补充道。
据了解,此次人机交手将大战5盘,日程分别是9日、10日、12日、13日和15日,比赛在韩国时间下午1时(北京时间12时)开始。尹英敏认为:“在这种匆忙日程下,人类的疲劳度将会上升,但计算机却不会疲劳。”
其次,双方各有2小时的布局时间及3次60秒的读秒(棋手将限时用完后的倒计时时间)。每场比赛预计需要4~5个小时。“充裕的时间为计算器的运算提供了有利条件。”尹英敏表示,AlphaGo的另一个优势是,而本次对局使用的是中国围棋竞赛规则(比赛结束时,后走棋的棋手贴目),是AlphaGo平时“训练”使用的规则,而李世石则更熟悉韩式规则。除此之外,中国有句俗话叫“知己知彼,百战不殆”,如今AlphaGo对于李世石肯定已经非常“了解”,而李世石却对AlphaGo一无所知,这对于李世石来说也是劣势之一。
但尹英敏同时表示,AlphaGo的优势能否左右战局,依旧取决于李世石当天的身体及精神状态。
最终赢家仍是人类
无论是AlphaGo还是李世石赢得比赛,这都不是人工智能的最终目的。
李承镐一再向本报记者强调:“人工智能开发的最终方向,还是要取决于人类,并且服务于人类的。毕竟人工智能也是由人类制作而成的,这是人工智能技术发展的基础和终极目的,我们不能忘记这个目的。”
“另外,通过人工智能技术,能够促进IoT(物联网)等新技术的开发,从而更有利于人类的发展与福祉。”李承镐认为,近年来暂时停滞的科技发展,将因人工智能技术,焕发“全新的春天”。
谷歌董事长埃里克·施密特也在赛前发布会上表示:“我们开发人工智能机器人的最终目的在于为人类提供福祉,为未解难题提供新的解决方法;而其中,围棋只是我们选择增强人工智能机器人的实力的方法之一。无论这场对决孰胜孰负,最终的赢家都将是人类自己,因为人工智能的发展,最终的受益者将是人类自己。”
事实上,目前谷歌、百度都已经通过人工智能技术在语音识别、图片识别、无人驾驶等方面展开应用。
“当湖十局,不止求胜,在棋局之外,我们探求的新境界是人类智慧与机器智能的配合,因而围棋智能仅仅是人工智能的副产品,而人工智能的终极目标是让我们拥有更加便捷的生活。”异构智能CEO吴韧说。