人机博弈的前世今生
2016-03-14 14:31:00 来源:武汉晨报

1

AlphaGo连赢三局,然后就得出“人类输给了智能机器人”?逻辑是这样讲的吗?从本质上说,这不就是一个不会犯错的、由人类设计的程序,击败了一个会犯错的棋手吗?

然而换一个角度看,这次逻辑确实是可以这样讲的。纵使人类心有不甘,但是走进人工智能和棋牌的前世今生,人们才会懂得这当中的无力感。

制图童胤文

前世:1949年的小跳棋

人工智能和棋牌的前世大约可以追溯到1949年。那是在纽约,计算机问世还不到4年,一切都还是刚刚起步,大家甚至对于计算机处于一知半解阶段,但就是那时,智能机器就已萌发出了令人敬畏的种子。

那一年,计算机技术的先驱萨缪尔在IBM第一批商用计算机IBM701上,编写出了世界上第一款国际跳棋的程序。这款闻所未闻的智能程序,虽然下棋水平不那么高明,但它却是一款能够自我“学习”的程序,“人工智能”的概念就这样呈现在了人类的面前。

智能的种子既然已经种下,生出丰硕的果实就只是时间问题。在反反复复的兜转中,萨缪尔和他招募的程序员们通过不断改进程序,最终在1962年,这个程序击败了人类玩家。从此,人工智能挑战棋牌的号角正式吹响。

4

递进:5打1的象棋战局

国际象棋之后,轮到了中国象棋。2006年是“人工智能诞生50周年”,一场关乎中国象棋棋手的荣誉大战就此拉开大幕。那一年,首届中国象棋人机大战举办。在比赛中,计算机“浪潮天梭”同时迎战柳大华、张强、汪洋、徐天红、卜风波5位中国象棋特级大师。在2局制的博弈中,“浪潮天梭”以平均每步棋27秒的速度,每步66万亿次的棋位分析与检索能力,最终以11比9的总比分获胜。那场人机大战异常激烈,柳大华在两局之间中场休息时,直言“艰苦卓绝”。在这场高强度的消耗战中,电脑最终取胜的关键,被认为是其不知疲倦的稳定性。

张强赛后坦承:“输棋的原因主要在体力的过度消耗。以往和人比赛,最后时刻就是各自意志和心态的对决,但是计算机没有这样的问题。”

扳回一局

据新华社电昨日,Google人工智能AlphaGo与李世石对决第四局比赛在韩国首尔四季酒店落子。在第四局比赛中,李世石执白中盘胜,将这场人机大战的比分改写成1比3。

韩国棋手韩钟振九段说:“序盘双方的气势不相上下。但李世石下白78,80,82的妙手后,AlphaGo应得不太好,下了很多‘问题手’,从83手至101手,李世石掌握了局面的主导权。其中,AlphaGo下黑101是最不可思议的一手。之后,李世石虽然进入读秒,但顽强应战,并将优势保持到最后,至180手时,AlphaGo宣告认输。”AlphaGo认输后,在现场的媒体记者为李世石的胜利而欢呼鼓掌。

对局结束后,李世石接受采访时说:“今天我赢了一局大家就给予我如此热烈的祝贺,这是我以前所没有碰到的。但是今天的胜利意义非凡,拿什么我都不会去换的。这是珍贵的胜利。因为当初我说过要以4比1或5比0赢。”

当被问到大家都认为白78手是妙手时,李世石自我评价说:“当初我认为下这手棋会更容易出棋,但是走得很艰苦,我在心里都想有可能又会输掉。当时,我只能下白78手,没有其他的选择。”

当被问到通过4盘对局是否发现了AlphaGo的弱点时,李世石说:“我觉得AlphaGo有两个弱点:其一是它执黑时下得困难。其二是它遇到没想到的一手棋时应对能力下降。”

李世石向AlphaGo团队请求说:“我觉得AlphaGo执黑时比较弱一点。第五局又要猜先,我今天执白赢了一盘,但我希望第五局时不要猜先由我执黑行不行?”AlphaGo团队当即爽快答应。李世石在第5局将执黑。

2

疑问:被选中的棋牌

战胜人类的标准中,为什么参考物是棋牌?这是一个耐人寻味的问题,它的关键之处在于智力。棋类博弈自古被视为一种关乎人类智力的高级挑战。和其他智力测试相比,弈棋具有直接对抗的特点,在紧张对局中,对手一手精妙招法,更能体现人类智力上的刺激和挑战。弈棋随机和不可控因素更小,因此对局双方的决策能更直接地控制整个局面的走势,进一步增强了智力的对抗性。正是棋类具有这样的特质,因而在每次有更好的人工智能程序面世时,被挑战的对象往往都是棋牌。智能机器人真正开始通过棋类挑战人类智力,最早可追溯到1958年,当时美国麻省理工学院率先在电脑中设计出了国际象棋程序,几年后,人与电脑下棋的新生事物就出现了。

5

今生:终于请出围棋

从跳棋到国际象棋再到中国象棋,围棋始终保持着一份超然。因为在围棋领域,人工智能长期以来举步维艰,顶级程序甚至不能打败稍强的业余选手。原因是:国际象棋中,平均每回合有35种可能,一盘棋可以有80回合;而围棋每回合的可能性有250种,一盘棋可以长达150回合。同时围棋局面多变,几乎无法被算法穷举。更专业点说,围棋难的地方在于它的估值函数非常不平滑,差一个子盘面就可能天翻地覆,同时状态空间大,也没有全局的结构。所以,面对这样一组天文数字,棋手们是乐观的。

然而,人工智能和棋牌的故事终于还是走到了围棋这一步。去年10月,谷歌公司研发的AlphaGo,在没有让子的情况下,5比0战胜了欧洲围棋冠军、职业二段棋手樊麾。樊麾出生于中国,目前是法国国家围棋队总教练,已经连续三年赢得欧洲围棋冠军的称号。AlphaGo与樊麾交手的棋谱一经公开,中国和韩国多名顶尖职业棋手都对它的棋力表示惊讶。中国著名棋手常昊认为,从电脑的表现看,绝对可以算作职业棋手,它的思考方式、布局和应对都有职业棋手的风范。即使如此,大家依然对于职业围棋选手的优势有信心。所以,在李世石和AlphaGo的5回合大战开始前,人们普遍看好李世石,但就在2016年3月9日,阿尔法狗第一次完胜职业顶尖高手李世石,这将像博尔特百米突破世界纪录一样,注定成为人类智能发展的一个新起点。

(综合《北京晚报》报道)

3

分水岭:深蓝和更深的蓝

1997年5月11日,一个和2016年3月9日一样被历史记住的日子。那一天,“更深的蓝”击败了国际象棋世界冠军卡斯帕罗夫,人工智能和棋牌的分水岭就这样来临了。要说“更深的蓝”,要从“深蓝”说起。

想当年,卡斯帕罗夫可是国际象棋棋坛的神话,自1985年成为世界冠军以来,12年间他在国际象棋领域里的地位一直未受到严峻挑战,曾11次获得国际象棋奥斯卡奖,被认为有史以来最强的棋手之一。1996年卡斯帕罗夫与电脑“深蓝”展开交锋,结果卡斯帕罗夫4比2宣告胜利。随后,经过研制方IBM一年多的改进,“更深的蓝”卷土重来。这一次赢家变成了计算机。可今天看来,“更深的蓝”还算不上足够智能,它当时主要依靠强大的计算能力,穷举所有路数,来选择最佳策略。“更深的蓝”靠硬算可以预判12步,卡斯帕罗夫可以预判10步,双方能力不相上下。

比赛第二局的完败,让卡斯帕罗夫深受打击,他的斗志和体力在随后3局也被拖垮,决胜局仅19步他就宣布放弃。此后IBM拒绝了卡斯帕罗夫的再战请求,并拆卸了“更深的蓝”。

  • 为你推荐
  • 公益播报
  • 公益汇
  • 进社区

热点推荐

即时新闻

武汉