记者 曾福泉 通讯员 周炜
本报杭州3月9日讯 (记者 曾福泉 通讯员 周炜) 经过3个多小时的对弈,李世石九段投子认输。谷歌研发的围棋人工智能AlphaGo击败了近10年获得世界冠军次数最多的棋手。
这场激战的结局出乎许多人的意料,也被不少人视为一个历史性的时刻。相比其在2015年10月击败欧洲冠军樊麾二段时的表现,AlphaGo在过去的5个月里经由深度学习,棋力持续猛增,如今展现出的实力超过了许多计算机专家和围棋高手的想象。
AlphaGo的惊艳表现,也让人们对人工智能(AI)的发展充满了好奇:AI将能够到达怎样的水平,它对我们未来的生活会带来什么影响?记者就此采访了浙江大学计算机辅助设计与图形学国家重点实验室蔡登教授。
失误很少 机器对弈严密
在韩国首尔的“人机之战”现场,李世石坐在棋盘的一侧,他对面是另一位业余棋手,代替AlphaGo操作。李世石每落一子,这位棋手就点动鼠标,在旁边一个显示器上的棋盘里填上这颗黑子的位置。等AlphaGo的回应在屏幕上显示出来,他就抓起一颗白子,依样放在李世石面前的棋盘上。因此对弈中出现了与人们习惯的围棋比赛颇为不同的有趣场景:当李世石落子完毕,坐在他对面的那位不是陷入思考,而是从容地坐等机器作出回答。
这是李世石和AlphaGo“五番棋”的第一场对决,在网络上吸引了大量观众。人们发现,李世石在对局中尝试不少变招,却没能把AlphaGo引入歧途。李世石一度占有优势,但多次出现的失误使他最终输掉比赛。相比之下,AlphaGo的失误次数少,也不那么严重。
李开复在视频网站的转播中评论说,李世石走出了一些棋谱中没出现过的走法,可能试图误导AlphaGo,但实际上AI是很周密的。人们应当意识到,同样面对未知的局面,机器往往会做得比人类好。
面对结局,来自丽水的“中国围棋第一人”柯洁九段很乐观地发了一条微博:“就算阿法狗战胜了李世石,但它赢不了我。”
深度学习 让AlphaGo取胜
实际上,在战胜樊麾的时候,就已经有不少科学家断言,AlphaGo肯定也会击败李世石,哪怕不是这一次,也会发生在今后的6个月到两年之内。这是基于机器的学习方法和作战策略作出的判断。
蔡登介绍,在对弈中,AlphaGo采用了价值网络和策略网络,来评价棋盘的局势和分析单个落子的策略。这些算法都建立在著名的“蒙特卡洛”方法提供的框架上,属于对一个相对成熟的方法在围棋领域作出创新。
这个先进的AI还能通过深度学习,如自我对弈3000万盘,来发现更容易获胜的规律。实际上,随着计算机处理能力的发展,AI的深度学习已经取得了很多令人赞叹的成果,比如对图像的识别,做得最好的AI错误率只有约3%,蔡登认为,AlphaGo的学习方法和作战策略,加上大量的CPU和GPU的支持,使其战胜人类成为可能。
在这次胜利的背后是一个庞大的团队。蔡登说,该团队此前在《自然》发表的那篇轰动性的论文,作者有20人;团队骨干在博士期间就致力于计算机围棋领域,毕业后又依靠谷歌公司的巨大资源进行创新和优化。
AI是帮手 而非人类威胁
蔡登认为,不管“人机大战”最终结果如何,都有望激发更多人尤其是青少年的兴趣,来关注和投身AI和机器人领域的研究。
李开复表示,通过投入更多的数据量,AI的表现将会越来越理想,像无人驾驶等领域有望较早取得突破性的成果。
蔡登解释说,深度学习使用了人工神经网络(ANN)来进行“判断”,“判断”所依赖的模型,不是事先就设定的,而是计算机通过海量的数据,自己“悟”出来的函数模型。深度学习最成功的例子是图像识别。人类只需要提供样本,不需要告诉计算机去提取什么特征,计算机自己学特征。它在不断“学”的过程中,把没用的特征排除掉。
AI将来是否会像科幻电影中那样,自我进化掌管世界?蔡登认为,这还比较遥远。科学家更关心的是人工智能的“工具”属性,可以大大延伸人的能力,解放人类的劳动力,成为人类很好的“帮手”。就像人类制造了飞机和汽车一样,它们都比人类跑得快,但不必担心未来它们会威胁到你。