2016年围棋人机大战:李世石Vs谷歌AlphaGo
在这之后,关于深度神经网络的研究与应用不断涌现。目前,深度神经网络在人工智能界依然占据着统治地位。我们之前说,“Snarc”的兄弟AlphaGo,也正是神经网络的“获益者”。2016年击败李世石的是AlphaGo Lee,2017年击败柯洁的是升级版的AlphaGo Master。又在2017年10月18日,AlphaGo再次登上世界顶级科学杂志——《自然》。AlphaGo的开发团队——DeepMind公布了最强版的AlphaGo,代号AlphaGo Zero。它是一个能“自学成才”的“怪物”。
据说,前代AlphaGo是通过学习大量棋谱入手的,就像一个普通人得到了很多武林秘籍,迅速地成为了“盟主”。而AlphaGo Zero它是从一张白纸开始,3天之内,通过数百万盘自我对弈,就走完了人类的千年的围棋历史,还探索出了很多横空出世的招法,这听起来可比前任武林盟主厉害多了!不仅是听起来,AlphaGo Zero确实是世界上最强大的围棋程序,他胜过了以往所有版本的AlphaGo。它击败了曾经战胜李世石的AlphaGo版本,成绩为100比0。据说,AlphaGo Zero采用了一种“强化学习”的新模式,将一个一无所知的神经网络和一个强力搜索算法结合,使AlphaGo Zero进行自我对弈。在对弈过程中,神经网络不断升级,AlphaGo Zero能够预测每一步落子和最终的胜利者。就这样,一次又一次地反复训练,使得神经网络越来越准确,AlphaGo Zero的版本也越来越强,这简直是“熟能生巧”的最佳典范!