星期文库机器博弈之四阿尔法狗横空出世谢立章

文章来源：大手笔网作者：

字体：大中小

发布时间：2020-06-25 16:54:03

2016年、2017年，阿尔法狗（AlphaGo）先后战胜世界围棋冠军李世石、柯洁，引爆了人工智能狂潮，计算机终于攻克人类智慧的堡垒！阿尔法狗的成功，是多方面的原因。算法方面包括了蒙特卡洛树搜索、深度学习、增强学习。同时，分布式计算以及GPU带来的算力大爆发，这一切加起来，才足以支撑其与顶尖棋手李世石的对决。

蒙特卡洛是一座赌城，意味着筛子与随机。大家可能好奇，为什么会需要一种随机的算法？这就是概率的功劳了，由于围棋的复杂度高达10的360次幂，这个时候，依赖于确定路径的搜索，反而不如随机的搜索。因为，所有的随机，也会产生一种规律，概率上称之为分布。蒙特卡洛的思想，还有很多应用，比如计算圆周率，就可以通过足够的随机模拟求得，模拟得越多，精度越高。蒙特卡洛树搜索算法靠一己之力，把人工智能的围棋水平带到了业余四段的水平。这个时候，深度学习登场了。深度学习算法是当下最重要的人工智能算法，阿尔法狗通过深度学习，学习了人类上百万次对局。通过其强大的特征提取能力，学习在某种局面下如何落子。最终，它的落子水平能达到业余二到四级。

大家想一想，两个业余四级能干吗？

可能结果是令人震惊的，阿尔法狗凭借着两个业余四级，竟然达到了顶级人类棋手的水平。为什么会这样呢？其实这和深蓝的原理有一定的相似之处。蒙特卡洛树搜索算法这位业余四级选手，它能够往后看很多步，虽然看的每一步质量都不高，全都靠猜（随机）。而深度学习这位选手，能力也一般，但是它学了上百万个棋局，它的落子能力很强，因而两者的结合是爆炸性的。蒙特卡洛树搜索算法具备往后看很多步的能力，而深度学习能较好地把握每一个落子点的质量，而不是原本的随机猜子，结合在一起，很快人工智能的棋力就得到了很大的提升。

阿尔法狗还有一个创造性的提升，即增强学习，也就是左右互搏，不断进化，这个是其很厉害的一点。一个强大的人工智能“棋手”，不用吃喝拉撒，每天就知道下棋，最终导致下棋能力的爆炸性增长，完完全全拉开了和人类棋手的差距。甚至，能完全摆脱人类高手的经验，独创超出人类高手想象的妙局。

在计算能力方面，阿尔法狗得到了分布式计算的支撑，通过多台GPU加速计算，把计算分配到多台计算机上，这样尽可能支撑蒙特卡洛树搜索算法可以往后多思考几步。

深度学习出现多年，但是由于计算能力一直不够，而且没有大数据的支持。近几年，大数据、强计算能力、优秀的算法（如蒙特卡洛树搜索算法、深度学习、增强学习）结合在一起，最终人工智能才攻克了围棋这一极其坚固的堡垒。

http://www.dashoubi.org/news/shwx/2020-06-25/136337.html

首页推荐

专心讲品质故事《河神2》首曝幻境款单人

由爱奇艺、工夫影业、闲工夫联合出品，李莅樱任总制片人，田里...

热门图片

星期文库 机器博弈之四 阿尔法狗横空出世 谢立章

星期文库机器博弈之四阿尔法狗横空出世谢立章