主页 > 新奇相机 >击败了李世乭的围棋人工智慧「AlphaGo」究竟是什幺? >

  • 击败了李世乭的围棋人工智慧「AlphaGo」究竟是什幺?


    2020-06-19


    击败了李世乭的围棋人工智慧「AlphaGo」究竟是什幺?

    做为一种人工智慧的 AlphaGo,和 IBM 在上个世纪打败西洋棋大师卡斯帕罗夫的深蓝超级电脑,以及当代的苹果 Siri、Google Now 有着显着的区别。

    要了解 AlphaGo,首先我们需要了解 AlphaGo 背后到底是一个什幺东西。

    它背后是一套神经网路系统,由 Google 2014 年收购的英国人工智慧公司 DeepMind 开发。这个系统和深蓝不同,不是一台超级电脑,而是一个由许多个资料中心做为节点相连,每个节点内有着多台超级电脑的神经网路系统。就像人脑,是由 50-100 亿个神经元所组成的,这也是为什幺这种机器学习架构被称为神经网路。

    AlphaGo 是在这个神经网路系统上,专为下围棋(Go)而开发出的一个实例。然而,虽然名字已经介绍了它的功能,AlphaGo 背后的神经网路系统却适合用于任何智力竞技类项目。

    这个系统的基础名叫卷积神经网路(Convolutional Neural Network,CNN),这是一种过去在大型影像处理上有着优秀表现的神经网路,经常被用于人工智慧图像辨识,比如 Google 的图片搜寻、百度的识图功能都对卷积神经网路有所运用。这也解释了为什幺 AlphaGo 是基于卷积神经网路的,毕竟围棋里胜利的原理是:

    击败了李世乭的围棋人工智慧「AlphaGo」究竟是什幺? AlphaGo Logo / DeepMind

    AlphaGo 背后的系统还借鑒了一种名为深度强化学习(Deep Q-Learning,DQN)的技巧。强化学习的灵感来源于心理学中的行为主义理论,即有机体如何在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的习惯性行为。不仅如此,AlphaGo 借鑒了蒙地卡罗树状搜寻演算法(Monte Carlo Tree Search),在判断当前局面的效用函数(value function)和决定下一步的策略函数(policy function)上有着非常好的表现,远超过上一个能够和人类棋手旗鼓相当的围棋程式。

    AlphaGo 所採用的 DQN 是一种具有广泛适应性的强化学习模型,说白了就是不用修改代码,你让它下围棋它能下围棋,你让它在红白机上玩超级玛莉和太空侵略者,它也不会不熟悉。做为一个基于卷积神经网路、採用了强化学习模型的人工智慧,AlphaGo 的学习能力很强,往往新上手一个项目,玩上几局就能获得比世界上最厉害的选手还强的实力。

    2014 年,已经被 Google 收购的 DeepMind,用 5 款雅达利(Atari)游戏 Pong、打砖块、太空侵略者、海底救人、Beam Rider 分别测试了自己开发的人工智慧的性能,结果发现:在两、三盘游戏后,神经网路的操控能力已经远超世界上任何一位已知的游戏高手。

    DeepMind 用同样的一套人工智慧,不调整代码就去测试各种各样的智力竞技专案,取得了优异的战绩,足以证明今天坐在李世乭面前的 AlphaGo ,拥有多强的学习能力。

    击败了李世乭的围棋人工智慧「AlphaGo」究竟是什幺? 李世乭执黑子,AlphaGo 执白子。大约进行了 85 分钟时进入休息阶段。

    在此之前,DeepMind 进行过的无数虚拟棋局训练,以及去年击败欧洲围棋冠军樊麾二段的经验让 AlphaGo 已经训练出了顶尖的弈技,极有可能高于世界上任何已知的围棋高手。

    击败了李世乭的围棋人工智慧「AlphaGo」究竟是什幺? 围棋的可能性複杂度。

    儘管棋盘上风云变化,早在本次开战前,AlphaGo 跟李世乭就已不在同一起跑线上了。至于李世乭曾经做出 AlphaGo 和自己棋份在二子和让先之间的评论,恐怕第一局够让他反悔了。

    AlphaGo 只是 DeepMind 证明自己的一个工具。你也可以将这次和李世乭的对局理解为 Google 的公关策略。

    2014 年,这家公司曾经在其官网上写道: DeepMind 致力于用研究深度学习的方式去真正了解智慧(solve intelligence)。但对于 DeepMind 和 Google 来说,打造 AlphaGo 以及其他人工智慧神经网路不是终点。

    击败了李世乭的围棋人工智慧「AlphaGo」究竟是什幺? DeepMind 三位联合创始人。

    将机器学习和神经科学进行结合,打造出一种「一般用途的学习演算法」。透过这种演算法,DeepMind 和 Google 希望能够将智慧「定型化」,理解智慧是什幺,进而更好的帮助人类理解大脑。DeepMind 联合创始人之一的 Demis Hassabis 曾经写道:

    在 Google 收购 DeepMind 前,收购条款中的一项就是 Google 必须成立人工智慧道德委员会。因此,在目前阶段人们不必担心这样的人工智慧最终杀死或统治人类。但至少,人工智慧在围棋这样的智力类竞技项目上击败人类,是已经注定的事情。



    上一篇:
    下一篇: