我们应该如何看待AlphaGo



人工智能的历史


人工智能这门学科是在1956年建立的,最初的人工智能研究是30年代末到50年代初的一系列科学进展交汇的产物。早期的理论,就是用神经学方面的研究做启发,提出人工神经元网络,可以进行简单逻辑运算的机制。但是,由于数据和计算方面的科技不够发达,神经论一直都没有什么进展。

1956年到1974年,是人工智能的第一个黄金年代,这个时代兴起的算法是搜索式推理。有点类似于在迷宫中寻找出路一样。但是,这个方法有一个主要的难题,就是"迷宫"里可能的线路总数是一个天文数字,术语叫指数爆炸。遇到的瓶颈包括计算机的运算能力,计算复杂性/指数爆炸,认识信息或数据方面的缺乏,和框架方面的不足。最终,这个黄金年代在1975年终止了。

在80年代初,我们又有了第二个黄金时代,带动这一次繁荣的方法是专家系统。专家系统能够依据一组从专门知识中推演出的逻辑规则在某一特定领域回答或解决问题。专家系统的有效范围非常局限,而且维护费用居高不下,难以升级,难以使用,还经常出错。80年代后期,大部分对AI的资源就被削减了。我们今天所看到的AI是由90年代延至的。大部分方法都是用的机器学习-一种可以从数据中学习的系统。



今天的人工智能



现在的人工智能,基本上都是通过机器学习来构造的,而机器学习大至分三类。


监督学习-是最常见并且最成熟的。像图像识别,预测分析,语言翻译,都是应用了监督学习。


无监督学习-和监督学习相反的,这里的目的还是去对原始资料进行分类,但是运用这个方法的时候不会提供任何输出数据,而是让系统自动从范例里找出其潜在的类别规则,好以了解资料的内部结构。


增强学习-这背后的直觉很简单,算法从其行为的后果中学习,就像人类会通过我们的实践和错误学习一样。

应该怎样理解AlphaGo

最近,有一个人工智能得到了很多媒体的关注,那就是AlphaGo。今天呢,我也想抽出点时间来讲一下我们应该怎样看待这个突破。

AlphaGo是由什么做成的呢? 其实他运用的都是我们已经发明的系统,并且也属于弱人工智能-还是只能对付一个特定的问题-在这里就是下围棋。它运用了几个比较常见的技巧:利用了人类演示的数据做训练数据的监督学习,强化学习,价值函数,和蒙特卡洛数搜索。

DeepMind的团队做的非常出色的地方就是他们以一种新颖的组合方式融洽的结合了这些不同的技巧。它利用了监督学习来初始化强化学习并通过自我游戏来完善,利用这个他们估计了价值函数。然后运用监督学习来将这个估值插入到蒙特卡洛数搜索中。最后,他们使用的技巧都是深层神经网络。这些结合每一步都有独特的执行方面的挑战,虽然说整个系统本身没有什么基础方面的突破。

那重要的一点就是,这个还是一个弱人工智能。这个系统并不能被应用到其他问题上。但是他反应的是现在的研究人士和以发明的各种人工智能组建的能力。即使还是弱人工智能,我们已经可以达到前所未有的成就。并且也显示出了谷歌母公司Alphabet在这方面的能耐,强大的资源,和对人工智能的投入。



作者:塞班岛地接李姐luckytour
  閱讀原文

留言

熱門文章