从逻辑规则到数据驱动——人工智能杂谈

Sina WeiboBaiduLinkedInQQGoogle+RedditEvernote分享




传统的人工智能的书,翻开书前几章基本都会讲谓词演算等逻辑推理的方法,甚至有的人工智能的书花了大量篇幅就在讲这个东西。一方面,这可以看出,早期的人工智能是基于规则与逻辑的,另一方面,这其实也是一种误导。因为现在的人工智能被机器学习所主导,机器学习与传统的人工智能很不同,现在的机器学习很大程度上都是数据驱动的,因此当初我看规则与逻辑推理后,却不知道能做什么,什么专家系统的都太遥远。当然了,key point不在于这种变化对于一个初学者的影响,而是人工智能整个发展趋势所给人的反思与启发。人们很清楚的看到从规则与逻辑到了数据与统计这种发展主线,我们想做的东西也不多,就是希望能够让机器看懂我们看懂的、让机器听懂我们听懂的、让机器能懂我们的思考、能像我们一样思考,但这条路,这么多学者在走,却走的如此困难。我们能发现知识、拥有知识、玩弄知识,但却难以让机器像我们一样拥有知识。

一个最基本的问题是:什么是知识?这就是知识的表示问题。早期研究者觉得逻辑就是知识,可以用来做一些推理,但是很直接的一个问题是,对于机器视觉,当机器看到许许多多的像素点的时候,那些谓词逻辑显得那么无力。于是,我们开始认为数据中的某些pattern就是知识,大家就开始寻找各种特征、各种子空间。数据驱动开始盛行。然而,哪怕这种方法多么有效的解决了如机器视觉中浅层知识表示的问题,但回到文本知识上,它却仍然非常无力。

文本,或许是最丰富的知识载体吧,因为它包含各种抽象。对于文本本身,不过是一些ASCII码而已,把这些ASCII码建立倒排表,我们可以索引,把这些ASCII码做矩阵分解(pLSI),我们可以搞一些浅层语义分析,但我们觉得这还不够,我们用LDA这种generative方法来描述文本,认为文本是bag of words,是由topics产生的。当然,这种方法有道理,很intuitive,而且也确实让人们迈出了很大的一步,慢慢开始理解ASCII码统计背后隐藏的语义。然而,这就到了终点了吗?我们就满足了吗?别忘了,我们的目标是要让机器明白我们的知识、运用我们的知识。要做到这一点,bag of words肯定是不够的,topics肯定是不够的,我们要重新提出我们的知识表示模型。于是,另一种思想,也就是knowledge base的思路出现了,每个节点是实体,不同类型的实体,实体是唯一的,不同实体之间有边来连接,表示不同的关系。然而,尽管语言学家和计算机学家研究了很多年,即便能够用这种方法更好理解用户的问题、改善搜索结果,但也仍然没有通过这种表示方式让计算机真正懂知识,知识的表示仍然模糊。或许,知识是一个很高维度的空间,而word只是这个空间中的稀疏样本,我们要通过这些词来重建那些知识是一件很难的问题,但是,这并不该是停止的理由。

为什么要建模那种基于文本的抽象知识呢?一个很简单的理由就是,每个人在知识的高维空间上都有自己的子空间和独特的拓扑,当我们面对一个task的时候,我们需要知识,当我们不懂的时候,我们要花很大代价去得到那不懂的一小部分,这一小部分,往往不是人类的空白,而是落在其他人或文献的知识子空间中,如果我们能够建模这种抽象知识,我们就能把这一切连接起来,让人们真正能够互相share知识。

总的来说,本文的主要观点就是人工智能从逻辑规则驱动到现在的数据驱动,我们都是尝试去让机器去理解各种人类面临的各种不同的task中的不同的知识,我们可能在形象知识、数据密集的知识上面有不错的精确度,但是,对于抽象知识的建模却做得非常有限。未来一定会往这个方向发展的,或许规则与数据会结合,或许我们需要通过很多中间层、中间步骤才能走到那里,但是这并没有阻止我们回头看看我们走了多远,没有阻止我们抬头看看前面的路,更无法阻止人类知识不断前进的步伐。未来在这里,一切都很interesting。

(原创来自http://chentingpc.me/article/article.php?id=862)

(1个打分, 平均:5.00 / 5)

雁过留声

“从逻辑规则到数据驱动——人工智能杂谈”有20个回复

  1. matrix 于 2012-08-16 6:54 下午

    意识,是机器永远模拟不了的。

  2. Qingye Jiang (John) 于 2012-08-16 7:17 下午

    早期的人工智能或者说专家系统,是非常明确地模拟人的决策过程的。不管是大型结构的安全状况评估,还是无人飞行器对降落场地的选择,都是基于一系列模糊的现象(数据),对系统当前的状况进行滤波(信息),结合一些已知的规律(知识),在有限的可选结论中进行选择(知识)。各种各样的可靠度理论和模式识别理论,基本上都处于这个层次。在可选答案数量有限的前提下,选择逻辑规则驱动几乎是必然的。

    语义识别和机器视觉领域的研究,已经超出了传统人工智能的范畴,因为可选答案的数量几乎是无限的。举个例子说,当摄像头看到一个动物走过的时候,它需要判断的不是这是不是一只猫,而是这到底是个啥。就像我们看到一个词不太认识就去查字典一样,选择数据驱动的方法就相当有道理了。

    楼上的同学说意识是机器永远模拟不了的,我个人不太认同。

  3. aaa 于 2012-08-16 7:42 下午

    大脑很可能就是一个计算和处理信息的依托体,但是人类意识本身,不是这么简单的.
    人类在漫长的历史和宗教历程中,都始终相信着灵魂的存在,并且认为那才是人意识的本源所在.
    只有现代科学兴起之后,才有人开始不相信灵魂.

    反正我是不认为cpu的计算能力可以替代人类智慧,那根本不是一样的东西,本质是有差别的。

    人类智力存在着丰富的情感,能从事艺术和创造,这恐怕只能用灵魂来形容这种智慧,机械智能就算再复杂,也无法达到艺术的高度。

  4. phoenix 于 2012-08-16 9:22 下午

    机器就是机器,再精巧的机器也只是机器。
    机器是没灵魂的,而人是有灵魂的。
    机器不过是一系列规则的组合,根本没有自由意志。

  5. frankyang 于 2012-08-17 1:05 上午

    如果脱离应用领域谈知识,机器解决问题的能力就显得苍白。

    就是一个简单的“美”字,机器又如何能判断?

  6. 理客 于 2012-08-17 2:37 上午

    人如果没有别人教的话,比如泰山、狼孩,是基本上面没有智慧的,机器人如果要具备人的智能,也要模拟这个过程,目前的人工智能似乎是在走类似的这条路,比如最近的人机抢答大战

  7. 山东李 于 2012-08-17 7:47 上午

    我觉着一旦解决了知识的表达问题,机器人会发生质的变化。因为人类已经知道对博弈的表达和计算。社会生活中大多数情况都是人与人在为了一些事情博弈。一旦表达问题解决了,博弈这些已经建立数理逻辑模型的东西应该很快可以让机器像人一样思考了。

  8. zhaoNew 于 2012-08-17 6:15 下午

    人类对于自身的了解还是非常有限的。不看好机器人思考。

  9. Xinren 于 2012-08-18 5:54 下午

    1、除了情感外,思考是人类具有的最大特征之一,机器人如何思考?
    2、机器人是人设计出来的,永远脱离不了人类自己的局限性。

  10. 路过不平之徒 于 2012-08-20 12:14 上午

    在我的观念里,面对相同的输入会产生相同的输出,这是计算机干的事情,也是我们设计计算机这种设备时的期望与需求。
    而对于人,面对相同的输入不同的人会产生不同的输出,这才是人与计算机最大的差别。如果计算机也能做到这一点,那计算机也不叫计算机了,没法作为一件商品或者产品存在。同一厂家出品的同一型号同一批次的机器,大家都花一样的价钱,凭什么我这台”Future-II”就没他买的那台聪明?办事没他那台利落能干?

  11. 理客 于 2012-08-20 2:31 下午

    除了先天的硬件差异,还有后天学习的差异,学习也是输入。先学习,后创造

  12. matrix 于 2012-08-21 12:47 上午

    就说一个很简单的现实问题,如果计算机要想99.9%模拟现实世界,那必须模拟到构成物质的分子原子层面,看似根本无法实现。

  13. 狐说 于 2012-08-21 10:35 下午

    如果我们可以模拟2000亿个神经元互联,那我们可以让人工智能和人一样聪明。蚁群的智能就远超单个蚂蚁。

  14. bend,or 于 2012-08-27 8:27 上午

    今天看一视频,很震撼,太不可思议了。这或许也是我们大脑的神经元接收(处理)音乐(外部资讯)的方式,虽然我不怎么认同雷帝嘎嘎、黑人饶舌也是音乐,我是音痴==!

    但画面真的很震撼,上头版了
    http://www.youtube.com/watch?v=G-OVrI9x8Zs&feature=player_embedded

    更多信息请看这里:感兴趣的建议把TED上的演讲也看一下
    http://news.backyardbrains.com/2012/08/insane-in-the-chromatophores/

  15. bend,or 于 2012-08-27 8:30 上午

    您的评论正在被等待被批准。我勒个去

  16. bend,or 于 2012-08-27 8:34 上午

    Youtube首页上的神经元实验,赞。
    http%3A%2F%2Fwww.youtube.com%2Fwatch%3Fv%3DG-OVrI9%A1%C18Zs%26feature%3Dplayer_embedded

  17. hanf 于 2012-10-11 6:54 下午

    意识并没有多神奇,我认为是肯定可以模拟的
    关键是模拟的手段

  18. mll 于 2012-11-02 3:42 上午

    我觉得机器早晚超越人类,当cpu能力越来越强,量变引起质变,模拟甚至超越人类是很可能的。
    很多科幻电影中其实都显示了人类的这种担心。

  19. angliu 于 2012-11-02 5:56 上午

    老子全职搞人工智能将近4年,程序没写出来不说,连活不活下去都无所谓了。

  20. 糊涂 于 2012-11-02 8:45 上午

    mll你电影看太多了吧