首页 >> 专题 >> 人文岭南 >> 学界 >> 学科前沿
关于机器学习的哲学思考
2016年07月27日 22:23 来源:人文岭南第62期 作者:王华平 字号

内容摘要:机器学习是一个跨学科研究领域,它涉及计算机科学、统计学、信息科学、神经科学、心理学、语言学、复杂理论等。机器学习旨在赋予计算机在没有显性编码情况下进行学习的能力。现在通行的定义是米歇尔(Tom Mitchell)给出的,“一个计算机程序被称之为从与某类任务T和性能度量P有关的经验E中学习,在任务T中它以P为度量的性能因为经验E得到了提升。机器学习应用广泛机器学习具有非常广泛的应用,比如模式识别、语音识别、机器人控制、计算机视觉、网页搜索、网页实时广告、文本情感分析、信用评分、垃圾邮件过滤、网络入侵检测、反病毒软件以及欺诈侦测等。机器学习还不具备价值体系机器学习真的有这么神奇吗?

关键词:机器学习;计算机科学;语义;欲望;句法;度量;人类学习;语言;人工智能;邮件

作者简介:

   

  ■参加春晚表演的阿尔法机器人     李永杰/供图

  

  机器学习是一个跨学科研究领域,它涉及计算机科学、统计学、信息科学、神经科学、心理学、语言学、复杂理论等。机器学习旨在赋予计算机在没有显性编码情况下进行学习的能力。现在通行的定义是米歇尔(Tom Mitchell)给出的,“一个计算机程序被称之为从与某类任务T和性能度量P有关的经验E中学习,在任务T中它以P为度量的性能因为经验E得到了提升。”根据这一定义,一个机器学习问题必须具备三个要素:任务、性能度量和训练经验。例如,一个电子邮件程序通过监视你将哪些邮件标为垃圾附件而学会了更好地过滤垃圾邮件,然则你将邮件标为垃圾邮件就是训练经验。机器学习意味着程序能够自动完成任务。设计者所要做的是设计出一个好的学习算法,而不是具体的编码。这对大型复杂的任务而言,优势是非常明显的。

  机器学习应用广泛 

  机器学习具有非常广泛的应用,比如模式识别、语音识别、机器人控制、计算机视觉、网页搜索、网页实时广告、文本情感分析、信用评分、垃圾邮件过滤、网络入侵检测、反病毒软件以及欺诈侦测等。在计算机之外的诸多领域,机器学习也大有可为,例如,设备故障的预测、自动驾驶、生物监测、生物医学、医学诊断、天气预报、消费预测、定价模型,甚至是发现新的星星。可以说,凡是涉及大数据的复杂问题,机器学习都有用武之地。

  学习的两个标志性特征是获得新知识与新技能。机器学习的终极目标是让机器通过学习获得尽量多且足够高级的知识与技能,特别是获取不亚于人的知识与技能,从而真正实现人工智能的梦想。最近发生的一件事让一些人工智能研究者恢复了曾经的自信。3月中旬,谷歌开发的AlphaGo打败了围棋高手李世石。谷歌开发团队在AlphaGo身上运用了深度学习技术,让它受到了约3000万步棋的训练。但这仅仅是第一步。这一步从理论上讲只能保证AlphaGo棋下得和人类一样好。接下来,研究者让它自己进行对局,产生出新棋招,通过对新棋招的强化学习而战胜人类。AlphaGo的本领不只是下围棋,基于问题的等价性,它原则上可用来解决任何对抗性任务,包括战争、商业与贸易。假如这样一个能够自我加强的系统得到大范围应用,它是不是会很快学得比人类更加智能,甚至摆脱人类的控制?一些人,例如特斯拉的创始人伊隆·马斯克(Elon Musk),认为应该认真考虑这种“甜蜜的烦恼”。

  机器学习还不具备价值体系 

  机器学习真的有这么神奇吗?我们不妨先看看最近发生的另一起同样引起公众广泛关注的事。微软开发的聊天机器人Tay在3月23日接入社交网络平台后,使用不到24小时就被网民“教坏”了,不但辱骂用户,还发表了种族主义评论和煽动性的政治宣言。微软被迫宣布将其下线进行修复。AlphaGo和Tay都试图用机器学习的利剑来打开人类智能的硬核,即基于直觉的计算和基于语言的思想表达。AlphaGo似乎取得了完美胜利,Tay则得失兼有。但微软并未对Tay的失利感到失望——它已放言,Tay会回来的。

  在我看来,AlphaGo和Tay正好反映了机器学习的长处与不足。一方面,机器学习突破了显性编码的局限,使得复杂计算成为可能。像围棋这样的难题对显性编码来说是望而生畏的,因为每一步计算都会引起几何级的数据增长,但机器学习解除了信息爆炸,从而让答案变得触手可及。另一方面,机器学习,至少就目前而言,却对语言的意义无从下手。语言不只是一串声音,也不只是一堆符合句法的字符,它是表达说话者心理状态的语义实体。语言的意义就在于它所负载说者的思想与意图。Tay虽然通过学习,向对话者输出了一大堆符合句法的字符,但它根本就没有赋予这些字符意义。Tay就像塞尔(John Searle)所说的“中文屋”一样,它通过对句法规则的掌握完成了若干语言游戏,却不知道自己在玩什么样的游戏。一些人,例如,邱奇兰(Paul Churchland)认为,只要机器能把句法规则玩得足够好,语义自然也就手到擒来了。然而,尽管Tay句法规则玩得很好,但它却不懂语义,因为它压根儿就不知道它说了很多冒犯人类的话。

  Tay所表现出的问题反映了机器学习的困境。到目前为止,机器学习主要依赖于计算机科学与统计学,它从人类学习中获得的启示远逊于它从上述两个学科所获得的启示。一个重要原因是,我们对人类学习的了解还不够。人类学习的一个重要特征是概念化。概念化就是用概念去表达意识的内容。概念化是一个涉及分类的抽象化过程,这个过程伴随着一种自我意识,即“我在用这个概念去表达……”当我们进行思考时,这种自我意识就汇合成自我知识,即“我知道我知道……”目前的机器学习并不能让机器做到这一点。无论是Tay还是AlphaGo都不知道自己说了什么,做了什么。

  自我意识和自我知识很重要。只有具有自我意识和自我知识的生物才能形成二阶心理状态,比如二阶欲望(关于欲望的欲望)。一些人,例如,法兰克福(Harry Frankfurt)认为,人与动物的区别就在于二阶欲望,只有人才能形成二阶欲望。道德需要以二阶欲望为基础。如果一个能动者不能形成二阶欲望,它也就无法做出道德判断。如此,我们也就不难理解Tay为何会吐出一大堆冒犯人类的话来——因为它根本就无道德可言。

  机器学习如果真的要做到与人类相媲美,那么它就应该更多地向人类学习。它需要学会像人类一样进行概念化,学会像人类一样拥有二阶状态。只有这样,机器才能拥有自己的价值体系,才能甄别那些与它们的“基本原则与价值相冲突的不良意图”。而要做到这一点,除了需要认知科学揭示出更多的人类认知细节,还需要哲学勾画出更加饱满的人类价值体系。总之,机器学习要有一个质的飞跃,就需要加强与认知科学和哲学的合作。

  (作者单位:山东大学哲学与社会发展学院)

分享到: 0 转载请注明来源:中国社会科学网 (责编:梁润桦)
696 64.jpg
用户昵称:  (您填写的昵称将出现在评论列表中)  匿名
 验证码 
所有评论仅代表网友意见
最新发表的评论0条,总共0 查看全部评论

回到频道首页
wxgg3.jpg
内文页广告3(手机版).jpg
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们