首页 >> 语言学 >> 现代汉语
汉语褒贬词语的褒贬指向问题
2014年01月26日 09:33 来源:《语言文字应用》(京)2009年3期 作者:李斌 陈小荷 字号

内容摘要:本文着重探讨汉语中带有褒贬色彩的词语的褒贬指向问题。在句法成分、配价、语义角色、褒贬态度三元组〈评价者—褒贬态度—褒贬对象〉的框架下,分析了992个褒贬词语(包括名词、动词、形容词、副词)的褒贬指向,重点区分了二价词语的说话人对施事的态度和施事对受事的态度。该分析可以应用于句子或语篇的态度计算,也可以应用于机器翻译中的译词选择、语言教学和词典编纂等领域。

关键词:动词;语义;词语;受事;指向;分析;词典;计算;评价;角色

作者简介:

  作者简介:李斌,南京师范大学文学院博士,主要研究方向为计算语言学(江苏 南京 210097);

  陈小荷,南京师范大学文学院教授,博士生导师,主要研究方向为计算语言学(江苏 南京 210097)。

  内容提要:本文着重探讨汉语中带有褒贬色彩的词语的褒贬指向问题。在句法成分、配价、语义角色、褒贬态度三元组〈评价者—褒贬态度—褒贬对象〉的框架下,分析了992个褒贬词语(包括名词、动词、形容词、副词)的褒贬指向,重点区分了二价词语的说话人对施事的态度和施事对受事的态度。该分析可以应用于句子或语篇的态度计算,也可以应用于机器翻译中的译词选择、语言教学和词典编纂等领域。

  关 键 词:褒贬指向/态度计算/语义分析/配价derogatory and commendatory direction tendency/semantic computation/semantic analysis/valence

  一 引言

  词语的褒贬义问题在汉语词汇学中研究得比较多,但在机器翻译和对外汉语教学方面依然存在着不少实际困难。外国学生往往难以区分出意义相近而褒贬义不同的词语,机器翻译上也存在着褒贬译词选择不准的问题。近几年来,随着态度计算的日益展开,词语、句子和篇章的倾向性计算成为计算语言学研究的热点,而褒贬义词语作为语言中最基本的倾向性要素,其分析也成为一项重要的基础工作。

  在语言学界,褒贬词语的研究主要集中在褒贬色彩分析和确认(解海江、张志毅,2003)、历史流变(孙雪敏,1999)、语境变异和译词选择(刘全福,1999)等方面,从动态、静态和历时的角度界定词语的褒义和贬义。

  在计算语言学界,近年来随着态度计算的兴起,研究者开始对含有态度评价的动词区分出“评价者”“态度”和“评价对象”三个评价角色,并描写评价角色和句法成分或语义角色之间的关系。晋耀红(2004)针对评价性动词(如“支持”“反对”“污蔑”等)建立了褒贬模板,描写了每个动词的评价角色和“说话人”“施事”和“受事”三个语义角色之间的对应关系。Bethard et.al(2004)则利用FrameNet的动词框架,人工标注了英语评价性动词的评价信息和框架元素的对应关系。刘永丹等(2004)也采用了动词模板的方法来处理中文语料。这些研究都是基于格语法的思想,静态地描写动词的评价角色和语义角色之间的对应关系,并以模板匹配的方式来避免完全句法分析的低效性。不过,这些实验使用的动词仅是少量的高频词,覆盖度较小。Wilson & Wiebe(2003)、徐琳宏等(2008)则在建设情感态度语料库的过程中,动态地标注了句子中态度的所有者、评价对象、态度及强度。这样全面的标注对于实际应用中机器学习及自动标注提供了良好的基础,但尚未提炼出具有理论意义的认识。虽然计算语言学界主要描写的是评价性动词,但对褒贬词语的分析来说有着直接的借鉴意义。

  综上所述,在语言学界,传统的词汇语义研究在褒贬义的判定上做了定性分析,而计算语言学在实际任务中区分出“评价者、态度和评价对象”三个要素。从更高的层次上看,目前态度计算尚缺乏对语言中表示态度的句法语义手段的系统考察和分析。本文尝试在这方面做一些探索,把褒贬义和句法语义层面结合起来进行研究。

  二 褒贬指向的界定

  褒义和贬义,是凝结在词语中的意义,表达了人们对事物的褒贬态度。在过去的研究里,词汇学关心的主要是词语褒义和贬义的分析和界定,还没有清晰地指出褒贬中蕴含的“评价者”和“褒贬对象”这两个重要角色。例如,在句子“他讨厌小王”中,贬义动词“讨厌”,其评价者是施事“他”,所贬斥的是受事“小王”;而在句子“他包庇小王”中,情况则发生了变化。很明显,“小王”是被贬斥的对象,可是贬斥“小王”的人不能说是施事“他”,而是说(写)这句话的人,而且从“包庇”的词义上看,表达的主要态度是说话人对施事“他”的贬斥。“讨厌”和“包庇”,都是贬义的二价动词,在褒贬的方向上却有很大的差异。这种差异,在区分出“评价者”“褒贬对象”并与动词的语义角色对应之后才看得较为清楚。

  我们把一个褒贬词语所关涉的对象限定为一个三元组:〈评价者—褒贬态度—褒贬对象〉,把“评价者”和“褒贬对象”称为“评价角色”,进而把褒贬词语的“褒贬指向”定义为:由褒贬词语的褒贬义所决定的,评价者对褒贬对象的态度在语义角色上呈现的指向性,如“施事褒受事”“说话人贬施事”等等。在本文中,我们区分出“说话人”“施事”“受事”和介词引导的“与事”四种语义角色。后三种成分与格理论、配价理论的一般界定是相同的。“说话人”是一个比较特殊的角色。既可以在句子中出现,也可以不出现。出现的情况主要是采用直接引语,如“他说:‘大家都夸奖我。’”或者采用间接引语“他说大家都夸奖自己”。在真实话语中,引语出现得较少,“说话人”往往就是话语的直接作者。

  提出“褒贬指向”以后,需要进行两方面的考察验证:(1)动词的配价是否会影响褒贬指向的数量。二价动词“讨厌”和“包庇”,分别体现的是施事贬受事、说话人贬施事受事两种差别很大的指向。那么一价动词和三价动词的情况又会如何?(2)动词以外的其他词类是否也可以做褒贬指向的分析。褒贬词语不局限于动词,名词“风度”、形容词“安详”、副词“大肆”等其他词类的词语,可以出现在多个句法位置上,它们在不同句法位置上的褒贬指向以及和配价的关系也是有待考察的对象。

  三 词语褒贬指向的分析

  为了较为系统地考察汉语褒贬词语的褒贬指向问题,并尽量避免某个词语是否具有褒贬色彩的争论,我们选择了《汉语褒贬义词语用法词典》(以下简称《褒贬词典》)作为分析对象。该词典收录了现代汉语中常用的含有褒贬感情色彩的多音节词语共1015条,包括名词、动词、形容词、副词、成语及惯用语,所标注的褒贬色彩分别为褒义、贬义、敬词、谦词和客套话。我们仅考察其中的褒贬义词语992条。对成语和惯用语,我们按照名词、动词、形容词、副词标注了词类,整理后得到142个名词、294个动词、540个形容词和16个副词。我们对这些词语按照词类依次进行分析,分析一般限定在句法功能(主语、谓语、宾语、定语、状语、补语)、配价数(零、一、二、三)、语义角色(说话人、施事、受事、与事)和褒贬态度三元组(评价者、褒贬态度、褒贬对象)的范围中。为了方便说明,本文中的例句采用如下格式:“我们要捍卫祖国的尊严。”评价者加下划线,褒贬词语加着重号,褒贬的对象加下波浪线。

  (一)动词的褒贬指向

  动词的褒贬指向是最有代表性的。动词一般充当谓语的核心成分,其配价的多少往往决定了其褒贬指向的数量。在我们考察的动词中,没有出现零价动词。因此,下面只讨论一价至三价动词的情况。在分析过程中,我们发现有4个褒贬词语应为中性词,即“株连、损失、美化、奇货可居”,排除在考察范围外。

  1.一价动词只有一个施事成分,表达的是说话人对施事的褒贬态度,如“这些人终于得逞了”的指向为〈说话人—贬—施事(这些人)〉。该类动词共有88个,褒义20个,贬义68个,如“凯旋”“得逞”等。

  2.二价动词是非常特殊的,上文列举的“夸奖”和“包庇”都是二价动词,但褒贬指向差别很大。由于“说话人”“施事”和“受事”三种角色的存在,从理论上看,评价者和评价对象的关系就有三种可能性,即说话人对施事、说话人对受事、施事对受事。通过考察,发现不仅存在着这三种方式,甚至还有叠加的情况。

  1)说话人对施事

  与一价动词相似,这类动词表达了说话人对施事的褒贬,如“开发商牟取暴利”。这样的动词有81个,其中褒义3个,贬义78个,如“挺进”“牟取”等。

  2)说话人对受事

  在我们所考察的动词中,并没有出现说话人仅仅对受事进行褒贬的情况,说话人对受事的褒贬总是与对施事的褒贬同时出现,有的跟对施事的褒贬一致,如“牺牲、散布”,“他不断地散布一些言论”;有的不一致,如“玷污、抹杀”,“他抹杀孩子的天性”的指向为〈说话人—贬—施事(他)〉,〈说话人—褒—受事(孩子的天性)〉。该类动词有14个。

  3)施事对受事

  施事对受事的褒贬,是一种比较简单的类型,如“喜爱、伤害”等。其用法如“我们喜爱这部电影”。

  单纯表示施事对受事的褒贬动词共35个,其中褒义的有34个,贬义的有1个。这种数量上的巨大差距看起来有些异常,经分析是由于《褒贬词典》收录词语的数量有限,比如“讨厌、厌恶”等表贬义的词语就没有被收录。

  4)双层叠加

  有些动词同时含有施事对受事的褒贬和说话人对施事、受事的褒贬,形成双层叠加的褒贬。如“他亵渎了亡灵”中的“亵渎”。其内层指向为〈施事(他)—贬—受事(亡灵)〉,外层指向为〈说话人—贬—施事(他)〉,〈说话人—褒—受事(亡灵)〉。双层叠加的动词有41个,在内层施事对受事表褒的有11个(如“标榜”),表贬的有30个(如“诋毁”)。不过,有一种叠加方式的词语《褒贬词典》中没有收录,即内层是施事贬受事,外层是说话人褒施事,如“驳斥”。

  5)特殊的容纳范畴动词

  在《褒贬词典》中,“充斥”“洋溢”“涌现”都是表容纳关系的动词,称之为“容纳范畴”动词,其语义角色之间是“容器—内容”关系,不论句法成分的位置如何变化,都表达了说话人对“内容”的褒贬。如:

  市场上充斥着假冒伪劣商品。  |  假冒伪劣商品充斥着市场。

  如果把“容器”作为“处所”处理,则这类动词也可以算作一价动词,自然只能由说话人对唯一的价“内容”进行褒贬。

  6)介词引导的二价动词

  有些动词是介词引导的二价动词,往往表达了对介词引导的与事角色的褒贬,基本模式为:施事+介词+与事+动词。如“一些文人为袁世凯歌功颂德”,就分别表达了施事“一些文人”对与事“袁世凯”的褒扬,以及说话人对施事和与事的贬斥。需介词引导的二价动词共有22个,与上面标准的二价动词相似,也存在着说话人对施事(撒野)、说话人对施事和与事(狼狈为奸)、施事对与事(赞不绝口)和双层叠加(歌功颂德)四种方式。

  3.三价动词(包括介词引导的)共有7个,基本模式为:施事+动词+与事+受事。如“他们勒索了港商一笔巨款”。其褒贬指向与二价动词的第一类相仿,都是说话人对施事的褒贬。

  从动词的褒贬指向的分析中,我们看到了配价的参数选择问题,即配价数决定了褒贬指向方式的数量。一价动词只能是说话人对施事的褒贬;二价动词则出现了多种指向方式;而三价动词由于考察数量较少,并没有显示出更为多样的指向性,还需要进一步地分析论证。

  (二)名词的褒贬指向

  名词在句子中一般充当主宾语。在不同的结构中,说话人使用名词可以对不同的句法成分和对象进行褒贬。一是对名词所指、同指的对象表示褒贬。如“这群暴徒到处抢劫”是把这群人贬斥为“暴徒”。二是把名词用作判断句的宾语来对主语进行评判。如“他是我们学习的典范”。这些零价的名词共有117个。

  一价名词可通过“有+名词”的方式来表达对施事的褒贬,这样的名词有18个。如“他很有气魄”。一般能加“有”的名词,还可以加“的”,表示说话人对定语(领属者)的褒贬,如“他的气魄令人敬佩”。其中,不能加“有”,只能加“的”的名词有5个:“盛名、事迹、心血、雄姿、下场”。

  二价名词体现出了施事对与事的褒贬态度。施事是态度的持有者,介词引出的与事是褒贬对象,名词本身是态度的表达。如“敌意”“友谊”等,其模式为:施事+介词+与事+的+名词。如“他对她的敌意很深”。在《褒贬词典》中只收录了2个词语,即“热情”和“友谊”。

  (三)形容词的褒贬指向

  形容词一般充当定语、谓语、状语和补语。做定语的时候,表达说话人对形容词修饰的名词性成分的褒贬。如“我们的祖国有灿烂的文化”。做谓语的时候,是说话人对施事进行褒贬。如“他很安详”,“他总是冷冰冰的”。当形容词做状语或补语的时候,表示说话人对状语或补语所修饰动词的施事进行褒贬。如“他傲慢地批评别人”,“他笑得很狂妄”。

  在《褒贬词典》中,大部分形容词都是一价的,褒贬指向体现为说话人评价唯一的配价成分。二价形容词仅有5个,“冷冰冰、强横、狭隘、温和、坦白”,体现的是施事对与事的褒贬。其模式为:施事+介词+与事+形容词短语。如“他对她很温和”。不过,当与事是不定指或省略的时候,依然是说话人对施事的褒贬,如“他(对人)很温和”。值得注意的是,与二价动词的双层叠加方式相似,“强横、狭隘”同时带有说话人对施事的褒贬。

  (四)副词的褒贬指向

  褒贬副词所体现的是说话人的主观态度,对施事进行褒贬。副词本身并没有施事,是说话人使用副词对其修饰的动词所支配的施事进行褒贬。如“他勇于实践”和“默克尔大肆指责中俄等国家的人权问题”都表达了说话人对施事的褒贬。

  在《褒贬词典》中,副词共16个。联系上文对形容词的分析,可以看出,只要褒贬词语作为状语,其褒贬指向就是说话人对状语所修饰动词的施事的褒贬。

  (五)总结分析

  综合前面的分析,我们把四大词类的词语按照配价整理成一张总表(见下页表1),总结出以下两个特点:

  1.配价数大致决定了褒贬指向的类型数。对于零价和一价的词语来说,褒贬指向是无歧义的,都是说话人对仅存成分(角色)的态度。在二价动词和形容词上出现了一对多的情况,即说话人对施事和施事对受事两种指向。这种多样性源于“说话人”这个角色的存在导致语义角色的数量超过了两个,给了语言以变化的空间。二价名词和三价动词没有出现复杂的多样性,很可能是受限于《褒贬词典》的规模,考察面还不够广。

  2.“说话人”几乎出现在各种句法语义格式中,这源于褒贬词语体现的主要是说话人的态度倾向。严格说,单纯表达施事对受事的态度的词语,如“喜爱、伤害”等,也许不能算是褒贬词语,它们与中性的“支持、反对”等动词是相似的,只是带有特殊情感的褒贬。如果我们剔除施事对受事的褒贬指向,那么这部分词语就可以被排除了,褒贬词语就完全是说话人对施事、受事、与事三个语义角色的褒贬了,也不会存在双层叠加的复杂情况。这样,说话人也就可以脱离施事、受事等角色所在的语义平面而独立出来。当然,这些都是描写的手段和策略而已,对于褒贬立场的计算来说,施事对受事的褒贬指向依然是必要的,需要像表1那样把各种指向关系描写清楚。

  表1 词语褒贬指向总表

H1U1225.jpg

  注:()表示在《褒贬词典》之外补充的词语,*表示没有找到此种词语。

  我们在这里分析的都是多音节词语,对于单音节词语“爱、恨、尊、厌、坑、蒙、拐、骗”等,也完全可以按照本文的框架进行分析。

  (六)褒贬指向的来源和所在的平面

  我们认为,褒贬指向来源于词语的意义之中,换言之,褒贬指向就是对传统褒贬词义研究的进一步深化、细化。区别在于,过去把褒贬义仅仅看做是词语的附加义或色彩义,而褒贬指向则涉及评价角色和语义角色的对应关系。比如,《现代汉语词典(第5版)》对动词“勾结”解释为:“为了进行不正当的活动暗中互相串通、结合。”从词义中很容易推导出说话人对施事和受事的贬斥。因此,褒贬指向是根植于词义的,动词在语义平面上形成语义角色的指向性关系,名词、形容词和副词也是在语义平面上对相关的语义角色或配价成分形成指向性关系,而句法成分仅仅是语义角色或配价成分的投影而已。

  四 词语褒贬指向的理论意义和实用价值

  上文着力分析了不同词性的褒贬词语的褒贬指向问题,这种分析的价值和作用可从四个方面来看。

  首先,可以丰富对词语附加义的认识。在古汉语中,所谓一字见褒贬的“春秋笔法”中较知名的就是三个表示“杀”这个概念的动词:“杀”“弑”“诛”。从词义上看,“杀”指无罪而杀,“弑”指以下犯上,“诛”则指有罪、有理而杀。其褒贬指向相应为无褒贬、说话人贬施事、说话人褒施事贬受事。自古以来,汉语的褒贬词汇就很丰富,特别体现在褒贬动词上。然而无论是词汇语义学还是句法语义学,都没有充分关注包括褒贬义在内的“附加义”对语义角色的约束性,尤其是忽视了“说话人”这样的句外角色。当然,什么是附加义还存在不少争论。我们的看法是,先把这些不同层面的意义描写清楚,服务于教学和计算的实际需要,定性和解释的问题可以继续讨论。

  其次,可以加深对词语搭配的认识。过去认为,动词对其相关的语义角色具有搭配限制(或称语义选择限制)。比如,“吃”的施事一般是“动物”,受事一般具备[食物][固态]的语义特征。而对于褒贬动词来说,关键不在于施事、受事自身的语义类别或属性,而在于说话人(评价者)对它的主观评价。如“他总是包庇小王”中动词“包庇”的施事和受事,不仅要符合“人”的语义类,而且须是说话人贬斥的对象,而充当施事和受事的词语,却不必为贬义词。因此,在生成话语时,说话人贬斥施事和受事的时候才会选用“包庇”;而在理解话语时,人们一听就知道是说话人在贬低施事和受事。

  再次,可以用于汉语句子及篇章的态度计算。如“默克尔大肆指责中俄等国家的人权问题”,利用动词“指责”可知“默克尔”对“人权问题”持批评态度,利用副词“大肆”可知说话人对“默克尔”持批评态度。有了句子的态度,就可以进一步自底向上地进行句群、段落乃至篇章的态度网络建构。这种应用依赖于良好的句法分析、语义分析(特别是语义角色分析)和指代消解等工作。目前这三者的自动分析效果依然欠佳,暂时只能在人工标校的树库上进行一些实验。

  最后,可以应用到语言教学和机器翻译中。在词典和教材中,讲清楚褒贬词语的指向性,可以在很大程度上避免留学生的误用,应用于机器翻译方面也可以提高褒贬词语的译准度。无论是哪种应用,都必须建立起大规模的褒贬指向信息库。借助于配价的多少决定褒贬指向数量的规则就可以大大加快建设速度。词汇学的研究已经形成了一些褒贬词典词表,如本文使用的《褒贬词典》;语法学的研究更是建立了一批带有句法语义信息(配价、语义角色等)的词典资源,如北京大学开发的《现代汉语语法信息词典》和《现代汉语语义词典》,借助这两类词典,对于零价和一价词语的褒贬指向就可以自动判定,只需对二价以上的词语进行人工分析。

  五 结语

  针对汉语中的褒贬词语的态度立场问题,本文提出了“褒贬指向”的概念,参考传统的词汇语义学、格语法、配价等语言学理论,对《汉语褒贬义词语用法词典》的992个褒贬词语按照不同的词类及配价数进行了考察,给出了各类词语的褒贬指向。特别是指出了配价数决定褒贬指向数的规则,零价和一价词语都体现说话人的态度,二价以上的词语具有“说话人对施事”“施事对受事”以及双层叠加等多种态度指向。这对句子、篇章级别的态度立场计算有着重要价值。

  当然,我们的分析只是初步的,在实际的语言使用中,特别是在大规模语料库中,可能会超出本文所考察的褒贬指向用法,特别是修辞手法或语用策略的使用会带来褒贬色彩的变化。这就需要进行更大规模、更为细致的分析和研究工作。其次,还需要与其他语言进行对比分析,以提高机器翻译的精度。自然语言的语义分析和计算在根本上依赖于理论语言学的发展。词语“附加义”的语义分析和计算,特别是词汇意义与句法语义层面的对应关系,值得进行深入细致的研究。

  语义分析是一项难度很大的工作,涉及多义词的义项区分、意义和用法的区分等难题。我们的分析和统计工作也不可避免地存在一些问题和疏漏。《褒贬词典》仅有900多条词语,在数量上也难以满足处理大规模语料的要求,这些不足都需要在以后的研究中逐步完善。

 

  参考文献: [1]Steven Bethard, Hong Yu, Ashley Thornton et. al. Automatic Extraction of Opinion Propositions and their Holders [A]. In: Proceedings of AAAI Spring Symposium on Exploring Attitude and Affect in Text[C], Yan Qu, James G. Shanahan, and Janyce Wiebe (eds.), AAAI Technical Report Series, AAAI Press, Menlo Park, USA, 2004.

  [2]Theresa Wilson and Janyce Wiebe. Annotating Opinions in the World Press [A]. In: 4th SIGdial Workshop on Discourse and Dialogue (SIGO dial-03) [C], 2003.

  [3]晋耀红,苗传江.一个基于语境框架的文本特征提取算法[J].计算机研究与发展,2004,(4).

  [4]刘全福.语境分析与褒贬语义取向[J].中国科技翻译,1999,(3).

  [5]刘永丹,曾海泉,李荣陆,胡运发.基于语义分析的倾向性文本过滤[J].通信学报,2004,Vol.25,(7).

  [6]孙雪敏.成语语义褒贬转化试析[J].语文建设,1999,(4).

  [7]王国璋.汉语褒贬义词语用法词典[M].北京:华语教学出版社,2001.

  [8]解海江,张志毅.谈《现汉》对义位褒贬陪义的标注[J].辞书研究,2003,(6).

  [9]徐琳宏,林鸿飞,赵晶.情感语料库的构建和分析[J].中文信息学报,2008,(1).

  [10]袁毓林.汉语动词的配价研究[M].南昌:江西教育出版社,1998.

分享到: 0 转载请注明来源:中国社会科学网 (责编:隋萌萌)
696 64.jpg
用户昵称:  (您填写的昵称将出现在评论列表中)  匿名
 验证码 
所有评论仅代表网友意见
最新发表的评论0条,总共0 查看全部评论

回到频道首页
wxgg3.jpg
内文页广告3(手机版).jpg
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们