
生成式人工智能的出现重新提起了大众对于非人类智能的强烈兴趣,并由此开始想象人工智能在生产力提升与解放方面有可能带来的飞跃,也不可避免地引发了社会对人工智能的恐惧情绪。尽管这些恐惧几乎都是由科幻文艺带给我们的,但随着近一个世纪以来科技的不断发展,人类不断提醒自己要警惕人工智能的潜在风险,似乎并非杞人忧天。特别是生成式人工智能在语义理解、指令完成、信息归纳、内容输出等方面展现出强大的学习力和创建力,更让大众加剧了对人工智能是否会“觉醒”的担忧。王峰在谈到“人工智能需要‘灵魂’吗”这一问题时提出,“当说人工智能具有灵魂的时候,人们在灵魂里面掺杂了什么?这些掺杂之物改装到人工智能上面是不是合适?”事实上,当人工智能深度介入文艺生产领域,对于“灵魂”问题的追问自然会涉及审美,二者在根本逻辑上是一致的。换言之,我们可以把人工智能是否具备审美能力作为探讨“灵魂”问题的一个切入口,进而揭示人工智能在文艺生产中如何展现自己的审美,以及作为文艺研究主体的人类应当如何看待人工智能文艺产品的审美问题。
一、一切从大语言模型的工作原理说起
把技术视为一种审美,是20世纪文艺审美观念的新变化。不同于“庖丁解牛”所产生的技艺之美,20世纪的技术美主要来源于科学技术的革新以及各类机器设备所带来的生产力解放。尤其是对大众而言,基于网络技术、互动技术、多媒体技术、虚拟现实技术、仿生技术、电子技术等高新科技突破,技术所产生的全新体验、所带来的便捷服务以及由此带来的生活方式、人际关系、感官娱乐等方面的变化,总是能让我们在享受技术之美的同时感慨科技发展的无限性。而作为高科技领域最新的技术成果,基于大语言模型的生成式人工智能由于在多领域超乎寻常的理解力和创造力,不免让人对其产生远超现实的复杂幻象。特别是在文艺生产方面,受众在欣赏人工智能创作的诗歌、小说、视频等文艺产品时,感受到人工智能作为“艺术家”的美学思想传达以及这些产品本身所具备的审美价值,是引发大众讨论人工智能“灵魂”问题的重要原因,也进而让我们开始思考人工智能的“审美能力”由何而来。
一方面,从人工智能文艺产品来看,其中相对成熟的诗歌、小说已经展现出与人类文艺作品极为相似的美学价值,无论是遣词造句,还是整体架构,甚至是对于文学意象的描绘,都令读者难以分辨眼前的作品究竟是人类创作,还是出自人工智能之手。“从目前的技术发展来看,人工智能程序已经能够自动或者半自动地生成新的类人类文学文本,在写作上具有某种程度上的自主性。”另一方面,从人工智能文艺的生产过程来看,无论何种文艺形式,终究都是作为底层技术的大语言模型在人类提示之下输出的具有文艺属性的内容。换言之,人工智能并不会自主自发地生产文艺产品。对人工智能文艺产品和生产过程进行分析之后很可能会产生疑问,如果人工智能并不具备审美能力,那么这类文艺产品的美学属性来自何方?如果人工智能具备审美能力,那么至少说明这一类人主体已经萌发了初步的自我意识,这更是大众难以想象的状况。因此,从文艺生产角度理解人工智能是否具备审美能力,必须将大语言模型的工作原理作为思考的出发点。
首先,尽管生成式人工智能可在人类提示下进行文艺内容输出,但所运用的却是另外一套技术逻辑,而不是人类正常的自然语言处理方法,因此无所谓是否具备审美能力的问题。作为最早成熟的生成式人工智能应用,ChatGPT的运行原理是利用自回归(auto-regressive)方式,“根据前面已知的词语,根据分布概率来预测接下来最可能出现的词语”。具体而言,开发者利用大型语料库对大语言模型进行训练,这些语料库包括了种类繁杂的对话、图片、视频等内容,因此能够帮助模型逐步“了解”人类语言的组合规律,并借助统计学上的概率模型来预测语句中下一个位置出现某个词的可能性。经过无监督学习、监督学习和强化学习三个阶段训练,人工智能已经能够对人类自然语言进行高质量模拟,并据此与人类展开对话。而根据具体场景、专业知识和任务类型进行精细化训练之后,大语言模型已经具备了对复杂语义进行识别、对人类逻辑进行辨识并依据用户指令完成具体工作的能力。需要指出的是,大语言模型是利用数学方法来表示自然语言,这是其自身的语义理解方式,虽然从人机对话来看达到了殊途同归的结果,但因语言处理路径不同,由此并不能产生如人类一样的审美能力。换言之,人工智能的智能是大语言模型利用算法并经过特定训练之后所展现出来的类人属性,其底层逻辑仍然是数学原理和数字化技术。
具体到文艺生产上,当生成式人工智能生成文艺产品时,文艺观念来自用户所发出的指令,文艺形式是对已有人类文学作品的模仿,文艺语言同样取自人类常规使用的符号群。只有这样,人工智能生产出来的文艺产品才能够被人类受众所接受并理解。至于文艺意蕴,对于没有“灵魂”的人工智能来说更是无从谈起。因此从本质上来看,人工智能文艺产品与人类文艺作品有着根本区别:前者是科学技术对已有数据库进行重新组织加工的结果,是按照数学规律生成的具有类文艺特征的具体内容,而后者则是“凝聚了人的本质力量,既是对客体世界的认识和改造,也是主体自身本质力量的外化和确证,是认识和对象化的统一、能动和受动的统一、合规律性与合目的性的统一,并且要按照‘美的规律’来塑造物体”。概而言之,人工智能文艺产品并不是类人主体基于对世界的理解和感悟以及美的理念而形成的常规艺术作品,其来自另外一种语言理解方式,与审美能力并无根本联系。
其次,生成式人工智能还远未达到人类文艺生产的高度和水准,目前主要是在常规语义理解方面展现自己的能力,至于人类在文艺作品中暗藏的隐喻、反讽等多种意义转换手法,人工智能距离人类智能还有较大差距。这主要是因为,人类所创作的文艺作品遵循的是建立在感性基础之上的美学逻辑,如感觉、记忆、想象、判断、创造性等,这些既是Aesthetics的基本内涵,也因无法像理性认识一样达到一般性而被理性主义视为低级认识。鲍姆嘉滕(Alexander Gottlieb Baumgarten,又译“鲍姆嘉通”“鲍姆加登”)在《美学》中提出:“如果说逻辑思维努力达到对这些事物清晰的、理智的认识,那么,美的思维在自己的领域内也有着足够的事情做,它要通过感官和理性的类似物以细腻的感情去感受这些事物。”正因无法像理性认识一样被分析,所以基于此产生的文艺作品也无法被量化,而只能通过文艺家和受众的感觉、知觉、想象、情感、领悟等审美心理要素以及由此形成的文艺感知力、阐释力和判断力来进行解读与理解。
与之不同的是,完全由数字技术、数学思维和算法逻辑所主导的大语言模型以绝对理性来处理文艺问题,尤其是作为“一种能够被计算机程序所实现的、有明确规定性的计算过程”的算法,在文艺生产中发挥着至关重要的作用。无论是对人类自然语言的理解,还是将各种数据材料“再创造”为新的文艺内容,都建立在严密的算法基础之上。但是,这些基于数学逻辑的算法对于人类在特定语境中以感性思维所表达的文艺内容,尤其是隐喻、反讽等的暗含之意,或者稍有不同的语气所内藏的含义指向,就显得难以应对。这些是长期沉浸在文化氛围和语言习惯之中的人类能够轻松辨别的,但对于并不具备“灵魂”的大语言模型而言,开发者既无法正面告知其如何准确辨别,也难以在具体训练中找到可以被简单量化的提示方向。这也说明至少到目前为止,缺少如人类一样“自由灵魂”的生成式人工智能仍不具备独立审美能力,其文艺创作能力来源于算法和算力的深度结合,文艺创作手法是在开发者的强化训练以及对人类文艺作品深度模仿基础上所展现出的类似镜像。至于人工智能生产的文艺产品所展现出来的“审美价值”,则是人类受众自己解读、阐释并将其视为文艺作品的结果。
二、人工智能文艺审美是人类审美的迁移
既然生成式人工智能并不具备独立审美能力,那么人工智能文艺是如何获得美学属性的?研究者又应当如何理解人工智能文艺产品的审美价值呢?如前所述,人工智能文艺生产是对人类文艺作品的模仿,模仿的对象是人类创作的文艺作品。也就是说,先有了人类文艺作品,才会有人工智能文艺产品;先有了人类审美的特征与取向,人工智能文艺才有了具体的审美方向。由于人类创作的文艺作品是人类审美的具象化和物质化呈现,因此人工智能文艺可以被视为人类审美的整体迁移。当然,这种迁移同样是由人工智能经过算法转换并在开发者的强化训练之后所获得的,但在人类强大且极具宽度和深度的阐释力与理解力的帮助下,受众自然可以较为顺利地接受人工智能文艺产品并对其进行美学解读。可以说,人工智能对人类文艺的模仿是人工智能文艺具有美学属性的基础,而人类受众运用综合审美能力对人工智能文艺产品进行合理解读,则是人工智能文艺能够被视为具有美学属性的必要条件,二者共同完成了人类审美的迁移,也为人类受众提供了前所未有的文艺来源。
其一,生成式人工智能本身并不具备审美能力,其所生产的文艺产品是人类文艺作品的镜像展示,其中的美学意蕴也是人类审美能力的数字化迁移。如前所述,人工智能文艺是基于算法、算力和数据实现的内容呈现。就文学而言,ChatGPT“主要通过统计学来连缀词语,从而完成自己的算法,并在程序的驱使和主宰下完成一篇篇作品的顺利生产”;虽然Sora相对复杂,但其所制造的人工智能视频也是基于“扩散模型”(Diffusion Model)对文字、图像和影像进行整合、转化的结果,“它们都是数据,都可以被分解、还原为数据,也都可以,甚至理应按照数据处理的模型和法则来展开运作”。由此可见,人工智能并不具备生产完全新颖的内容的创造力,无论是文字、图像还是视频,都来源于人类已经创造出来的文化内容。正是由于这个原因,人工智能所生产的文艺产品才能被受众所理解,文艺符号也可以被受众轻松识别。其中的美学意蕴,无论是文艺价值和审美价值,还是其中内含的情绪情感、道德伦理、文化观念,甚至是能够启发受众的审美想象,都来自人类所创造的整个世界。从这一点来看,Sora被认为是“世界模拟器”(world simulators),从美学上讲是极为恰当的。人工智能文艺之所以时常能够带给受众新奇感,往往是由于受众认知相对狭窄以及大语言模型拥有强大的算法。人类自身的审美能力决定了人工智能文艺的审美能力,人类整体的审美取向深刻影响着人工智能文艺美学特征的形成路径。
其二,人工智能文艺美学意蕴来源于已经被数据化的文化整体,对其解读需要人类受众自主完成。尽管人工智能文艺产品同样会进入互联网并被继续数据化处理,但这种生产仍然主要是面向人类受众而进行的文艺活动,毕竟人工智能自身并没有文艺审美的需求。因此从某种程度上来说,受众如何解读人工智能文艺的美学意蕴,甚至要比这种美学意蕴的呈现更加重要。“让人工智能艺术重现灵韵的是人类经验,是人类经验中的感觉、情感和理解,它们是人性的显现。人工智能生成的艺术作品,只有与人发生关系,只有在人的消费中得到激活,它们才有灵韵。”由于经受了解读人类文艺作品的长期训练,因此受众具备了各种技巧和能力来对具体文艺作品进行解释,这对理解人工智能文艺产品同样适用。特别是对诗歌、影视等文艺形式而言,较为宽泛的解读空间和可运用的多种研究工具,都能帮助人类受众阐发出极其多样化的解读结果。于是,在群体庞大的受众面前,人工智能文艺的美学意蕴不仅可以被深入挖掘,甚至还能被解读出原本可能并不存在的美学思想。换言之,人工智能负责文艺生产,而人类受众则拥有美学解释权。
当然,相当多学者认为人工智能文艺只是对原有文艺数据的重新整合,因此并不具备创新价值,更遑论人类独有的情感属性。但如果“人工智能情感是情感的技术模拟、数据还原、抽象呈现”这一认知成立,那么受众所感受到的人工智能文艺产品的美学意蕴就不能完全被认为是来自人造机器的胡乱“呓语”,至少其中所涉及的人物、故事以及表达美学思想的文艺符号都在人类文艺理念范畴之内,其所带来的审美经验也是人类审美经验的一种表现形式。更重要的是,人工智能文艺产品同样能够利用文艺符号直击受众内心,令受众产生快感、痛感等复杂心理体验。此时,在没有事先告知文艺作品来源的情况下,受众对人工智能文艺所投入的情感与人类文艺作品一样都是真实的,而这也更加说明人类受众的审美经验和审美能力在人工智能文艺产品的美学解释中发挥着决定性作用。
其三,人工智能所呈现的审美是人类整体审美能力的重新整合,这种审美的数据化和算法化迁移必然会改变人工智能文艺产品与人类受众之间的关系,甚至改变人类审美的正常轨迹。从本质上来看,人工智能文艺的生产是将已经数据化的人类整体审美能力交由用户个人来使用,这些审美能力涵盖了数千年、各类别、多民族的大量文化内容。“智能数字技术同机器体系一样,并非自然的产物,而是历史的产物,是‘一般智力’的对象化和人的本质力量的外化。”用户只需借助提示词就可以命令人工智能生产出各种类型的带有不同审美特点的文艺内容,不再像过去一样因文艺家个人能力局限性而只在一两个领域中具有较高文艺造诣。理论上来看,生成式人工智能对人类文艺家形成了“降维打击”,后者几乎是以个人力量在与人类整体审美相抗衡。在人类审美向人工智能迁移的过程中,被数据库化的所有文艺作品的突出特点以及相关文艺家的风格和弊病都会在人工智能文艺中若隐若现,这不仅造成其所生产的文艺产品并不像人类文艺家那样始终保持稳定风格,也可能会不加辨别地将已有的文艺内容和美学意蕴拿来使用,甚至因在某些方面进行美学混搭而造成生硬刻意的审美感受。
在拥有了人类整体审美能力这一强大工具之后,用户的想象力也将在很大程度上发生变化。在生成式人工智能出现之前,文艺家需要经过长期专业训练之后才能熟练掌握文艺创作技巧,艺术大师则更是天赋极高、训练刻苦,甚至是获得时代与命运眷顾的幸运者。而借助生成式人工智能,理论上普通用户并不需要专业训练,就能够“掌握”人类所有文艺类型的创作技巧和审美经验,他们可以命令人工智能生产出人类未曾有过、远远超出人类现有想象的文学、绘画、影视等文艺产品。此时,人类受众也需要更多智力资源来帮助自己更好地解读、阐释、理解人工智能文艺产品,由此是否会形成人工智能文艺美学研究方向,或者开辟出以人工智能内容生产为基础的新美学领域,将会成为传统文艺美学研究必须面对的话题。因此,接受人工智能已经开始改变世界的现实,并以积极的态度开展人工智能文艺生产实践,是推动人工智能文艺研究的第一步。
三、怎样看待人工智能文艺的美学意蕴
生成式人工智能深度介入文艺生产领域,初步展现了自己虽不具备审美能力,但能够还原并影响人类审美的巨大潜力。刘方喜认为,以ChatGPT为代表的AIGC正在使我们迎来艺术“机器大生产(大工业)”时代,“机器”不再是“人的助手”,反而“人”是“机器的助手”,这将导致此前一切时代的艺术“小生产”方式的终结,并对传统艺术家等精神劳动“小生产者”形成巨大冲击。基于这一认识不难发现,作为一种具有类人属性的准主体,生成式人工智能所进行的文艺生产已经远远超出了传统文艺研究的范畴。那么,用户的审美经验在此类文艺生产中究竟发挥着怎样的作用?人工智能文艺产品是否能令受众产生如人类文艺作品一样的审美体验?人类文艺一以贯之的人文关怀如何在人工智能文艺中延续?这些都和我们如何看待人工智能审美意蕴密切相关。进一步来看,从审美对齐、审美取代等角度来看待人工智能文艺的美学意蕴问题,无疑能够让研究者在当下如火如荼的人工智能浪潮中更具洞察力和思辨力,这也是构建文艺科技伦理体系的重要一环。
首先,人工智能在审美上与人类文化全方位对齐,越来越具有现实意义。面对生成式人工智能这种突然出现的具有类人属性的准主体,学术界首先敏锐意识到了人工智能对人类价值体系可能带来的巨大冲击,甚至是诸多前所未有的威胁,因此林爱珺、闫坤如等学者纷纷撰文讨论人工智能的价值问题。“价值对齐绝非易事,人类社会的价值标准也有很大的差异。如何对齐?标准在哪?”这一观点在很大程度上代表了学术界对于人工智能价值对齐问题的思考方向。随着更加复杂多样的生成式人工智能应用在日常生活中的普及,特别是接入手机等智能设备,普通用户利用人工智能来处理日常生活事务的频率越来越高,审美对齐问题也就逐渐凸显出来。如果说价值对齐问题涉及人工智能能否与人类和谐共生的话,那么审美对齐问题则更加与人类生活的点滴息息相关。反过来看,缺少了审美对齐,人工智能及其应用将无法获得用户的充分信赖,甚至会威胁到其自身在人类社会的存在必要性。
从大语言模型的工作逻辑和训练方式来看,由于主要对接人类用户的日常使用,在生成式人工智能所使用的语料库中,“大众自然语言数据占了很大份额,这使其展示的语元组合运动的规律具有更强普遍性,而考虑到自然语言在人类智能活动中的重要性,其展示的智能发展规律也具有更强普遍性。”正因如此,用户在使用生成式人工智能进行文艺创作时,所生产的文艺内容一般能够避免极端审美情况的出现。但是,人类文艺的两个基本特点决定了生成式人工智能的审美对齐仍然还有很长的路要走。一方面,由于数千年来人类文艺所积累的内容极其庞杂,文艺类型与亚类型丰富多样,且仍在新媒介场域中不断发展演化,因此人工智能想要在短时间内不借助人类训练的帮助将其全盘“理解”并加以实际运用,几乎不可能完全实现,而一旦借助人类训练来进行这项工作,所需要的时间和具体工作量将难以想象,这就涉及人工智能的自我学习问题;另一方面,长期的审美训练和文艺浸染,使得人类对于文艺作品保持着敏锐的感知力,其中所出现的任何微小的不合理之处都有可能被受众辨认出,从而影响对作品整体内容的审美体验。更何况,如今尚不完善的人工智能应用所生产的文艺内容还时常出现明显的漏洞,如小说存在重复内容、画面中的人有六个手指、视频中行走之人的双腿频繁互换等,这也更加凸显出人工智能文艺的审美对齐问题已经迫在眉睫。
从用户需求的角度来看,人工智能的审美对齐出现问题主要是由于大语言模型的算法和所用芯片的算力存在不足之处,以及缺少足够的强化训练。人工智能发展初期的审美对齐在由人类审美向人工智能审美转移的过程中出现问题并不奇怪,但这并不能成为人工智能文艺审美遭到完全否定的理由。从人工智能长远发展来看,算法和算力的持续提升、开发者的强化训练,以及越来越多用户频繁使用人工智能完成文艺生产、传播和研究时所积累下来的真实数据,都会推动人工智能审美不断成熟,目前所出现的审美对齐问题也将迎刃而解。在此基础上,人工智能的价值对齐问题才能突破现有困境,文艺科技伦理体系的构建根基由此也会更加牢固。
其次,是否可以用人工智能审美取代人类审美,是理解人工智能审美时难以回答却又不得不面对的现实问题。尽管目前尚不具备审美能力,但在大语言模型训练以及人类与人工智能密切协作的过程中,人工智能时常是以具备审美能力的姿态出现的。随着各类人工智能应用深度介入日常生活,人工智能在帮助人类完成复杂工作的同时,正对人类一向引以为傲的审美能力提出挑战,这也表明人类与人工智能已经超越了传统意义上的人机关系。“人工智能时代的加速带给我们一种启示:在未来,人与机器之间的纽带将愈发紧密,甚至会超越人与人之间的联系。”那么,在现实生活中,尤其是文艺生产中,人工智能审美是否能够自然取代人类审美,人工智能是否能够由此获得文艺生产的大部分权力,已经成为文艺生产实践中的热门话题。事实上,纯粹意义上的人工智能审美难以取代人类审美,这并不是担心算法、算力和数据无法匹配,更多还是在于人类与人工智能的关系远超我们想象。
一方面,对人工智能文艺而言,人类审美奠定了此类文艺产品的基本美学特征。尤其是在文艺生产中,人类的审美能力可以在数据化和算法化之后转移到人工智能上,因此人类与人工智能之间的主体界限也就趋于模糊,由此形成了全新的“人—机主体”,二者甚至能在对话、交互、协作中互相向对方学习文艺创作技巧和文艺研究方法。在这种情况下,人类与人工智能在审美方面已经难以完全区分。即使是尽量少地干预人工智能文艺生产过程,也基本不会影响其从人类文艺作品中学习审美建构方法与路径的主要模式。另一方面,人工智能并不具备如人类文艺家一样的生产主动性,其所进行的文艺生产仍然需要由人类用户来主导完成,在此过程中,“AI生成艺术的生成过程也不是单一、固定的,而是可以根据用户的需求和反馈,进行多次、反复操作的”。这也直接决定了此类文艺产品的美学特点并不是由人工智能单独塑造的。或许人工智能在算法革新和数据整合的基础上能够展现出别具一格的审美特征,但也要在人类用户的调试、优化与肯定下才能实现,人类审美能力的极限制约着人工智能审美所能达到的高度。
既然在人工智能文艺中人工智能审美和人类审美难以区分,那么继续讨论这个问题必然无法直接获得答案。特别是从目前人工智能介入文艺生产的现实情况来看,即使是当下最先进的生成式人工智能应用,由于存在记忆力短暂、偶然性较强、处理长文本能力有限等不足,因此距离具有较高水平的人类文艺家仍然还有较大差距,至少无法满足一般受众的审美需求。华东师范大学王峰在评价自己团队利用人工智能完成的首部百万字长篇小说《天命使徒》时打出了61分,并坦言这部作品采用“国内大语言模型+提示词工程+人工后期润色”的方式完成,人工智能占70%,人工占30%,仍处于“网络小说的下游水平”。由此可见,人工智能审美与人类审美都会直接作用于“人—机主体”的文艺生产,即使是未来将自身能力发挥到极致的人工智能会逐渐减少人类审美的直接介入,但完全由人工智能审美主导的文艺生产恐怕在类人主体真正“觉醒”之前还不会成为现实。
毫无疑问,人工智能文艺的出现为当代文艺增添了新的美学特质。从人类文艺创作到人工智能文艺生产,审美能力的迁移代表了作为工具的人工智能已经逐步掌握了模仿人类独有能力的有效方法,虽然此审美既非投射,也非移情,但人工智能文艺产品所带来的审美体验却不断表明人类主体正在经受前所未有的挑战,以至于将人类意识上传到人工智能体以获得永生的讨论也出现在公众议题中。当然,以ChatGPT为代表的新一代强人工智能并不只作为文艺生产机器而存在,其在更多方面展现出来的强大逻辑力和理解力足以令一切文艺传统都感到震惊与惶恐。我们总是在追问,“未来的机器将具有情感和精神体验的能力吗?”或许很快就能从审美角度回答这一问题。
(本文注释内容略)
原文责任编辑:范利伟