ChatGPT引发互联网治理新变局

2023-03-06 来源:中国社会科学网-中国社会科学报

  ChatGPT是结合了人类反馈强化学习与大数据预训练语言模型的自然语言处理工具。ChatGPT的问世,引发了国内外的广泛关注,同时也正在人工智能领域引发新一轮的科技竞赛。

  实现交互模式上的革新

  作为预训练语言模型、大模型“出圈”的代表,ChatGPT实现了自然语言处理领域的新突破,成功结合算法、算力和数据,将大规模的预训练与人工反馈相结合,实现了与用户的多轮对话、理解上下文、根据用户特征不断适应新的需求等多种先进特征,也使得ChatGPT能够更好地理解对话语境,输出文本也更符合语言逻辑与人类习惯、习俗。

  与以往的预训练语言模型相比,ChatGPT使用了45TB的文本数据,可以更好地捕捉人类语言的复杂性;使用了算力等同于数万张高性能GPU的计算资源,以获得更好的训练效果;使用了更通用的预训练方式,使其对不同场景不同任务具有更高的适应性;可以在不断接触新语料的过程中持续提高自己的性能,具有更强的自我学习能力。与传统搜索引擎仅能通过用户输入的关键词输出搜索结果相比,结合了人工智能的搜索引擎将通过以ChatGPT与用户对话为主、传统引擎提供资料来源与验证准确性为辅的方式,实现搜索引擎交互模式上的革新,这也将极大地提高交互模式下的用户搜索体验。

  ChatGPT的发布在互联网行业掀起了巨大热潮,国内外众多科技公司均看好ChatGPT及其竞品有望成为AI“杀手级”应用,并有可能颠覆互联网业务现有格局。在传媒领域,ChatGPT可以帮助新闻媒体工作者智能生成报道,将部分劳动性的采编工作自动化,更快、更准、更智能地生成内容,提升新闻的时效性;在影视领域,可以根据大众喜好为剧本创作提供新思路,以激发创作者的灵感并提高内容创作效率;在电商领域,可以打造虚拟主播、虚拟客服等提高客户的服务体验,减少订单退换货率,扩大品牌知名度;此外,在教育、金融、医疗等各领域ChatGPT均有望发挥积极作用,促进行业发展。ChatGPT的应用,不仅能提高各行业生产效率与生产质量,也将有可能替代文秘、会议记录等人类劳动力。

  互联网治理面临复杂化趋势

  在ChatGPT被热炒的氛围中,我们应当理性地看到,作为一种新型互联网服务的ChatGPT仍存在技术上的局限性。ChatGPT不具备实时查证的功能,其回答完全来自预先设置的数据库。ChatGPT缺少行业数据的训练,对于专业领域如法律、医疗行业的回答无法保证准确率。ChatGPT所提供的答案并不可靠,其并不擅长数学逻辑,也没有能力分辨一些信息的真假。这种技术上的局限性可能导致互联网治理的局面变得日益复杂。

  同时,ChatGPT带来的伦理及监管问题也令人忧虑。如何对类似于ChatGPT的AI服务进行合理监管,成为监管者需要面对的新课题。

  第一,最直接的风险是数据泄露问题。ChatGPT本质上是以海量数据为基础进行训练的大模型,这意味着其数据越多、时效性越强,它的功能就越好,能给予用户更优质的交互体验。但用于ChatGPT或其他类似应用的训练数据,有可能会涉及商业机密、国家机密及个人隐私信息。那么,获取相关敏感信息的途径是否合法合规?如果造成敏感信息泄露,所造成的影响及后果该由谁来承担?目前,美国的一些公司为防止数据泄露的情况出现,已经要求公司职员在使用ChatGPT过程中严禁泄露商业机密,并正在着手制定相关的措施和规范。

  第二,ChatGPT带来的学术伦理问题引起教育界及学术界的担忧。自ChatGPT发布以来,越来越多的学生利用ChatGPT完成学业和功课,甚至将其用于作弊。教育工作者担心类似ChatGPT的互联网服务将导致学术不端行为的泛滥,使得培养学生的批判思维及创新能力变得愈发困难,且无法正确有效评估学生的能力和知识水平,进而影响到构建公平的学术氛围和学术环境。

  第三,ChatGPT及类似的业务可能会输出危及社会公共安全的有害信息。在诱导式提问下,ChatGPT类的应用可能为违法甚至犯罪活动提供便利。这可能使违法犯罪的门槛大大降低。监管者需要对这类有害信息及其可能造成的严重危害给予足够的重视。

  第四,ChatGPT及类似的业务可能带来意识形态问题。ChatGPT的输出由其模型所决定,而模型又来自算法选择以及用于模型训练的庞大数据库,这也就使得模型开发者能够相对容易地将自己所偏好的价值观植入训练数据,或通过算法选择呈现某种价值观。假若模型开发者的价值观存在着历史曲解、文化偏见以及种族歧视,那么这种曲解、偏见与歧视将会随着模型与用户的交互对用户产生潜移默化的影响,甚至是误导。因此,在当今国际国内各种思潮交织碰撞、东西方意识形态博弈的背景下,ChatGPT这类互联网服务可能会受到国家行为体以及非国家行为体的操控,成为意识形态传播的工具。

  ChatGPT作为由海量数据训练得到的人工智能模型,代表着AI技术取得的突破和AI行业的最新成果,其强大的产业应用能力、广泛的场景适用性势必极大提升人类社会各行业、各场景的内容生产效率。与此同时,ChatGPT及与其类似的互联网服务所带来的相关伦理及监管问题使得互联网治理面临新的挑战,需要政府、产业界、学界以及每个互联网用户认真审视和应对。

  (作者单位:北京大学信息管理系、北京邮电大学计算机学院)

转载请注明来源:中国社会科学网(责编:王晏清)

扫码在手机上查看