首页 >> 跨学科 >> 科学与人文
大数据时代的认识论重塑
2020年11月27日 16:35 来源:《江海学刊》 作者:余乃忠 字号
2020年11月27日 16:35
来源:《江海学刊》 作者:余乃忠

内容摘要:

关键词:

作者简介:

  摘 要:历史轨迹往往以椭圆型出现,即使焦距再长,也会回归。但毕达哥拉斯没有预见到数字本体论会以数据主义形式复归。对于数据本质的认识成为大数据哲学的“最高意识”。“非实事”求是、实事求“或是”、事为“恒是”、“不可是”也是、“是”其不是等构成了大数据时代认识论的新演绎。生动的场景蕴藏的数据主义形而上学使数据道德论成为颓废的哲学。在国内外“千帆竞发”的局面下,“善出奇者,无穷如天地,不竭如江河”,方能成为数据发展的领跑者。

  关键词:大数据;事;知;是;认识论

  作者简介:余乃忠,哲学博士,长沙理工大学社会治理创新研究中心、马克思主义学院教授、博士生导师。

  基金:国家社科基金项目“习近平新时代中国特色社会主义思想的世界观与历史观研究”(项目号:19BZX005)的阶段性成果。

  对知的抽象意识推动了人对动物界的跨越。柏拉图于公元前387年在雅典创办学园(Academy)传授知识,培养政治、文化精英,内容包括哲学、物理、数学和天文学等,为希腊“共同体”提供政治咨询与精神支撑。其中“最善的学问”就是“理性与意见的关系”1,为西方认识论奠定了基本线索。中国古代有“天之高也,星辰之远也,苟求其故,千岁之日至,可坐而致也”(《孟子·离娄章句下》)。即是说,天再高、星再远,只要穷其根本原因,坐着也可以推算出一千年后的冬至日。这反映了中国古代对因果关系的确信以及认识论的路径。毛泽东提出“什么叫哲学?哲学就是认识论”2,点明认识论即“知”的规律处于人类思维与实践活动的核心。知其“是”是人类认识史共同的目标。然而,进入大数据时代,传统的“实事求是”认识范式发生了根本性翻转。

  “非实事”求是

  对事物的真实性的关注一直尾随西方文明的延续。在赫拉克利特看来,事物的真实构造趋向于隐藏自己。随即,巴门尼德发现,人们一直以为,凡不存在的,就不能思考。恰恰相反,事情却向着另一方向,凡能够被思考的东西,必定是一种虚构;思想抓不住实在,而只是抓住虚构。巴门尼德的虚构即是可见实在背后的“存在”。沿着巴门尼德,黑格尔确认,哲学所关注的对象是理念。“所以哲学研究的对象就是现实性,而前面所说的那些事物、社会状况、典章制度等等,只不过是现实性的浅显外在的方面而已。”3黑格尔的现实性就是隐藏在浅显事物背后的理念。

  西方文化对真实世界的“前—后”结构的理解,具有一种关于真实世界的完全确定性,使得后来科学以“前—后”结构的真实世界为依据并以此为追索逻辑。哲学以为人类在自身的理性与逻辑范畴中完全可以把握真理和实在性。科学与哲学的这种幼稚在于,把人类中心主义的特质当作把握事物的基本尺度,当作衡量“实在”和“非实在”的准绳。在人为自然立法的框架下,世界的真实性对于人类远没有打开。尼采预言:“具有重大意义的是,人们要废除真实的世界。真实的世界是关于我们所是的世界的一大怀疑者,是对我们所是的世界的价值贬低:它是迄今为止我们对于生命的最危险的谋杀。”4我们并不具有一个论证体系可以用来区分真实世界与虚假世界。

  对于真实世界的怀疑并非来自于虚拟技术的诞生,而是基于对现实道德假象的悖逆,但今天基于大数据与智能技术的虚拟世界印证了尼采对现实世界及其道德价值的抗辩和对科学前提的宣战。目前虚拟现实技术通过计算机影像、动态捕捉、零延迟的空间运动、音频和感知技术等共同形成一个完整的多媒体沉浸式体验。VR的超真实感,来自于将人类从“空间”“时间”的固化主客结构中解散,将主体融进客体,形成多重意向性的感性世界。VR通过构造非地球环境的人造自然,以超越人类的观点和与自然界相对立的视角,以人们无法获得的“语言”进行学习和阅读自然。基于虚拟实现的“非实事”求是是新建反思“座基”过程,本质上是人类反思方式的重大革命。

  虚拟认识论开辟了人类新的实践范式,深刻改变了人类对感性与自我意识的理解。虚拟现实技术可以巧妙地结合视觉和触觉来提升截肢患者使用假肢的体验。虚拟现实帮助截肢患者“感受”到来自假肢的触感,成功诱导他们的大脑自我意识到假肢“成为自己身体的一部分”5。这正如黑格尔在定义意识的真相时所说,“自我意识是从感性的和知觉的世界的存在反思而来的,并且,本质上是从他物的回归”6。自从医学诞生以来,一直是以修复体内被疾病破坏部分为治疗框架。然而,在人机结合、基因编辑等“增强现实”技术支持下,医学从修复身体逐步演变成增强身体、提高道德、丰富情感、异化身心,形成“非人”,实现“实事(人)”求是到“非实事(人)”求是的根本跨越。

  “非实事”求是对传统的“实事求是”的跨越体现在:(1)由于实践是“整个人类世界”和“整个现存世界”的基础,基于“非实事”的实践是对“整个人类世界”中“被遗漏”部分的再现。所以“非实事”求是是对“整个人类世界”规律形成完整把握不可或缺的部分。(2)“实事求是”是主客对立统一关系的认识模式,尽管实践唯物主义会以主体感性方面去理解客体,但终究是主客二分法,而“虚拟现实”中主客一体化使主体“失去自我”超越了传统认识论“从主体出发”走向客体的思路,第一次实现了“天人合一”从实践论向认识论的飞跃。(3)“非实事”并非完全和“实事”彻底决裂,而是与实事有密切关系,甚至是超“实事”。传统对于实事的认识是基于“实事”与“实事”之间的反思实现的,这种反思相对于超真实对“真实”的反思是低级的、不完全的。这样,即使从传统认识论来看,“非实事”求是也是人类对客观世界的“真相”的认识又向前迈了一大步。

  实事求“或是”

  在人类思想体系中,对必然性的认识既是“有价值的模式”,也是“自由”的象征。然而,到了18世纪,自称“温和怀疑主义”的休谟发现,思想所反映的并不是客观经验世界,而是印象,思想可以没有被反映物直接从“观念模拟印象”中产生。除了感觉之外,一切都是不可知的,因果必然性并不客观存在,仅仅是哲学家的“观念”。“哲学家在观察了几个同样的例证以后,就构成一个通则说,一切因果间的联系都一样是必然的,在有些例证下它所以似乎不确定,只是因为有相反的各种原因秘密反对着。”7黑格尔也认为客观必然性无法说其究竟是什么,“因为这种东西是绝对的、被直观为存在的、纯粹的概念自身”6。

  科学从逻辑实证主义发端,但很快被理性批判主义反驳,即经验证据只能为理论增加新的事实,却不能决定性地证实这种理论的科学性。作为唯理论的支持者,爱因斯坦认为,我们的一切思想和概念都是由感觉经验所引起的,它们只有在涉及这些感觉经验时才有意义。但是另一方面,它们又都是我们头脑自发活动的产物,所以它们绝不是这些感觉经验内容的逻辑推论,即从来没有一个真正有用的深刻的理论果真是靠单纯思辨去发现的。即是说,尽管人类具有从特殊到一般的抽象能力,但理论越向前发展,我们越发现,从经验事实中难以归纳出基本规律来。或者说,从特殊到一般的道路是直觉的,而从一般到特殊的道路才是因果逻辑性的。爱因斯坦注意到:“关于因果性问题也使我非常烦恼。光的量子吸收和发射究竟能以完全的因果性要求的意义去理解呢?还是一定要留下一点统计性的残余呢?我必须承认,在这里,我对自己的信仰缺乏勇气。但是,要放弃完全的因果性,我会是很难过的。”8不难看出,新的科学发现不断引发统计学的相关性对传统因果必然性方法论的巨大质疑。

  大数据不仅让我们不再期待因果精确性,也让我们无法实现因果精确性。同时,大数据时代也催发多元主义的爆发,“真理”成为一种拓扑学,它不属于一个点,而是属于某种区域或类型。人们对真理的追求不再是“有的放矢”而是“彗星式”放矢。《易传·系辞下》说:“天下何思何虑?天下同归而殊,一致而百虑。”大数据时代,天下同殊亦不同归,百虑而百致。“‘一个唯一的真理’这种想法已经彻底被改变了。现在不但出现了一种新的认识,即‘一个唯一的真理’的存在是不可能的,而且追求这个唯一的真理是对注意力的分散。要想获得大数据带来的好处,混乱应该是一种标准途径,而不应该是竭力避免的。”9在批判实证主义看来,科学与非科学的划界标准是经验证伪原则,即是说,科学只有证伪没有证实。证伪主义的实质是实事求“不是”,是绕过了实事求“是”。

  人类从实事求是的失落到实事求“不是”,再到今天实事求“或是”,越远离确定性的“是”愈接近真相,愈实事求是,即是在更高层次上认识“是”。求“或是”原理与范式为:(1)大数据的“是”实质上表达的是一种人与对象世界的全面的不确定关系。这种关系是一种以物联网为中介(本质是数字)的关系,是从传统的行为(一级中介系统)、语言符号(二级中介系统),向数字化(三级中介系统)的飞跃。以数字为基础的物联网中介系统,不同于传统的一、二级中介系统下物与物之间十分有限的线性联结性,具有不可还原的非线性联结性,带来巨大的可能性(或是)和不可解性。大数据关系系统是人类关系的新形态,是人的本质力量的新开启。(2)大数据分析形式上属于概率论范畴,但和传统的概率论与统计学有根本的区别。传统的概率论是对随机小数据的过程分析,属于样本分析,如物价指数、GDP和民意调查。而大数据统计是全部数据分析,不需要考虑样本分布,如天气预报、彩票。小数据的“或是”本质上是“不是”和“近似”,大数据的“或是”本质上是更精确的“是”,是对“不确定”更精准的确定。(3)大数据求“或是”,并不意味着传统的因果逻辑不复存在,而是以一种新型“因果关系”呈现,即一因多果、多因一果或多因多果。多因多果的“多”可能是有限的,也可能是无限的,甚至是不可数的。多因多果并非大数据时代才有,但大数据为多因多果提供了充分展示的中介,也为认识多因多果提供了条件和方法。(4)部分大数据的求“或是”,是对多主体、多数据源下数据的变形、错位等“本真性”不断减弱的一种认识论上的“主动性宽容”。比如,论文造假已成为全球科研界一大“毒瘤”,严重损害学术界科研信誉。究竟为什么学术界会充斥着虚假和欺骗,科研人员选择性汇报数据被认为是最主要原因。数据造假、新闻造假、论文造假等背后复杂的形成机制促成“求是”的不可能,所能求的只有“可能是”。

  事为“恒是”

  人类文明史是部落史,也是记忆史。文献学、考古学本质上是对历史“记忆”的再记忆,因此可以说,人类失去记忆,历史就失去接续。但人们并没有注意到,人类记忆史中,记忆是与遗忘并行的,记忆是在遗忘中实现的。或者说,没有遗忘就没有记忆。即是说,人类不能没有遗忘。历史是记忆史,也是遗忘史。

  在知识史来看,柏拉图把知识看作是理性特有的产物,是“回忆”,“人们必须勇敢地尝试着去发现他不知道的东西,亦即进行回忆,或者更准确地说,把它及时回想起来”10。即知识不是来自于传授,而是来自于提问,通过提问为自己恢复知识。在康德那里,需要把直观记忆进行杂多的纯粹综合统一,即统觉才能形成知识。从记忆史来看,古代人就发现书写毁掉了记忆,因为书写让人依赖书写板,并使人丧失追溯感性线索的能力。但书写术在康德那里更被重视。康德认为:“书写术总还是一种美妙的艺术,因为即便它不会被用来向别人传达自己的知识,它也毕竟能代理最广博、最忠实的记忆,弥补记忆的缺失。”11由此看到,在康德一切意图中,人的身体并不是至上的条件,因为人或有不忠实的记忆。

  从心理塑造来看,不同于动物,人类具有自我调节心理、塑造主体格和强化自我意识能力。人类在自我意识塑造的过程中,需要对自己的记忆进行重现和排列。这种重排过程实际上是一种“选择性记忆”过程,需要强化某种记忆和遗忘一些记忆。个体自我暗示的建立与意向性培育需要隔离、排斥、遗忘和屏蔽自我记忆中“痛点”“暗点”。同时,信息过载也会削弱人类思维的敏锐性。社会秩序的扩展也需要遗忘个体偶然性的“错点”。强化记忆与选择遗忘是一个相互支撑的作用过程,主体是根据其目的进行选择。佛教《修行方便禅经》注重大小乘禅学的结合,把修行的过程分为四个阶段:退、住、升、定,首先要退弃久缚,方能倡明缘起、驻足精虑、升进智慧到获得禅定。抑郁症和自闭症从记忆学上看就是失去了自主选择遗忘能力,其本质是把过去的特殊记忆放大并形成封闭圈,排斥外来信息,从而使记忆流滞阻,以至于发生记忆爆炸。

  从社会结构变迁来看,人类的进步是依赖结构和随着结构的变迁而发展的。想象在结构的塑造中起着极为重要的作用,就像治疗术首先从情感方面变得可以想象,以至于在肉体承受的痛苦变得可以被思想接受。这种想象在医者与患者之间的结构中必不可少,而在想象的过程中,患者需要遗忘曾经发生过和被报道过各类医疗事故的记忆的干扰,使得这种想象成为一种纯粹的精神。也就是说没有遗忘,就没有想象;没有想象,就没有结构;没有结构,也就没有秩序。

  从文化形态学来看,一个文化特征在很长一个时期内经历了传播、转借、嫁接、冲刷、变形,能够保持其内核和特质,例如中国文化经历了数次大规模的裂变、结合、重塑,仍保有“中国人的独特精神世界”,其秘密就在于文化基因具有神秘的“稳定性”。这种“稳定性”的本质就是记忆的保持和相对恒久性。而事实上并不是每一个文化基因都得到了“记忆”的保持。

  大数据时代,电子储存和即时链接取代了人类的记忆选择,没有取舍、没有遗忘、没有“偏见”。社会个体的“错点”会被全部“绝对客观化”和“真理化”,一切图景在“机械冲动”中展示。“事为‘恒是’”凸显了大数据时代认识论新旧框架转换的历史性冲突:(1)大数据本体论/传统认识论的矛盾。不同于传统的“四假象”,事为“恒是”产生了新的假象,可以被称为“数据假象”。大数据环境下,人们对大数据形成依赖。数据就是一切,数据就是本源,数据就是真理。数据假象构成了大数据时代新的本体论。大数据本体论与传统认识论产生剧烈的对抗,事为“恒是”就是数据本体的“顽固性”与传统认识论的不断扬弃的对立。(2)传统小数据个体与大数据整体的矛盾。大数据环境下,个体表现为被联结、被监督、被公共化,不同于传统小数据个体的孤立与自由。大数据的永恒记忆塑造了对个体的公共化的强制意识,它与小数据条件下个体的自省、意义整合、修正等自我意识产生“坚硬的矛盾”,引发大数据时代个体对数据共同体的排斥、逃避与对抗。化解新旧冲突的方法一类是形成与新本体论相适应的认识论,保持事为“恒是”;另一类是“艺术地遗忘”大数据,让事不再“恒是”,即回到尼采:“把你的重荷抛入深渊!人啊,遗忘吧,遗忘吧!遗忘的艺术是神性的!”4

  “不可是”也是

  人类诞生已经有700万年的历史,一直到100万年前人类才学会控制火。使用火的技能约到40万年前才普及。人类学会了人工取火,致使蛋白质的摄入量更多,促进了大脑的发育,从而扩大了活动范围、提高了活动能力。更重要的是7万年前语言的出现,带来了人类第一次认知革命。人类语言不同于动物语言只传递事实信息,人类还传递想象。“虚拟”的语言赋予了人类团结的力量和意义世界。至此,人类走到了食物链的顶端,才与动物彻底分开。到了1.5万年前,人类开始出现介于图画和文字之间的图画文字;到公元前4000年代末,又出现既有语义符号又有语音符号的文字,实现了人类第二次认知革命。人类之所以绕过一般动物“基因演化”的道路,走向了“文化演化”的快速道路,根本原因就是第二次认知革命的特殊性。语言不易留存,而文字可以跨越时间和空间。因为文字的中介,人类远远甩开了其他动物物种。第二次认知革命之后,知识迭代的加快预示着人类实践范式变革的加快。古希腊推崇“哲学王”与中国儒家“学如不及,犹恐失之”具有同样的理路,即知识是人类活动的组织和领导力量。马克思在《资本论》中通过引用贝尔纳德·曼德维尔在18世纪初说过的话,“知识会使我们产生更大和更多的愿望,而人的愿望越少,他的需要也就越容易满足”12,阐明了人类实践史根本上是知识与愿望之间的矛盾史。

  科学的出现标志着人类进入第三次认知革命。从此,“知”的领地不断扩大,“不知”的界域不断后退,也在不断扩大。恩格斯说:“随着自然规律知识的迅速增加,人对自然界起反作用的手段也增加了;如果人脑不随着手、不和手一起、不是部分地借助于手而相应地发展起来,那么单靠手是永远造不出蒸汽机来的。”13今天,宗教被科学击败表明科学知识在人类生存系统中处于中枢地位,求知目的性与科学精神成为理性的最高原则。科学知识的不足,使“预定的目的和达到的结果之间还总是存在着极大的出入。未能预见的作用占据优势,未能控制的力量比有计划运用的力量强大得多”13。随着人类认知速度的加快,自主创造历史的意识增强,未能预见的事就会越少,未能控制的力量对历史进程的影响就会越小,历史的结果和预定的目的就越加符合。基于世界的物质客观性基础上的可知性愈来愈成为哲学根基。

  检验人类发展程度的一个重要尺度就是自我建构意义的能力。人类对死亡和快乐的降临的不确定性是建构自己意义世界的前提。人类在死亡的确定性(必然性)与不确定性(死亡时间)的自由中构建了活动、创造、情感、遗存和不朽的意义世界。人类生存的意义是在现实与想象、同一和差异、联合与斗争等矛盾中展开的,矛盾的终结亦是意义的终结。大数据与人工智能依据基因对人的寿命进行预测已经成为可能,把传统不可知的“死亡时间”变为可知。“日前,谷歌新出炉的一项研究报告称,该公司已开发出一种新人工智能(AI)算法,可预测人的死亡时间,且准确率高达95%。最近,谷歌的这项研究发表在了《自然》杂志上。”14更为普遍的是,随着疾病知识的大众化,个体处于过度宣传、过度问诊、过度检测、过度治疗的环境与对疾病的恐惧之中,患病,特别是患不治之症的焦虑伴随人的一生。对疾病和健康预期的“过度知”和“过度是”,即“知”对“不知”的越位,破坏了人类生活的“自然状态”。人类的认识系统与实践系统具有同构性,实践史亦是认识史。对HIV、HPV的过度认知,使公众产生了对身体间接触与交往的恐惧。

  基于工业革命前夕的科学困境与哲学低谷,17世纪法国思想家帕斯卡尔认为:“上帝存在是不可思议的,上帝不存在也是不可思议的。”15人工智能时代让我们意识到,历史总是以另一种形式复归,不求知是不可思议的,一味求知同样也是不可思议的。至今为止,人类知识界最重要也是最难的两个知识点——宇宙的起源和结局、人类意识的形成与工作机制——一旦被攻克,人类将很快接近知识的边界。

  从“不可知”向可知、从“不可是”向可是迈进是人类认识世界的“纯粹理性”。康德对于“纯粹理性”的批判是因为要给人类实践自由留下地盘。而在大数据时代对于“纯粹理性”的批判就是要给人类留下数据的“真空地带”,给人类留下选择“不可思议”的自由。“认知越多未知越多”将实现历史大反转,未知世界越来越小。知识的终结也是认识论的终结,“不可思议”将会跌入“没有可思”的陷阱。

  “是”其不是

  进入大数据与人工智能时代,人类认识论获得了革命性变革,数据与智能成为新的形而上学。大数据时代的形而上学不再是对超验的追问,而是形式上的似“是”而非。大数据时代的形而上学呈现出认知逻辑与反认知逻辑的剧烈冲突。

  人的对象世界是人的尺度下的世界。量子力学创始人普朗克曾说过:“科学是内在的统一体,它被分解为单独的部分,不是由于事物的本质,而是由于人类认识能力的局限性。”16近代的科学革命使学者们认识到,人类认识的有限性和知识世界的无限性使得人类必须使用分化知识的还原法去把握对象世界。大数据科学与技术,作为计算机科学的分支逐步分化为数据挖掘、数据处理、算法设计、计算机视觉、自然语言处理、图像识别、语音识别等众多学科,知识点越来越细化与分离,边界也更为清晰。但大数据与人工智能更具有知识体系的密集性和统一性。若要真正把握大数据与人工智能的全部联系和本质,需要哲学、认知科学、数学、计算机科学、信息论、控制论、神经生理学、心理学等学科领域构成的知识矩阵。随着这些知识的综合和交叉,各知识分支也越来越受到其他领域知识的渗透,使得知识边界更为模糊。2018年夏季达沃斯论坛主席克劳斯·施瓦布(Klaus Schwab)说:“中国凭借着能够‘打破物理、电子和生物界限’的最新前沿技术,正在领跑这场即将到来的科技革命。”17

  作为一个文化概念,隐私意识是人类社会活动进化的产物。大数据时代是大规模产生数据的时代,也是大规模制造个人隐私的时代。随着个体数据的加大,隐私与个体安全的关联也更加密切,保护个人数据的意识也更加强烈。精准医疗的巨大突破很大程度上来自于医学大数据处理技术的运用。大量患者的医疗数据的公共化是医学革命的前提。然而,个体医患信息的隐私性与医学发展所需要的公共性形成巨大的冲突。因此,大数据时代是力求获取更多自由的时代,但也是个人自由意志终结的时代。

  颠覆式创新是创新的二次幂。判断是否属于颠覆性创新主要看其是否深刻改变技术领域全局属性、模式、规模、规则及对认知结构、舆论环境、传统价值是否具有深远影响。比如,作为颠覆性创新的智能技术是在算法、类脑芯片、脑机接口、光学技术、数字医学图像处理、材料科学与技术等大量知识积累基础上获得和推进的。大数据本质上是知识的大规模爆发。整个文化负载(感觉、知识、经验的总和)变得如此之大,人的神经和思维难以承受如此之重,以至于颠覆性创新近于精神错乱。同时,无论是自然科学家还是哲学社会科学家,在太多“正确”知识的框架中,失去了辨识力和挣脱力。而科学的颠覆性突破都是在看似“不正确”的点出现,需要一种野蛮或无知的力量。年轻学者的巨大创造力和颠覆性创新除了因为精力的充沛外,很多时候是对“正确知识”的无知而获得的。

  目前机器深度学习是依赖大数据的一种优化算法,小数据环境下的机器学习尚未突破,人类可以从小数据“举一反三”。以识别为核心的深度学习方法,即深度神经网络不是唯一的人工智能技术,人工智能已经开始投向一个以感知—推理—决策为模式的贝叶斯网络。它是以推理为核心的小数据类人学习框架。一项最新国际研究阐释了人类大脑整合多条记忆以形成全新见解的机制,这一成果有望为开发更优化的人工智能(AI)产品提供思路。人类对“情境记忆”能力优于人工智能,如果能理解其中的机制,有望将其运用于人工智能系统,提高后者快速处理新问题的能力18。同时,大数据时代是一个更加符号化的世界。人的主体意识被数字化定义和消散,个体自由被拆解并抛进一个符号化和智能化系统控制的管理世界之中。人类越来越受控于机器,同时,人类越来越失去对机器“主体意识”的控制。

  量子计算与人工智能作为人类认知世界的两枚锐器,使得人类真正“攻克”自然界不再遥远。量子物理被认为是我们所知道的最深入、最美丽的物理法则。在量子计算机的支持下,我们可以模仿大自然的量子法则,把量子和AI结合,以获得从未见过的美丽算法,使未来的人工智能技术变成一把万能钥匙,促进人类对外部世界和自身大脑的理解。在量子计算和人工智能结合的认知推动下,人类对知的世界占有越来越大,疾病和衰老越来越成为可知性命题。人类期望的寿命延长、生活便捷度和舒适度的提高、劳动强度和繁杂度的降低,使得人类的幸福指数和对美好生活的向往急速攀高。然而,随着“知”的范围和领域的扩大,“知”带来的痛苦和焦虑越来越像一个黑洞,吞噬着个体的灵魂。时刻担忧和恐惧疾病、个人隐私被公开以及对末日的预见等等,成为个体挥之不去的“不安”,一种本体论意义上的“悬置”,掏空着幸福世界。

  “极致的和谐来自方向相悖之物,万物皆从争斗出。”19进入大数据和人工智能时代,相悖之物更加众多和突出,争斗也以新的形式更加别致和危险。或许,越危险的世界预示着越和谐的世界诞生。

  大数据时代的中国优势与中国机遇

  火的自主利用是人类史上第一次黄金时代。大数据时代是人类历史的第二次黄金时代,数据就是生产力,对数据的占有意味着对发展机遇的把握。得数据者得天下。工业和贸易是数据产出最多的领域,中国不仅拥有14亿多人口,而且是世界第一大工业国和世界第一大贸易国,特别是中国是世界上唯一具有从高端到低端全产业链的国家,所以,中国已成为世界最大数据生产国,2020年中国数据总量全球占比将达20%。中国因此是世界上当今和未来最令人激动和赋值的国家。中国在科技竞争中的优势不仅源于海量数据,更重要的是数据的质量、数据公共性、数据生产关系和数据意识形态等方面的优势和机遇。

  大数据的核心价值并不在于数据的规模大,而在于数据的质量或数据的有效性。巨量数据仅仅是大数据价值的基础。中国的大数据质量和国外大数据比较有三大特点与优势:核心价值的导向性、数据库的权威性、云平台的高弹性。大数据质量的首要指标是数据的可靠性。尽管每一个国家都存在大量的虚假数据,特别是统计数据和生活数据,但不同国家的数据真实性程度并不相同,受到民族习性、社会制度、公共环境和利益导向等因素制约。生产、科研数据和市民社会的生活数据都受到国家意识形态的显性和隐性的管控。中国的核心价值已经介入到大数据的生产、储存与流通之中。中国拥有其他国家少有的全国高度集中的权威数据库。比如,由中国人民银行组织建设的全国统一的个人信用信息共享数据库,它依法采集、保存、整理个人的信用信息,为社会一切法定用途提供信用信息服务,具有强大的采集面与权威性。由清华大学开发和运营的中国学术期刊数据库,即中国知网,是世界上最大的中文论文数据库,具有极大的覆盖面、权威性和便捷性,为汉语论文检索提供一站式服务。数据平台已经从过去的“计算主机/个人电脑服务器/客户机”模式转向云平台。云平台为数据的采集、承载、查询、分析、清洗和流通提供强大的保障。尽管美国有强大的资本转化能力和云平台的服务器虚拟化、分布式计算、语言开发等核心技术,但中国云平台因为不同于西方孤岛化的片云运作,是群岛式的云团覆盖,因而具有更强的伸展性和弹性,从而提高了数据的利用率和被检验率。

  中国是一个数学古国,数字化基础的二进制来自于《易经》的智慧,而《易经》是中华文明的源头。中国数学重视计算技巧、主张简易,使得中国人对数字和数据具有特殊的感性,构成了中华民族精神性的一部分。这种独特性在大数据的利用中具有其他国家不具有的共享意愿。中国每天都在分享医疗记录、支付信息、网络登录等。中国民众在数据分享上的这种意愿,将助力期望拥有数据的各类机构在AI领域中的创新。中国的开放性,使得中国不同规模的公司具有同等分享数据金矿的机会。同时,“数字中国”战略支持中国企业和科学研究机构收集前所未有的大量数据,使得人口优势所蕴含的巨大数据能量被充分运用在健康、能源、环境治理、智慧城市等广泛领域。

  在生产和流通领域,大数据已经成为重要的非传统生产资料。尽管利用大数据是资本编导的必然选择,而且私有经济在一定历史时期和一定程度上创造了成功的大数据经济,但由于大数据的“共享”本质,与大数据最相适应的生产关系是“生产资料公有制”,而不是“生产资料私有制”。在中国,推动大数据生产和利用的主要贡献者无疑是国有企事业单位和社会公众,拥有大数据资源最丰富的工业、科研、医疗、金融、电信、交通等主要领域大都掌握在国家之中。大数据发展的整体环境塑造、资源整合、风险预估等都需要高度集中的国家意志。今天,中国以公有经济为主体,并支持和鼓励非公经济的制度优势将成为大数据生产的政治优势、生产关系优势和创新优势。

  作为长期处于世界历史发展层级顶端的中国在前三次科技革命中丧失了机遇,是世界历史的重大事件,也是近代中国落后的主要原因。因此,中国与西方国家对于大数据与人工智能的历史反思具有不同的历史参照与主体尺度。中国已经把大数据发展战略上升为国家战略和国家意识形态。中国大数据发展有五年、十年、五十年规划,在世界上是独一无二的。中国世所罕见的宏观调控能力与预判能力,在大数据领域得到充分体现。中国是世界上在高校中设立大数据与人工智能本科专业最多的国家,充分体现了“强化基础、人才为先”的强烈意识。俄罗斯国立研究大学研究报告显示,中国已成为2015~2017年期间科技论文发表数量最多的国家20。日本经济新闻与荷兰学术信息企业爱思唯尔(Elsevier)合作研制的最受关注的尖端技术的各研究主题排行榜表示,在前30项主题上,中国在23项主题上高居首位,美国居首位的主题只有7个21。中国成为人工智能超级大国的道路是不可阻挡的,因为中国人更能接受新技术22。这一切充分说明大数据与智能时代中国在科技基础领域的强大优势。

  在第四次科技革命中,中国进入世界第一方阵的前列是中国人的坚定意志,也是中华民族复兴的核心要素。大数据认识论是发现、理解、把握、运用大数据的基础。深刻把握大数据认识论的特征和中国在大数据领域的优势和机遇,是中国人对大数据时代的特殊使命。因此,大数据时代是中国时代,是中国引领人类第四次科技革命的时代,也是认识论重塑时代和中国马克思主义哲学走进世界哲学舞台中央的时代。

  注释

  1柏拉图:《理想国》,张竹明译,译林出版社2009年版,第267页。

  2《毛泽东文集》第8卷,人民出版社1999年版,第390页。

  3黑格尔:《小逻辑》,贺麟译,商务印书馆1980年版,第45页。

  4(13)尼采:《权力意志》,孙周兴译,商务印书馆2007年版,第1010、1331页。

  5《虚拟现实有望让截肢患者“感受”到假肢成“真”》,“新华社”2018年8月16日。

  6黑格尔:《精神现象学》(上),贺麟、王玖兴译,商务印书馆1979年版,第131、273页。

  7休谟:《人类理解研究》,关文运译,商务印书馆1957年版,第79页。

  8《爱因斯坦文集》第1卷,许良英等编译,商务印书馆2010年版,第191页。

  9维克托·迈尔-舍恩伯格、肯尼思·库克耶:《大数据时代》,盛杨燕等译,浙江人民出版社2013年版,第60页。

  10(11)《柏拉图全集》第1卷,王晓朝译,人民出版社2002年版,第517页。

  11(12)《康德全集》第7卷,李秋零主编,中国人民大学出版社2008年版,第178页。

  12(14)《马克思恩格斯文集》第5卷,人民出版社2009年版,第710页。

  13(15)(16)《马克思恩格斯选集》第4卷,人民出版社1995年版,第274、274页。

  14(17)《人工智能新算法:可预测人死亡时间准确率达95%》,“中国新闻网”2018年6月22日。

  15(18)帕斯卡尔:《思想录》,何兆武译,商务印书馆1985年版,第107页。

  16(19)转引自《数学界大地震?英国89岁数学家阿蒂亚公开黎曼猜想证明过程》,“观察者网”2018年9月24日。

  17(20)谢祖墀:《中国已经站在第四次工业革命最前沿》,“观察者网”2018年11月5日。

  18(21)《大脑整合记忆机制有望提升人工智能能力》,“新华社”2018年9月24日。

  19(22)《赫拉克利特残篇》,楚荷译,广西师范大学出版社2007年版,第18页。

  20(23)《中国已成世界科技论文发表数量最多的国家》,“观察者网”2018年10月19日。

  21(24)《最新调查:30项尖端领域论文,中国领跑23项,美国7项》,“观察者网”2019年1月3日。

  22(25)《荷兰报告:过去20年,中国人工智能论文数世界第一》,《环球时报》2018年12月10日。

 
作者简介

姓名:余乃忠 工作单位:

转载请注明来源:中国社会科学网 (责编:马云飞)
W020180116412817190956.jpg

回到频道首页
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们