从哲学—人文板块的角度论数字人文
摘要 实现数字人文是一个方法论问题,数字人文的实现可以赋予史料文本客观化、数字化的表达,概念的数字化处理首先应完成对语言层面最基本单位的数字化,当我们把文本、语言单位梳理清晰后,人文数字化才有意义,我们才能实现诠释现象,探索真理的目标。人类的知性非常复杂,人类自诞生始就既有个体性又有群体性,随着成长,人由一种非自觉存在转变为自觉的存在,人文学科正是要实现生命个体的完满, 进而推动生命群体的不断发展提升。数字化人文可以通过对古文本的利用, 校验中国早期哲学概念的地位与重要性,也能够帮助我们更好地把握中国历史辉煌成就,数字人文的重大意义就在于它可以化主观为客观,化直觉为理性,能够建立一个存在的文化的架构,让丰富璀璨的中国文化能够更好地被推广到世界各地。数字人文势必在促进人类和平建设、共同发展方面发挥巨大作用。
关键词 人文数字化; 语句单位; 哲学角度; 世界视野
分类号 G304;CO2
作者简介 成中英,美国夏威夷大学哲学系教授。
“数字化人文”是一个非常好的概念,如何实现人文科学通过数字化处理成为一个更为客观、甚至可以量化的研究对象,这是一个非常有意义的论题。这个论题是一个从属于方法论范畴的问题,而这个方法论问题涉及人们对数字化的认识。从早期个人电脑的数字处理,到今天的大数据、区块链技术,人文概念以及人类经验如要实现客观化,都必须要经过数字化处理,而大数据的实现则首先应以能够收集文本,赋予其数字化的表达或者外在形式为基础,尤其是要能够完成我称之为“概念的认定”的工作:哪些概念在一定的界定之下被认为是同类,哪些为非同类。因为概念本身是一种抽象的存在,所以如何把一个抽象的存在,经过定义或者统一性地处理使其成为一种意义的单位,这是一个非常重要的问题。
关于概念的数字化处理,应分为几个层次。首先是语言与文本,文本可以变成语言,语言之下又可分成两种,一是字汇,就是单独的字,在这个层面是有独立的概念与这些字汇对应存在,比如“道”就有其自身的概念与定义;另外一个单位则是命题,命题的作用是解决真与假的问题。什么是基本命题?逻辑学家威拉德·范·奥曼·蒯因(W.V.Quine)教授认为“意义”的单位是“语句”(sentence,相当于传统的命题);早期有很多哲学家认为语言的“意义”单位是“字”(word),但语言学家曾经把“字”解析为“音节”(phoneme),然后对它进行意义的诠释,因为在西方语言当中,一个字可能是多音节,所以一个字可以是由很多音节组合而成。而在中国的语境之下,中国的概念,中国的字,中国的音节, 一般是单一性的,从字到词,从单音节词到双音节词,然后再到多音节词。比如“简单”,“简”与“单”本身是两个相互不同的词,但是在“简单”这个词中,“简”强调“单”,“单”强调“简”,两者相辅相成。
所以,面对人文数字化,我们应该首先寻找基本单位——这个单位是字还是词,是双字的词或者是多字的词。词的英文当然可以叫做phrase,那么这个phrase或许可以作为一个单位,然后从phrase再到命题。由于命题是由主词与谓词组成,所以命题至少应有两个词或者说两个字。命题存在的主要意义或目标是针对一个特定的存在对象,说明其性质如何,通过对比说明其是“真”还是“假”。所以命题本身可以“真”可以“假”,但是如果一个命题没有意义,那么它则失去存在的理由,其表述只能算是一串字符排列。就像乔姆斯基所说的:“Colorless green ideas sleep furiously”,这只是一串组合在一起的虽然符合语法结构但毫无意义的符号集合而已,我们无法理解它想要表达什么样的内容。
但是人文学科目前最主要的任务似乎应是完成对过去文本的数字化处理,这种数字化处理要聚焦于语言本身,聚焦于以文本为载体的语言。当然,对于中文而言,文字和语言是分开的,那么这时的数字化就应该分开处理。我们需注意中国传统文化的重点是在文字方面,我们既有比较语言化的文字,也有比较文字化的语言,所以当我们将其作为一个对象,界定其意义之后,可以把它作为一个观点单位,进而探寻它的意义,这个意义就是概念。换句话说,这个字的概念亦即其意义,而这个概念可以有其在心理上的所谓image的一种自己的意象,或者说它有其自身的一种外在的形象。中国古人“六说”也涉及这两者之间的问题。对于事实存在,一个是它的指谓——reference,一个是它的meaning,它的meaning往往有另外一个延伸,即significance,这需人们通过一个文本的上下文来把握。
于是,当我们把文本、语言的单位梳理清楚之后,人文数字化才有意义。只有这样,我们才可以实现对文本比较完整全面的把握,进而达到一种诠释的目标,理解的目标。研究者始终不应忘记,在人文数字化、数字人文的前方还是人文学领域的问题,面对的主要还是一个整体的概念体系,它可以作为我们行为的一种基础,也可以作为我们理解世界的基础。它是一个体系,一个system,或者说我们把它假设是一个体系,它有很多文本,作为体系它是不完整的,我们为它补充一些逻辑意义上的前提,然后更好地利用这些概念解释现象,说明现象,探寻真实与真理。
人文领域中我比较关注的是中国哲学,尤其是中国哲学如何开始,它是人文领域中的一个重要问题。当然,哲学、历史、文学等等这些人文学科都非常重要,因为这些人文学科的目的是揭示我们作为人到底身处怎样的环境,我们究竟是在一种什么样的真实境遇之下生活,我们存在的基础是什么,我们面对的世界是什么,我们要怎样行为,我们应如何创造新的世界……而所有这些问题可以概括为:世界是什么,我是什么,我们做了什么。这些都是和历史密切相关的问题,但是这里首先涉及的是语言、文字,文字背后的文本世界,而人文数字化则需要把这些文本变成一套帮助我们理解、把握世界的工具。
关于这点,很早以前,我和伽达默尔在他德国的家中曾有讨论,他谈哲学的诠释学,我谈本体的诠释学, 我强调哲学诠释学只是英语体系背景下的理论,因为他是海德格尔的学生,所以他不太能够理解和接受形而上学。关于哲学基础问题,我坚持依然需要一个形而上学的基础,我是一个实在主义者。存在一定具有能够找到的真实性,存在与非存在分离,存在具有客观性,但是对存在的主观认识也是一种存在,我们也可以把主观看作客观的主观,于是,它也属于存在世界的一部分,所以这个问题比较复杂,但是人文学科至少要面对并探寻这些问题的答案:人在世界的位置如何,这是一个怎样的世界,我们了解的世界是怎样的。上述问题是知识论的、诠释学的问题。世界是什么?——这是一个本体论、形而上学的问题。我们怎么去理解它?——这又是一个知识论的问题。现在,我们要把知识论继续延伸,让知识论的内容更为丰富,我们要跳出19世纪知识论的所谓现象学的或者是现象主义的感觉主义,我们要建立一个更为开阔的对人的世界的理解。人是具有生物学意义的生命,同时也具有心灵、情感,也有理性,还有直觉的感悟,这些内容都存在于语言的系统之中,所以,我们应该通过理解、把握语言来认识这个世界,认识我们自己,这里存在一套本体诠释学。
最近我也曾谈过这个问题,一个本体就是一个自觉的自我,主观来说自觉的自我,它有很多内在的资源,它具有一种“人性”,它是从生命里面开拓出来的,生命包含了主观客观种种潜在的存在,都从人性或者人类自性变成一种自觉的存在。生命在这个意义上至关重要。也许有人说动物也有某种程度的自觉,但是我觉得这个是一个哲学的问题,动物到底有多少自觉,能否完成对自己的一种概念的生成,这些都需要继续探究。
所以,我有一套本体自我的存在论,我们要通过经验、观察来整合我们的文本自觉,在人完成自觉之人的转变之后,他才拥有一种心灵开拓的思维活动,然后他才能够进行语言表达,进行人与人之间的生命的交往。自诞生之日起,人本身既有个体性,又有群体性;人的个体性帮助人更好地成为群体的一部分,人的群体性帮助人更好地实现其作为个体的价值意义。在这个过程当中,人是从一种非自觉存在转变为自觉性存在,而具体何时变为自觉,这里应该是一种过程性地转变。3岁、6岁或者个别1岁的小孩,他也许知道自己是独立的个人,也许不知道,毕竟我们无法清楚回忆自己在这么大时到底在想什么、是怎样思考与理解自己。我们知道孩子有自己的生命活动,有大脑的活动,根据皮亚杰等儿童心理学家的研究,我们知道儿童的知觉是慢慢发展起来的,但是何时真正拥有自觉,这依然是个问题,自觉的生成需要人拥有更多的关于外在世界的知识经验。对于生活在现代的人来说,人的知觉领域相当复杂,里面既包括各种理性的思考活动,如数学的活动——数学思维、逻辑思维,也包括情感活动,因为人作为主体也有情感的自觉。所以,中国传统谈论人时,讲性、情,心,然后到意志,涉及身体部分的有欲性。生理意义上的身体只是整个人的一部分,人当然也不能脱离身体,身体是一种机制,让人更好地往上发展,这也正实现了人作为存在的一个意义, 它可以往上发展到很高的程度。人的心灵活动是没有界限的,它具有不断延展开拓的潜力与空间,当然也有人自己把自己限制起来。假如我们从哲学发展来看,从历史来看,人可以无限去发挥自己。人的生理身体、生理生命是有限的,是一种内在的限制,但人的心灵的活动可以是无限的。
人类活动自然包括情感的活动,它同样代表了一种人的新的关于自我的自觉认知。从心灵里面的情感、情绪到意欲、意向,再到意志,作为一种希望、要求,意是一种志向,一种追求性的力量。从知识理性到价值理性,再到行为理性,人类最后要落实到实践,实践最主要的目标是要完成或实现生命个体的一种作用,即能帮助群体更好地发展。所以,人文学科非常重要,它是一个过程,让人能够成为更好的人,更真实的人,使个体的人能够促进群体自觉地实现一种文化的发展、文明的创造。这就是我是看到的人文基本结构,也是人的生命的价值结构。
那么,现在如何通过人文数字化将上述内容更加客观化地表现出来,比如在文史哲方面,我们如何写出一部更客观的历史。主观的历史我们也可以写,使用直觉的思维按照逻辑来描述我们的历史,回忆记忆,或者用哲学来表达抽象的理念思想,但是人文学科最常见的问题正是主观表达很容易造成大家意见纷纭。我们希望能够找到一个大家共同认可的发展目标、共同认可的一种见解,这是一个很好的理想,是一个通过数字化人文可以在某种程度上实现的理想,但是不可能达到最完美的程度,因为人是一种创造性的存在,他不断有新的思想生成,有新的情况发生,数字人文只是重建客观事实、历史事实的工具,它使用的基本材料还是人类之前创造的人文成果、人类文明。
在中国哲学里面有一个问题我一直很关心:中国哲学是什么时候开始的,中国哲学有哪些基本概念?在20世纪80年代,我曾在北京大学提到中国哲学的基本范畴,我总结为八个字。先秦前后时期的基本范畴是“天”“道”“性”“命”,之所以这么说,是因为就这段时期的文献文本来看,这四个概念是所有概念中最重要的概念。没有“天”,很多思想理论就失去了最根本基础,有了“天”与“道”,然后才好讲人的“性”“命”。不管是道家,儒家,还是其他诸子百家,大家都在谈这几个问题。包括后来的《易经》,从经文到《易传》,《易传》是孔子后期完成的一个文本,在成文时间方面它可能比较晚,但是其内容发生的时间很早,可以与《尚书》《诗经》打通;包括其他很多地下出土资料,如马王堆及郭店竹简,等等。通过对这些资料的梳理考查分析,我提出“天”“道”“性”“命”是先秦时期中国哲学的基本概念。对于宋明阶段,我又提出四个字,即“理”“气”“心”“性”。经过漫长的汉代、唐代,中国哲学在宋代实现了新的发展,有了上述四个新的重要基本概念,日益醒目突出。所谓突出,指这四个概念并不是说过去没有,先秦哲学里也有“理”“心”,但到了宋明之后这些概念日益被哲学家所重视,重要性日益增加。更多的文本,更多的哲学家,更多优秀的哲学家,更有影响的哲学家,他们用这几个概念发挥了很大的效能,比如说王阳明、朱熹。当然,这只是我在哲学方面的一种假说,一种尝试性的建构,但是我们也完全可以通过数字人文、人文数字化,整理排查那些资料文本,校验“天”“道”“性”“命”在早期中国哲学文本里面是不是最为突出重要的概念范畴。
所以,只要有文本,我们就可以通过数字处理来验证直觉所感受到的概念的含义或所指,可以更好地促成哲学思维的觉醒,用一种客观性而非仅仅主观性的直觉面对相关问题,辅以客观的文字保证。也正是在这个意义上,数字人文有这样一个作用,它能够帮助我们在哲学、历史、文学等众多人文学科方面的浩瀚文本找到或建立一个客观的架构,帮助我们更好地把握中国过去的辉煌成就,更好地进行新的、具体的文化建设,同时,更好地实现传承与传播。人文数字化可以帮助我们保存历史、认识历史,还可以帮助我们进行再创造,让人类继续前行的每一步既具有主观性,也具有客观性,既有直觉性,也有结构性。
数字人文能够帮助我们建立一个更加完整、更有意义的,甚至具有客观性的人文学的基础,我们可以不再空谈,而且能够到把人的存在的一些内涵转变成一种更客观的存在方式。所以,数字人文的重大意义就在于,它可以化主观为客观,化直觉为理性,能够建立一个存在的文化的架构,让丰富璀璨的中国文化能够更好地被推广到世界各地。事实上,任何文明传统,都可以、也都应该通过数字化文字处理为大家所共享,我们应该深信中国文化的辉煌内涵,必定能够为更多世界人民所熟悉和理解,人文数字化对促进人类的和平建设、共同发展、造福人类生命的共同体有极其重要的作用。所以,我觉得今天大家在这里讨论的人文数字化这个课题,真的非常重要。
校对、排版:陈兴怡