官方微信

学术

书评书讯 |《大数据时代的史料与史学》《数字人文视域下的古籍开发与应用模式研究》评介

2023-02-23


“书评书讯”为本公众号新设栏目,介绍海内外的数字人文及相关领域书籍或专刊,以其内容价值为选入标准,不限出版时间。栏目由中国人民大学数字人文研究中心学生研究员团队主持,欢迎投稿:rucdh@ruc.edu.cn。


本期推荐人:

方华康(上海师范大学人文学院硕士研究生)

杨春萌(中国人民大学文学院博士研究生)

编辑:付明易(复旦大学中华古籍保护研究院博士研究生)




640.png

《史学月刊》编辑部编

人民出版社,2017年11月

新理念何以成为方法?

——《大数据时代的史料与史学》评介



640 (1).jpeg
640 (2).jpeg
640 (3).jpeg


2016年11月4—6日,南开大学历史文化学院和《史学月刊》编辑部围绕“大数据时代的史料和史学”,联合主办了“新史学”青年论坛。会后,会议成果结集为《大数据时代的史料与史学》一书。该书出版已久,但或许因为是论文结集而成,一直未引起足够重视。

近年来,随着“数字人文”理论与实践的兴起,“大数据历史”在历史学界也愈发受到关注。如肖恩·格雷厄姆(Shawn Graham)《探索历史大数据:历史学家的宏观视角》等海外相关专著被相继译介。华中师范大学人文社会科学高等研究院和历史文化学院共同主办《大数据与中国历史研究》集刊等。

然而,新理念的倡导固然重要,更重要的问题仍然是探索将新理念转化为研究实践的具体方法论。如果既有理论的深入阐释,又有一批典范性作品提供方法论启示,新的研究理念则更能为学界所接受。不仅“大数据史学”如此,对整个“数字人文”学科的发展而言同样如此。

这本文集共分为四编,分别为“大数据时代的发展趋势”“数据资料搜集利用的经验与建设”“大数据时代史学研究方法的借鉴与革新”“大数据时代史学研究的拓展与开新”。第一编以宏观理论思考为主,讨论了“互联网时代的历史学”“数据时代史学发展趋势”“大数据对史学研究的冲击”等问题。后面三编则多为结合具体课题的现状分析、构想以及实证研究。

该书的方法讨论结合内容十分广泛。至少涉及美国史、环境史、城市史、医疗史、慈善史、文学史、蒋介石研究等方面。在一本书当中,能够涵盖如此丰富的议题,殊为不易。这些文章也许并非典范之作,但读者毕竟能够通过阅读,对“大数据历史”的研究理念有具体生动的理解,大致窥其门径,开启思路。

史料是史学研究的基础。“大数据时代”对历史学的重要影响就体现在对史料的重新发掘和认识上。仅靠传统方法难以利用的许多资料在大数据方法处理下能够重新焕发生机,展现出更细腻、丰富的历史图景。

本书中有作者以日本现有历史资料数据库为例,构想建设大数据时代“全史料数据平台”。在其构想中,该数据平台“不仅具备搜集海量数据功能,还拥有处理和分析海量数据,进而寻找数据之间关联性的功能,发现新问题、产生新灵感”。数年过去,随着越来越多的学科共同推动“数字人文”学科发展,这类数据库正逐渐成为现实。

这本论文集在理论指引和实践指导方面都有涉及,是一本较好的“大数据史学”入门书。任何学科经过一段时间的发展,都会面临如何深化、转型的问题。新理念的倡导是实现突破的契机。但更重要的是,新的理念如何转化为具体的方法,让更多的传统学者能够积极融入进来,使之成为新的研究传统,本书即提供了较好的思考和研究范式。

(方华康)





《数字人文视域下的古籍开发与应用模式研究》评介


作者简介: 欧阳剑,师从著名语言学家潘悟云先生,博士论文题目为《大数据视域下的大规模古籍文献可视化分析与挖掘》,现任上海外国语大学图书馆研究馆员、硕士生导师,兼任中国索引学会数字人文专业委员会委员等职。 研究方向为数字人文、信息资源管理。

640 (1).png

欧阳剑 著

中国社会科学出版社,

2022年8月


《数字人文视域下的古籍开发与应用模式研究》一书是数字人文与中文古籍数字化领域的最新力作。数字人文理念的出现转变了古籍文献的开发和应用思路,数字人文视域下古籍文献的开发及应用方式从“读”向“分析”转变,颠覆了古籍文献的传统开发与应用模式,为古籍文献的深度开发与应用提供了新理念和新思路。


640.jpeg
640 (1).jpeg
640 (2).jpeg
640 (3).jpeg
640 (4).jpeg
640 (5).jpeg

本书作者欧阳剑从数字人文的一般研究方法入手,分析数字人文研究中数据的获取、标注、比较、取样、阐释与表现方式,从理论上探寻基于古籍文献的数字人文研究的一般研究范式、研究方法、应用模式,明确古籍文献的数字人文开发与应用构成要素与理论。通过研究古籍文献的数字人文数据建设理论、模式及方法,提出了古籍文献文本化、数据化及知识化建设模式,并从古籍阅读、计量分析、文本挖掘、知识服务等几种应用场景出发,构建古籍文献的数字人文研究应用模式。此外,从机构支持和人才、制度保障等角度进行分析,构建了符合古籍文献的数字人文开发与应用可持续性的保障体系。

本书侧重分析古籍文献的基础数据建设与应用模式,提出了古籍文献的数字人文基础平台开发及应用模式。其最突出的价值在于,作者在理论研究的基础上进行了应用场景的实证研究,按古籍文本化、数据化、知识化、工具及平台化的古籍文献数字人文开发与应用路径,从古籍文献的数字人文基础数据建设、典籍知识图谱、古籍文本分析与挖掘等多个方面进行了应用场景实证研究。首先,通过收集、整理从先秦至清末年间各种经典传世文献、出土文献等3.5万多种古籍文本,文献类目涵盖经、史、子、集,形成了一个比较综合、全面的古汉语文本库,为人文学科的研究提供了一个庞大的、可进行文本分析与挖掘的资料库。其次,通过数据收集,在250万种全球主要中国存世典籍目录的基础上构建了中国历代存世典籍知识图谱,包含近65万种古籍实体、22万位典籍责任者、149万多个古籍版本与1.3万个地名节点,形成了一个立体、多维、多用途的古籍知识关联网络,对全球目前存世的主要中国历代典籍书目进行了较为全面的描述。最后,实现了《中国古籍基础数据分析平台》(http://121.201.35.124:88/Introduction.html)的构建,并开发了适用于历史学、语言学等研究的相关古籍文本分析工具,完成了从理论构建到平台现实的应用。

关于古籍文献的数字人文开发与应用可持续性保障机制的研究也是本书的一大亮点。作者跳出项目和研究本身,提出拓宽古籍文献的数字人文开发与应用资金来源、完善古籍文献数字人文的关键技术、加快基础架构的建设、推进社会化建设途径、加强管理和支持、完善人才培养教育体系等具体举措,倡导构建符合古籍文献数字人文开发与应用可持续性保障体系。

本书综合运用图书馆情报学、语言学、文献学及信息科学等学科知识和技术以古籍文献的数字人文开发与应用开展跨学科研究,在研究方法上取得创新与突破,兼具学术价值与应用价值。

(杨春萌)


▻▻▻

撰稿 方华康 杨春萌

编辑 付明易

排版 刘为之