DH新青年|北京大学数字人文暑期夏令营回忆录
本期作者
丁卓源
中山大学中文系2022级古典文献学博士研究生,中国人民大学数字人文研究中心学生研究员
今年7月,我很幸运地收到了北京大学数字人文暑期工作坊的录取通知,获得了一次宝贵的学习机会。2022年北京大学数字人文暑期夏令营由北大数字人文研究中心(PKUDH)和人工智能研究院联合举办,立足于北京大学丰富的多学科资源,以促进跨学科交叉,特别是人工智能技术在人文领域的应用为目标,旨在培养既具备人文素养、又能运用计算方法,未来能在全球数字文化领域发挥领导力的新型人文学者。据夏令营招生老师介绍,从发布招生通知到报名结束,短短10天内就收到了近千份报名邮件,报名者来自全球十几个国家和地区的两百多所高等院校和研究机构,文理专业分布极其广泛。可见,此次夏令营的举办是广受大家欢迎的。我在中山大学的博导许云和教授也鼓励我参加,去开阔视野,紧跟学术前沿,正因如此,我也更坚定了参与本次夏令营的决心。唯一遗憾的是,由于疫情原因,入京存在风险,只好改为线上参与课程了。
第一次接触到数字人文的概念,是研究生刚入学时,在中华书局总编辑顾青老师主持的“古籍整理的现状与未来”的研修班上,老师提到,文献学科在日后的发展中,要跟随时代的潮流,大数据技术会很大程度的应用到文献的整理和检索当中。自此,我便对数字人文如何能够促进学术研究产生了强烈的好奇心,也一直关注着数字人文的发展。由于硕博专业都是古典文献学,在系统地学习古籍整理和传统文献学知识的同时,也接触到了一些新技术,如古籍自动标点、古籍OCR识别、专名书名标线等,将这些技术运用于古籍整理中,确实能够提高效率和质量。随着大数据技术的飞速发展,古籍数字化也成为了学界关注的焦点,不仅涉及版本学、目录学、校勘学的知识,还涵盖了当前最成熟的信息技术,包括地理信息系统、元数据标准、数据挖掘等。在今年3月,出于对古典文献学科前沿领域的研究兴趣,我加入了北京大学数字人文志愿者团队,在一系列的志愿者活动和讲座旁听中,我更加清晰地认识到,文献整理工作不应仅是知识的堆砌和重复阅读,更重要的是在学习和技术的使用中去感知“Digital Humanities”应该具备的素养和学识。
一、课程紧凑,干货满满
整个课程采取的是“导师主讲+项目实践”相结合模式,共32学时,主要内容分为数字人文的理论基础、R文本分析专题和项目实践指导三部分。课堂教学部分包括数字人文理论与技术基础。理论部分包括人文计算与数字人文、数字人文平台及数据库、数字人文中的定量分析方法、本体应用、文本分析与挖掘、社会网络分析与可视化分析。技术部分主要是R语言文本分析专题。即使是线上参与,工作坊的老师仍然要求每天准时签到、开摄像头进入会议,这也保证了课堂的效率和质量。
夏令营的授课讲师和研究导师由国内外名校的资深教授和新锐学者组成,像国外知名教授包弼德(Peter K.Bol),北京大学数字人文研究中心王军教授、苏祺教授,剑桥刘梦教授,社科院赵薇教授,复旦大学中国历史地理研究所路伟东教授,等等,阵容十分强大。开课前,中国历史研究学者、哈佛大学包弼德(Peter K.Bol)教授以中国历代人物传记资料库(CBDB)为例,向我们阐明了研究问题当中的数据的制作、清洗过程,使我们对数据处理有了一个基础的认知。北大数字人文研究中心的王军教授为我们明晰了数字人文研究的类型,以及在数智信息环境下,人文学科会出现哪些变化和发展,提出了一些新问题和新趋势。复旦大学路伟东教授向我们讲解了GIS的相关内容,并结合地图进行了详细的阐释。上边提到的这几位教授,我印象最为深刻。究其原因,一是仰慕已久,拜读过老师的著作和论文;二是课堂确实生动有趣,为我们营造了轻松愉快的学习氛围,并且在实际问题的解决上帮助到了我,使我受到很大的启发。在上课过程中,老师会专门留出时间解答我们的困惑,进行一对一的交流,而不再是学术讲座那种只输出的形式,非常关注学员的学习状态和感受。
二、各骋所长,高效协作
三、收获颇丰,受益良多
首先,本次夏令营中我最大的收获当然就是由暑期课衍生出新的研究课题和思路。非常感谢北大数字人文研究中心为我们提供的数据集,使项目的实践研究得以顺利进行。结合课题汇报时专家学者的建议,我也找到了自己感兴趣并得到老师认可的值得深入挖掘的地方,这是非常开心的一件事情。能够在文献学专业的基础上,结合计算机技术进行一些新的尝试,于我而言是新的挑战,更是学习。
其次,通过老师讲解和学习,解决了我的一些困惑。一是之前对数字人文的内涵和界定较模糊,通过老师的讲授,明晰了数字人文其实就是在数字环境下人文学科的发展。数智化信息环境下新材料和新工具会带来贯穿性的研究课题。二是对于学科交叉这个概念只存在于书本和印象中,夏令营里我和不同专业的同学进行配合,各自发挥优势,在实践中实现了学科交叉。三是此前不了解计算机领域的知识,在课题进展中,不断地请教同学和老师,积累了一些技术上的非常实用的学习途径。如“菜鸟教程”这个学习网站,包含很多技术语言教程,例如Python、C、JAVA等等。
Python语言的学习教程链接:
https://www.runoob.com/python3/python3-tutorial.html.
正则表达式的学习教程链接:
https://www.runoob.com/regexp/regexp-syntax.html.
最后,“操千曲而后晓声,观千剑而后识器”,虽然我只是刚刚打开了数字人文的大门,值得高兴的是,我对一些计算机技术的认识和操作总算不再是一无所知的状态。通过北大数字人文研究中心举办的此次夏令营,我真正和其它专业的同学进行了深入合作与交流,在实践中领会到数字人文的内涵和意义。通过亲身参与的实践,让我意识到,即使是人文方向的学习者,也不应固步自封,而是应该去主动了解技术方面的知识,学习基础的技术及算法。如此一来,不仅打开了思路和眼界,也能使自己的思想变得更具有包容性,对学术资料的搜集和整理也是大有裨益的。
自数字人文兴起以来,学界就一直存在这样的声音:在数字化浪潮里,人文学者到底扮演了什么角色?计算机专业和人文专业自然形成的这种相辅相成的关系,在传统学术史研究的基础上,人文学者该如何做,才能够发现真正有意义的研究方向,探索出新的研究路径,从而提升学术研究的质量?细细回想,王军教授在夏令营的课堂上其实已经回答了这个问题:人文学者除了应具备人文素养之外,还应当掌握一定的计算技能,以及世界性的眼光。
“DH新青年”是数字人文研究公众号面向所有高校在校学生开放的新栏目,发表与数字人文相关的理论探讨、项目设计、会议述评、读书心得、访谈等内容(包括但不限于)的学生习作。文章或其他形式的作品皆可,篇幅不限。投稿请发送至rucdh@ruc.edu.cn,邮件名格式:DH新青年+内容标题。欢迎广大心怀好奇、勇于探索的数字人文新青年在此试飞!
最新公告
-
“数实共生:预见数字人文未来图...
2023-06-12 -
中国人民大学数字人文研究院科研助理招聘启事
2023-05-29 -
中国人民大学数字人文研究院2023年度学生研...
2023-04-14 -
中国人民大学数字人文研究中心学生研究员招聘&...
2021-01-11