官方微信

学生活动报道

DH新青年·播客001|一位从音乐学穿越到工程科学的牛津博士生的故事

2023-07-03

“DH新青年无界谈”开播了!

这是由中国人民大学数字人文研究院学生研究员团队主持的一档青年播客节目,以数字人文青年研究者为主体,探讨和展示年轻一代眼中的数字人文新宇宙。有趣的人,有趣的经历,有趣的问题……以DH的名义,从这个夏天出发!



第001期

王普宇:一位从音乐学穿越到工程科学的牛津博士生的故事


本期嘉宾


       
640.jpeg            

王普宇 牛津大学电子研究中心博士研究生

Bassist,Linux user,

Open Source enthusiast,

Former Musicology student

个人网站:https://puyuwang.link/

本期主持


       
640 (1).jpeg            

陈兴怡 中央美术学院艺术管理专业毕业生

中国人民大学数字人文研究院

学生研究员

《艺术殿堂:最具影响力的 100 位画家》主编

个人网站: https://amalia6767.github.io/xingyi/


关键词:数字人文、音乐学、文科转工科、牛津PhD、计算机音乐创作、ChatGPT、人工智能

扫码收听小宇宙播客

640 (2).jpeg          


节目回顾

访谈时间:2023年5月13日


兴怡:

青年立场,无界眼光,一起探索数字人文新宇宙。哈喽,大家好,这里是中国人民大学数字人文研究院的 “DH 新青年无界谈”,一档以数字人文青年研究者为主体的轻学术交流播客,第一期嘉宾是正在牛津大学攻读博士学位的普宇!


普宇:

哈喽,大家好!我用最近比较火的 ChatGPT 帮我生成一个自我介绍,它说:Puyu Wang 是牛津大学牛津电子研究中心的 DPhil,DPhil 是牛津对 PhD 的一个名字。遗憾的是,截至目前我的知识库没有关于 Puyu Wang的特定研究领域和其他学术细节的更多详细信息。如果您需要更近期或具体的详细信息,最好直接联系牛津电子研究中心,或通过牛津大学官方网站提供的电子邮件地址联系Puyu Wang。他甚至会把我的邮箱也说出来!


兴怡:

它不会找错人吗?叫王普宇的人可能有很多。


普宇:

Bing 的介绍可能更准确:Puyu Wang 是牛津大学工程科学系的一名研究生。他是一名 Linuxer就是我用 Linux 操作系统),一名钢琴家和一名贝斯手其实我不是家,我只是弹钢琴和弹贝斯)。它又说:拥有上海师范大学音乐学和民族音乐学的硕士学位,和郑州师范大学的同样领域的学士学位。他会说英语、中文、克林贡语和法语。


它是把个人网站和我的 LinkedIn 等等全部混在一块生成出来的,但是他说错了一些东西,“普宇对一些话题感兴趣,比如网络安全、J.R.R. 托尔金和科学可视化”,这个我就不明白是怎么出来的了,科学可视化我没有做过,网络安全我也并没有做过具体的事情。但说到 J.R.R. 托尔金,我挺喜欢读指环王,可我并没有在网上说过我喜欢读指环王,所以这个很神奇,我只是告诉他请用中文介绍一下在牛津的王普宇。


兴怡:

除了 AI 介绍的之外,你还有什么补充的内容吗?


普宇:

我现在是在牛津大学的 Reuben college ,是一个新学院,它是一个很侧重交叉学科和人工智能的学院。我们学院有一半以上的人在做 AI,有的人是研究 AI 本身的,有的人是在研究 AI 的应用领域的。我原来是做知识图谱,现在在做语义网络、关联数据等领域。


我是怎么开始做数字人文,还跑到了牛津的

01


兴怡:

你大概是从什么时候开始接触数字人文的?之前本硕都是学的音乐,是怎么想到进入数字人文领域的呢?


普宇:

我当时确定要在国内读研,被录取了之后,那一个暑假比较空闲,我当时的导师知道我喜欢玩电脑,喜欢编程序,他说有一个合作伙伴,你看看他做的东西,我们到时候可以一起做一个项目,是做的音乐类的文化遗产,和数字人文非常相关。我当时一直以为数字人文是单独的专业,后来我发现数字人文是各个专业都可以做的。现在有些大学开始有数字人文的硕士、博士,但是当时我并不知道这些。


至于我为什么能够实现文科转工科,我觉得最重要的有两个点,第一点是我本科毕业以后就和牛津以及数字人文领域产生了一些联系。入学之前我就了解了很多相关资料,当时导师还给我介绍了他在牛津时的同事,所以在整个硕士期间我和牛津大学这个联系一直没有中断过。当我快要毕业的这一年,我说我要申请一下博士,其实是个蛮自然的事情。这个关系是提前 3-4 年去联系的,这也是我可以跨专业读书的关键。


另外一点是我所在的电子研究中心,本身就是做跨学科研究。在里边是有很多让人意想不到的项目的。像我这样的这种背景比较复杂的,反而并不特殊,我以为我会比较少见,但是发现没有。


兴怡:

你的硕士导师是你和牛津之间的一个桥梁吗?


普宇:

我硕士导师其实也是牛津访问学者,他在牛津的 Wolfson 学院做过一年。不过我并不知道,我去选他的时候,我还在做音乐文献编译,我并不知道他去过牛津,我只是在网上搜这个专业有哪一个大学开,大部分都是音乐学院。但我其实很想在综合性大学里找一些别的专业蹭课,就想去考这个综合性大学,最好是有各种理科专业的,然后我就去联系到了我的硕士导师。


其实现在我是纯工科,主要去做数字人文这个底层的技术。我本科的选课是比较受局限的,没有办法选到别的专业,只能选所有的公选课。等我到了硕士学校,我去找教务老师说我要去选这个数理学院的课,他说没有人这么做过呀。我去研究了这个学生手册,联系研究生院的这些老师一起试了一下。诶,真的可以!我觉得可以大胆尝试,想做什么你就去。当时的老师告诉我想听课你就可以直接过去,不用选,你直接想听哪个开门就进去了,选了以后,如果考试分数低了,还影响你的平均成绩呢。说了很多,确实也很中肯,但是我当时就想试试我要选会怎么样。


兴怡:

你那门课的成绩是不是也很好?


普宇:

我觉得是中等水平,大概 85 分,我不知道别人的分数是多少,是数理与统计专业的数据分析。那个老师很有想法,希望大家不要做得太数学化。有些同学做的很多数据分析的作业,是纯粹是按照统计学的手段来做的,他鼓励我们去尝试其他的方法。我们当时小组作业写论文,写了一个和音乐相关的机器学习类的论文。做的是音色转换,还有这个音乐生成,现在网上很常见了,那个时候听起来很有意思,比如说我放进去一个钢琴的声音,把它转成小提琴,或者放进去一个人声唱歌,把它转成笛子这样。


兴怡:

当时是如何选定你的博士生导师的呢?虽然你跟牛津那边已经有一些项目上的联系了,你又是怎么联系他找到合适的博士研究计划,并且跟他保持沟通的呢?


普宇:

我现在是有两个导师,其中一个导师就是一直和我联系的,另外一个是他推荐的,这位导师也是负责牛津数字人文项目。当时和我一直有联系的导师就把我的研究计划发给了这个项目负责人,我们就约了一个 informal 的 zoom meeting。但其实正式的面试是电子研究中心的主任和副主任,一些其他的老师,他们问了一些非常难的问题,我大概面了 2 个小时,最后都筋疲力尽。


兴怡:

你还记得最难的问题是什么吗?


普宇:

他们当时问我研究计划里提到想要解决一个十年都很难攻克的技术问题,具体如何解决。第一场老师问到这个问题的时候我说了很长时间,最后中途被打断了,但他基本上同意我的观点。另外一个老师又问了一个类似的问题,在我用同样的方式回答之后就开始反驳。那个时候我意识到学术界也许对这个问题没有定论,我又重新争取了一次理清思路重新阐述的机会。所以我也希望之后有面试的同学们,在面试之前,如果知道面试官是谁或者可能是谁的情况下,去阅读他们的论文,了解一下他们的主要思路,这样你们在面试的过程中可以在同一个话语体系里进行沟通。这是我当时觉得最难的一件事情,而且面试完觉得应该不太行了,和朋友们相约吃肯德基。过年的时候我有点惶恐不安,因为我感觉结果应该要出来了。为什么没有邮件?我忍不住给老师发消息,那些老师说不要担心,应该没事,但是这个应该没事就让我更担心了。但最后在我生日的前两三天,收到了这个 offer。


AI 可以取代那些需要音乐但不需要艺术的地方

02


兴怡:

目前做的这些项目当中遇到的最大或者说最难解决的一个问题是什么呢?以及你最后是如何解决的?


普宇:

我印象中一个比较大的难题是在硕士做项目阶段,是一个国内外合作的项目,我们依靠的基础是上游的平台,但上游平台迭代得太快,经常会一早起来很多东西都大变样了。项目的上游在国外,因为有时差,即使我们把问题反映到上游,他们也不能及时地回复,经常是我们现有的版本跟不上迭代的速度。当时有一个很大的 bug 是一直显示不出图片,而且项目马上就要上线,时间也很紧急,当时作息完全乱了,醒来就去做,困了就睡。我花了快两周的时间发现他们其实改了一个 api 的地址,图片就显示了。


而且那个时候我在学校,七八月份在学校没有回家,校园里空荡荡的,就我自己一个人在这个宿舍楼里,还是很孤独的。


兴怡:

作为曾经的音乐学子,你觉得 AI 会取代音乐家或者说作曲家吗?


普宇:

上周我们中心的博士生聚在一起刚好在聊这个问题,我们主要讨论的就是 AI 能不能作曲,我主要持反方观点,其他人是比较支持 AI 可以作曲的。


如果你对作曲的定义是指去写一首歌或者是创作一个曲子,一个纯随机的算法也可以做出来,音乐是显然是可以生成的,但是对于作曲家、艺术家来说,我创作的东西必须是我全新的一个想法。在贝多芬以前是没有人像贝多芬这样作曲的,在莫扎特以前也是没有人像莫扎特这样作曲,他们都是创建了一种新的范式,才能够成为伟大的作曲家。如果你在音乐学院,或者去了解一下现代作曲家,配乐之类的这些工作可能会被视作体力活。作为严肃音乐,它是需要一个很好的思想在里面,它才能够算作曲。


对于一个算法,它生成了一些莫扎特式、肖邦式的音乐,但它也不能算真正的作曲家,因为作曲家做的工作是发明新的作曲方法和使用他这种新的方法去创造出有人文关怀的作品,这个作品是空前的。比如有一个艺术作品是用罐装的粪便,你再做一次这个,就算不上艺术只能说是复制了。


还有一个音乐作品叫《 4 分 33 秒》,它谱子是没有任何音符的,正好 4 分 33 秒,当时学音乐史的时候,老师说这是大音希声、大象无形的哲学理念去创作的。但是如果现在我创作个 4 分 34 秒也是没有声音的作品,就不算作曲了,你只是模仿他的风格创作了一个类似的东西。现在的 AI 就是这样的,模仿别人的作品创作了一个类似的东西,但作曲家是不模仿别人,而是创作自己的东西。


但是 AI 可以取代什么?AI 可以取代那些需要音乐但不需要艺术的地方。比如说我有一个视频需要背景音乐,这个背景音乐可以是个艺术作品,也可以是平庸的音乐。还有游戏里边的音乐也可以生成,所以 AI 可以取代生成的音乐,可以取代一些音乐工作,但是取代不了这些人。


兴怡:

你怎么看待如果一位作曲家,他利用 AI ,创作了自己很个性化的或者是创新的作品呢?


普宇:

写了一个旋律,或者用这个 AI 生成了一个伴奏,这还算不算传统的作曲?这显然也是一种作曲。我们不能否定大量的作曲家或者说作曲工作者,做的其实是重复性的机械劳动, 利用 AI 取代重复简单机械劳动的话是很好的,是提高生产力的工具。以后能够熟练应用 AI 的作曲家会提高工作效率,可以做更多的事情。我们这个世纪会不会出来贝多芬、莫扎特,或者往小一点说舒伯特、舒曼这样的人?我觉得不会是 AI,应该会是人类,但是这些人类会很懂AI,毕竟你的艺术作品你要有自己的理念在里面,你要能够保护它。


我说保护并不是说你去和别人争斗,而是说别人在质疑你的作品的时候,你有能力去维护自己的理念,比如说马勒,当时他这些交响乐他被别人说不好的时候,他就站出来维护自己的作品,他就说过他的作品是面向 20 世纪的。马勒在 20 世纪确实饱受赞誉,现在的作品还是在大小乐团反复上演。


那么如果是 AI 它会吗?有个笑话就是有人问 ChatGPT  4 + 4 等于几?它说等于 8,然后那用户说不,我妻子说是 7,然后他就说:噢不好意思,你妻子说得对,它并没有那么坚定。一个艺术家首先得有人格,那么他的音乐具体的艺术创作技术技法、作曲技法都是可以学到的,艺术品格是 AI 很难学到的。一旦一个 AI 它有人格,有品格,那么可能作为强人工智能,或者你承认它是人类,也许会取代作曲家。


可以为DH项目做一个类似微博推特的平台

03


兴怡:

你的研究内容是关联数据,关联数据最近在国内也非常火。你为什么会对关联数据感兴趣?然后把它运用到了博物馆和音乐领域?


普宇:

首先关联数据就是 linked data,其实是互联网 world wide web 的发明人最早提出的。他有一个理念,要创建一个数据的网络,现在我们打开浏览器去看全都是页面,全都是文档,他觉得下一代的网络应该是数据之间的关联,所以他叫 web of data,所以这个 linked data 就是实现 web of data 的一个手段,他们用了 10 — 15 年的时间去解决了这种 linked data 的技术问题,你怎么把数据关联起来,然后你需要做出哪些标准。但是现在 linked data 还需要的是有哪些场景,是可以进入工业、落地实现的。最好的两个方向,我觉得一个是 health care,医疗健康类,就是生命科学上面,另一方面是这个 cultural heritage,就是文化遗产这个方向。


我本身是文科,所以我对人文方向的关联数据,做起来更顺手一点。至于音乐的话,在欧洲有一个叫 MEI 的项目,叫 Music Encoding Initiative ,他们想做的是数字化音乐,包括曲谱之类的全部数字化起来。它并不是简单的数字化扫描,而是把里面的内容,比如说谱子它有多少符号,它全用这种 mark up language 的形式放进代码里,再打到这个屏幕上做成看起来是谱子的样子,这就是 linked data 的一个应用。


兴怡:

你认为目前文化遗产类的数字人文项目存在什么问题吗?


普宇:

可能大多数文化遗产项目各自为政,做的数字化都比较分散,项目期结束了以后,也不那么在意网站的维护,还有一些现实问题,比如人员的流动。我觉得未来可以向基础设施方向去努力,就像 20 年前,很多人有自己的私人博客,但现在大家已经习惯使用微博、小红书的平台进行分享了。


如果这些平台都没有,那么肯定又会回到个人网站的黄金时代。但是因为现在有多元的平台,你想再分享东西内容都更方便、更好看,如果我们有一个数字人文平台类的东西,大家一起维护,或者联合起来做一个类似微博推特形式的东西出来,大家把内容放上去,由专门的团队联合起来一起维护,既能解决这个返点问题,又能解决人流动性的问题。


在平台上也会有数据隐私安全性的问题,但其实每个项目一定都会有能够公开的内容,在能公开的内容上进行交流和共享。再有就是目前我们可能需要一个联合起来聚沙成塔的行动方法,这可以在数字人文沉淀的过程中慢慢发展出来。


给DH初学者的建议

04

兴怡:

你对初学数字人文的同学有什么建议吗?


普宇:

我主要从三个层面来分别给建议吧,对于初学数字人文的本科生,如果本身是学习的人文学科,可以多去学习一些编程技术,多去尝试新鲜的事物,多学一学,看看自己喜欢什么样的方向,不要把自己思想局限,花时间去学习一些数学、数据结构这种理工类的基础课。


但如果你已经是做数字人文方向的硕士生,你可以想一下自己以后要不要读博士,开数字人文博士的学校是很少的,很多时候只能是在挂到某个系,你可以想一下自己以后做什么工作。如果你要转码的话,数字人文的经验,其实和实际编程还是有差异的,你还是去刷一刷题,提高自己的代码能力,但如果你要回到这个人文领域,也要想一想具体的工作类型。


那如果你是做这个方向的博士生,应该考虑毕业后的去向,虽然是一个很火的方向,但它能够对应的工业界和学术界的角色,其实也是很少的,你要看看自己博士毕业以后该怎么办,想想自己做的具体领域。当然我还是觉得博士生应该有自己的看法,可以不用听我的这些,多花时间放在写代码上,也需要多渠道了解该领域发生了什么事,利用好邮件列表订阅、学术推特,多开学术会议,多去了解这个领域的最新进展。


节目制作/谢雨辰

后期编辑/黄翘楚