官方微信

学术期刊

中国传统音乐知识库的“元数据本体”构建研究

2023-05-18

中国传统音乐知识库的“元数据本体”构建研究


转载请注明“刊载于《数字人文研究》2022年第4期”;参考文献格式:曹军军,李俊萱,王雨荷. 中国传统音乐知识库的“元数据本体”构建研究[J]. 数字人文研究, 2022, 2(4): 22-37.全文PDF已在知网、万方及编辑部网站(http://dhr.ruc.edu.cn)上发表,此处注释及参考文献从略。


摘要:中国传统音乐资源的知识库建设与国家推广民族音乐、繁荣音乐产业等文化战略相契合,也符合音乐界图书馆资源共建的诉求。“元数据本体”的构建是其中的重点,尤其是针对中国传统音乐特征与传统音乐学的知识结构做出设计。研究以中国音乐学院图书馆“中华传统音乐文化资源库”的实践为基础,尤其结合其“影像志”特点,进行基础本体方案设计;再结合传统音乐文化关联多领域的特点,构建相应类、关系和语义约束方式,如涉及乐种、乐器、民族主题词表和对曲目、乐人、地域、文字文献等领域的语义关联。该方案将有利于传统音乐分类研究和垂直领域的知识检索,且具有音乐地理学、音乐人类学社群分析等方向上的应用前景。


关键词:中国传统音乐;元数据;本体;东方乐器;乐种;语义网;知识库。


作者简介:曹军军(通讯作者),中国音乐学院在站博士后,中国音乐研究基地研究员,中国音乐学院图书馆数字人文工作坊负责人。Email:529360500@qq.com;李俊萱,中国音乐学院2021级音乐学系硕士,中国音乐学院图书馆数字人文工作坊成员;王雨荷,中国音乐学院音乐学系2021级本科生,中国音乐学院图书馆数字人文工作坊成员。




0 引言

INTRODUCTION

近年,随着传承与弘扬中华优秀传统音乐文化、大力促进全国(北京)音乐产业繁荣发展等一系列意见出台或政策推行,音乐界产学融合、文理融合的声音不断响起,以及具体到中宣部“中华民族音乐传承出版工程”等项目实施,各式音乐数据库的建设研发成了热点问题,这也正切合目前音乐学界对音乐数字人文的理解和关注点——以文献档案数字化、数据化工作为主。但从数字人文主流来看,作为基础设施的数据库,发展为服务更为有效的知识库是趋势之一,语义网(Semantic Web)、知识图谱等技术或研究范式成为“抓手”。这之中,本体(ontology)设计是重要的基础工作,也可成为音乐数字人文研究问题意识的起点。

首先交代本文论题关键之“知识库”和“元数据本体”为何。可将知识库理解为高级的数据库,其关键在于本体(ontology)的嵌入,从而有利于语义化检索,即提升信息检索的精准度或为智能检索提供一种实现方式。元数据和本体虽是两个不同的概念,但随着语义网的发展,元数据愈发表现出本体化发展趋势。就此,欧石燕提出:“元数据,采用规范化的本体描述语言(如RDFS、OWL)对元数据规范进行形式化描述,譬如……DC和DCTERMS元数据规范均采用……RDFS进行描述……笔者提出基于元数据规范构建元数据本体的思想……”。本文主要针对本体展开研究,而鉴于本体依托于元数据,是对元数据的语义化组织,不妨理解成元数据发展的高级阶段,故用“元数据本体”作为研究领域的泛指。而且,“本体”一词在艺术界一般用作“艺术作品本身”之意,为避免误读,笔者也支持“元数据本体”这种表述,以突出其特殊意涵。

鉴于元数据本体设计须领域专家的深度参与,不妨以音乐高校图书馆发起建设垂直领域的知识库为背景,以元数据本体构建的思路为新意,由此,此文或可作为音乐数字人文研究范式的一种探索践行。为某一种音乐形态如传统音乐建设知识库,其元数据本体须不止于简单套用FRBR、BIBFRAME(命名空间前缀:bf)等模型——它们的基本特征是内容与载体的分离,利于通用(非垂直)领域的图书馆管理。而针对本研究依托的特藏“中国传统音乐文化资源库”,则不仅要借鉴这些图书馆界通用的元数据本体,还有必要于之上量体裁衣,并能够充分反映传统音乐文化与学科的特点。




1 研究背景

SUMMARY

就笼统的音乐知识库发展现状而言,国内方面,音乐馆藏机构大部分所建还只是基于关键词检索的音乐资源库、数据库,如中国艺术研究院音乐研究所的“中国传统音乐录音档案”数字平台,多数用户的关注点侧重于一件件可读的音乐资源及其版权。真正意义的知识库开发案例较少,已知的有上海音乐学院中国音乐史高峰团队开发的“明代古谱与古文化知识库”,上海图书馆的“馆藏唱片知识库”和知识图谱项目等,二者都植入了本体设计。前者的特点是,出于音乐的文学性,将明代乐谱和同时期的文学领域做关联,后者的本体设计与下文所述国外所采用的较为相似。

国外的音乐知识库缺乏对东方、中国传统音乐资源集中的、充分的收录,从其元数据方案、本体词表等来看,西方音乐文化特征明显,存在与中国传统音乐知识组织方式“水土不服”的问题。如知名的MusicBrainz知识库(被称为The Open Music Encyclopedia,命名空间前缀:mmd),原基于关系型数据库关系模型的元数据方案。随后的LinkedBrainz,旨在为MusicBrainz发布关联数据(linked data),但也没有公布本体,其可见类设有音乐人、事件、风格、乐器、地点、作品、录音制品、出版物等,还就风格、乐器等类编制了名目受控词汇表。它的乐器词表也包含了词条间的等级关系,但基本限于西洋乐器类型。LinkedBrainz主要复用了较知名的The Music Ontology(命名空间前缀:mo)本体。该本体参考了FRBR模型,其另一个鲜明特点是,直接导入了Time本体,反映出从时间艺术及事件的角度考虑音乐本体的倾向,这和艺术品描述类目CDWA等元数据方案有根本的区别,后者更适合造型艺术、视觉艺术。The Music Ontology和MusicBrainz有异曲同工之处,均表现出以描述音乐活动、音像产业、音乐出版为主的特征。具体而言,The Music Ontology尤其适配“音乐活动(音乐生产)的产业链”逻辑,如图1所示。

微信图片_20230727195013.png

图1 The Music Ontology对音乐生产流程的描述。

来源:http://musicontology.com/docs/getting-started.html#example-workflow

这个产业链,一方面,具有典型的唱片行业(或称录制音乐行业,Recording Music Industry)特征;另一方面,也反映了音乐艺术鲜明的“二次创作”的前后衔接关系,即一次创作为作曲(如以乐谱符号记录乐思),二次创作为表演(呈现为时空中的音乐表演事件)。其明显与西方古典音乐、现当代学院派音乐(这二者可统称严肃音乐)及相当一部分流行音乐的创作、生产模式有更紧密的联系,如突出音乐作品从乐谱到出版物的物化存在方式,突出归属与版权(包括邻接权)的清晰等,并且将作曲(Composition)和表演(Performance)看作前后发生的独立事件。这一模式与中国传统音乐的存在方式、音乐活动的特点和社会功能——如原生态音乐创作的集体性、口头性、即兴性、变异性,乃至曲调的“一曲多用”——是有所区别的,中国传统音乐的创作和表演也并非截然分开。

再放眼我国音乐产业界。以腾讯音乐、网易云音乐为代表的互联网音乐平台,积极促成以“音乐社交”为特色的“泛娱乐”产业生态,就此开发音乐行业知识图谱,但其基本类和关系围绕流行歌曲、艺人、演唱、专辑、歌单等生成,并没有专门为某种音乐类型进行量身打造。而且,传统音乐传播的娱乐性、经济效益毕竟有限,其数据库的发展若仅依赖商业驱动,前途并不乐观。

那么,我国学界对此是否可有所担当?能否以音乐数字人文作为新的产学研目标,开发适合传统音乐的知识库产品与服务?音乐学者凌嘉穗就在《数字人文时代的中国传统音乐数据库》中综述了大量音乐图书馆特藏数据库项目,并在比较中提出“数智库”的畅想,其所指实际上就是植入本体的知识库开发、语义检索的理念。对于如何在音乐知识库中挖掘知识,笔者也撰文提到,可将社会网络分析方法应用于音乐社交网络、引文网络等研究中,尤其是可结合人类学社群观念进行艺术评价和分类研究。这些路径均适用于对基于语义网技术的知识库做数据分析以获得学科情报。

因此,与其他领域的数字人文发展路径类似,音乐数字人文可以以图书馆音乐知识库的建设为基础,于此之上,我国的传统音乐学、音乐产业研究、音乐信息科技等都有可能与其范畴交叉。但音乐信息学目前更专注于音乐人工智能与创作、表演的融合,相较而言,对音乐图书馆资源开发极为重要的音乐元数据和信息情报管理等长期以来未得到重视。难得的较有代表性的学术事件如,文化部民族民间文艺发展中心孙豪研究员的著作《中国传统音乐资源元数据标准研究》于2022年出版(人民音乐出版社),该著在较完备地对国内外已有音乐元数据相关标准综述整合的基础上,提出我国民族音乐元数据的一系列元素集。以及同年底,中国传统音乐学会年会上,在学会会长上海音乐学院萧梅教授的倡导下,出现了一次音乐数字人文与文献研究的征文与研讨热潮,但整体看来,音乐数字人文论题的话语方式目前仍不够清晰,与主流数字人文界及其研究范式还是有一定差距,对相关技术理念,典型如本文所聚焦的“本体”或重视不足,或形成误读——主要用以指称在民族音乐学、音乐人类学视野下相对于音乐外围的文化而言的音乐本身的具体形态。

基于以上背景,此处首先对本文的核心概念“元数据本体”进一步做出澄清与概念界定。数字人文领域的本体(ontology)是来自于数据科学文本分析、知识图谱领域和图书馆情报学中的概念,它与元数据虽在概念层面上有所不同,但实践中有密切联系。本体的一种定义是:“共享概念模型的明确的形式化规范说明。”笔者再做补充解释:它是基于某知识领域(如传统音乐研究)的知识结构和知识组织方式,将其拆解成作为类或对象的节点和作为其间语义关系的属性即连边,重要的语义关系如父类与子类的嵌套关系(如乐种之间的分类层级)。本体是语义网的基础模型,也是一种描述语言,如采用rdfs、owl格式,还规定了相应的语义约束、公理、规则等。而大部分元数据方案也可以转化为本体表示,加上引言中所提及之随语义网的兴起,元数据呈现出本体化的发展趋势,故不妨将其并称“元数据本体”。

如果再以更大范围的艺术数字人文为背景观察音乐数字人文的本体研究,可见已有的大部分元数据本体或较成功的案例多聚焦于视觉造型艺术,如观照物化的艺术品,对音乐元数据本体设计没有足够的参考性,则更凸显出本研究的必要性。

以传承民族音乐为特色的中国音乐学院其校图书馆在我国第一手传统民族民间音乐资源的采录、整理研究方面已有长足积累,资料以民间音乐影像志结合学术讲述、音乐展演等形式为主,细分为“视、音、图、文、谱”五大类,纳入该馆主持的“中华传统音乐文化资源库”特藏项目,于2003年启动发展至今,值语义网与数字图书馆建设转型契机,该馆目前正探索将其建设转化为知识库。本研究即结合此项目,依据传统音乐学科特点等,试开发出中国传统音乐知识库本体元数据方案的首版。

2 中国传统音乐学科视域下元数据本体的设计依据

依前文分析,严肃音乐、流行音乐具有二次创作的特点,并且由于多立足于当代城市或因市场化而表现出文化工业的生产特征,所以可与音乐元数据本体的已有方案相适应。而世界各地的“传统音乐”,或称世界民族民间音乐,与中国传统音乐相似,较大区别于严肃音乐与流行音乐,因而仍缺乏相匹配的元数据本体,不利于多元音乐文化与知识的交流、传播。

本研究以中国传统音乐作为世界各地民族民间音乐的一个典型,作为与西方严肃音乐相呼应、对比,但又相异的“东方主义”的一种表征;从我国音乐学的领域知识着眼,从学科结构或知识组织方式上阐发,从而形成学科视域下的元数据本体设计。在中国传统音乐学科视域下,元数据本体设计需要考虑的问题大致如下:首先,传统音乐对物质化的乐器有较明显的依托,而自身又属于非物质文化遗产范畴;其次,传统音乐一方面具有变异性而突破了专曲专用的规约,另一方面又具有宏观上的地域封闭性和超稳定性,从而依据地理进行分类观察较有意义;第三,传统音乐的各种分类学说,如涉广义和狭义的“乐种”,会直接影响对重要的类、属性、主题词表的整体把控。以下从三个角度具体分析。

2.1  对我国音乐学各子领域知识结构的借鉴与融合

本研究依据的领域知识以传统音乐学为核心,还参考了乐种学、乐器学、民族音乐学(即音乐人类学,或延伸之音乐文化学)、少数民族音乐研究、音乐地理学、音乐形态学、音乐分析学、东方音乐研究等领域的知识结构。这之中的若干领域在我国经历了特殊的本土化。

结合以上子领域,对传统音乐有如下三个方面的认识。其一,传统音乐多不同于严肃音乐等,并非“专曲专用”。后者的曲目可作为清晰的实体对象,是因为其通常有一个精确的符号载体,如五线谱,文本、主题和意义也是明确或可“自洽”的。而中国传统民族民间音乐,一方面,与地域性原生态音乐有密切关联,不一定有明确的乐谱符号载体记录,传播方式常见口传心授;另一方面,即使有文字、乐谱记录,也不够量化、精确,因表演与传承中的即兴变异、不同时空下的声腔表现或曲牌填词,可呈现不同的情感或主题内容,因而一曲多用的情况较为普遍。其二,存在变异性与稳定性的统一。传统音乐的传播、二次创作中,演绎者再创作的成分通常更多,再基于记谱中的“留白”、不同的乐器演奏法、唱法等而产生各异的表现效果,呈现出微观但鲜明的形态的游移变异。但变异的前提其实是宏观的稳定性。传统民间音乐根植于不同于当代“地球村”社会生态的历史悠久的农业乡村社会——生产方式单一、各地域相对封闭等,因而其形态特征在城市化和互联网普及前,表现出宏观的超稳定性。其三,以乐器作为传统音乐形态的分类基础。这是依托中国乐种学的一个重要认知点而为。虽然严肃音乐等的创作都少不了与乐器的关联,但传统音乐在形态特征上对乐器形制与其所附文化的依托更紧密。因此,本研究择取了乐种学的立场——“乐种体系的划分,采用了物质形态特征与音乐形态特征相结合的分类方法,在物质形态构成的基础上,强调了乐器编制以及主奏乐器(或乐队中的核心乐器)作为乐种体系划分基本原则的探索”。随后的“传统音乐分类学说”一节对此还会进一步展开说明。

传统音乐学的话语具有明显的本土特点,音乐形态学则更具有东西方类比的意味,对它的基本观念择取如下:对“音乐形态”的分析须区别于西方严肃音乐作品的乐谱分析,克服西方中心主义的倾向,侧重形态背后的场域与文化背景。这种视角有助于阐述音乐的类型划分。中国音乐学院的谢嘉幸教授将音乐形态分为“模式型”和“作品型”,认为“模式型音乐是即兴型音乐活动的产物”,而我国的民族音乐就是模式型音乐的代表,剧种的唱腔、器乐的曲牌,都是特定的音乐模式;作品型音乐则基本对应前文所述专曲专用情况。音乐形态学也曾生发出“民族民间音乐型态学(类型学)”等更细化的领域,这便涉及传统音乐分类的一系列学说。

2.2  传统音乐分类学说

目前可见的音乐元数据本体中,涉及音乐分类的主要就是Genre(译为体裁、类型、风格,其复数译为流派)类或相关属性。“Genre”这一概念更适合西方严肃音乐或流行音乐,且存在的另一个问题是,其可选项多为松散的类标签,缺乏层级或相关式的语义化组织,即存在“扁平化”问题。

学科框架下,音乐分类可基于多个角度,如形态层面的结构、形式、体裁、曲式、风格、模式,乃至社会功能等。而中国传统音乐的分类,根据中央音乐学院杨民康教授的提炼,涉及社会学、传统音乐形态学、文化区与生态学、地理学和民族学的方法角度。这之中最易形成共识的是从社会文化分层视角到形态学视角的“四大类→五大类”分类法,即先分出宫廷音乐(Court Music)、文人音乐(Literati Music)、民间音乐(Folk Music)、宗教音乐(Religious Music)这四类,再将民间音乐分成五类(图5a):民歌(Folk Song)、说唱(Singing And Dancing Music)、歌舞(Singing And Dancing Music)、戏曲(Traditional Opera Music)、民族器乐(National Instrumental Music),但这种方法也一直蒙受批评。另有对民间音乐做文化或地理分区的方法,如此次本体设计中用到的三大乐系、二十个支脉的学说等,以及袁静芳教授在《中国乐种学》中直接根据省、市、县等各级行政区划进行的划分。多种角度相互交叉,就容易产生更丰富的层级嵌套关系,突破扁平化限制。

就中国传统音乐类型,还须提及广义和狭义的“乐种”概念。广义的即指“一切传统音乐中各个‘种’的泛指”,基本对应下文的“音乐类型”类。如前所述,“四大类→五大类”中的每一类目及其再作细分的每一子类,乃至子类中的个体(owl:NamedIndividual,即音乐类型主题词表所列),都可视为一个乐种词条。而狭义的乐种,主要就是指民族器乐(以乐器合奏为主),也即乐种学主要针对的范畴。而乐种学的代表学者袁静芳则提出:“历史传承于某一地域(或宫廷、寺院、道观)内的,具有严密的组织体系,典型的音乐形态构架,规范化的序列表演程式,并以音乐(主要是器乐)为其表现主体的各种艺术形式,均可成为乐种”。从此来看,狭义和广义间也无绝对界限。如此,对音乐类型的划分,就更值得优先着眼于传统器乐的乐器的分类方法。我国的民族乐器的分类方式依然繁多,结合乐种学的理论体系,笔者采纳吹奏(如笙、管、笛、唢呐)、拉奏(拉弦类)、弹奏(弹弦类)、打击乐(锣、鼓、钹等)四大类的“中观分类法”,根据器乐合奏中(主奏)乐器的构成与搭配,再细分为诸如鼓吹乐(鼓笛系、笙管系、唢呐系)、弦索系、丝竹系、吹打系、鼓钹系等子类型(即“乐种系”。详参下文3.2.2);同时,基于器乐和声乐、舞蹈等的融合提出“乐声系”和“乐舞系”乐种的概念,也可将它们视为“综合性乐种”。

此外,即使是一个明确的乐种,在不同的派系乃至音乐班社(乐社)的传承中,也会逐步分化,犹如“亚种”。因此,对“乐种传承中典型性乐社的考察”“或代表性民间乐社中对重要乐人及某一特殊项目的考察”是本体设计中需要考虑的因素。

2.3  传统音乐的非物质文化遗产特征

从音乐人类学来看,传统音乐是文化中的音乐,或“音乐就是文化”,例如,一部分原生态音乐属于“仪式音乐”范畴,与地方民俗、信仰等有紧密关系。仍与严肃音乐相比,传统音乐作为时空中的表演艺术,作为对地域文化传承有重要意义的行为或表现,其本身缺乏实物载体,可以被视作典型的非物质文化遗产。作为非遗的传统音乐的文化价值,除了艺术音乐范畴内的审美性、可听性、娱乐性外,还可能包括其所依托的可视影像呈现的纪录性等特点。但影像志作品(作为“视”类)仅是一种载体,而不是非遗本身。从这个角度出发,则须单列一组bf:Work—bf:Instance类,用于表示作为载体的文献作品的“主题—实例”,并通过“涉及(bf:relatedTo)”语义关系关联到其他领域和馆藏书目、期刊文献名目。而对于传统音乐曲目作品,则另设类表示,详参后文。

以以上分析为据,中国音乐学院图书馆的“中华传统音乐文化资源库”项目结合传统音乐学采风与民族志(影像志)研究方法的特点,以影音采录为主要资源形式,并涵括细化类型如课程、讲座、学术会议、音乐会、音乐节、访谈等,目前已初成关于非遗音乐资料存储与检索的平台,如图2所示。

微信图片_20230727195013_1.png

图2 “中华传统音乐文化资源库”前端网页(第一期)

该资源库有若干特点。第一,作为非正式出版资源的数据库,从BIBFRAME本体模型来看,库中一个作品(Work)往往只对应唯一实例(Instance),是一一对应关系,不存在出版版本信息的差异,譬如影像志多是不可重复的、原生态的采录,也不存在多种“内容表达”(Expression,引自FRBR书目语义模型)方式,更不存在单件(Item)拷贝。第二,该资源库是以采录事项为基点,再将采录的视、音、图、文、谱资源切分或提炼成粒度不同的作品(Work),而作品又包含(bf:hasPart)更细切分的时间段,如某段对应某曲目等,并将它们与传统音乐学相关的知识领域的类进行相关性标注。第三,对用于标注非遗对象的各类“非信息资源”,编制出受控词汇表,就乐种、乐器的名目,圈定语料来源,详参下文。

3  传统音乐本体模型的设计与阐释

诚如前文所述,本研究对象因其特殊性,难以以现有的某种成熟的元数据或本体为基准加以修改,因此首先结合传统音乐馆藏资源的特点和传统音乐学知识,建立起概念框架,再寻找可复用的本体元素,并组装到此框架中。

3.1从概念框架到本体的设计与复用

本体的设计须尽可能多地考虑跨领域的关联,如乐种、乐器(作为相应的物质文化遗产)、民族、地域、乐人(如民间乐人或同时作为非遗传承人)、文字文献(包括图书和期刊文章)、乐社等,示例如图3。

微信图片_20230727195013_2.png

注:在目前的概念框架中,乐种、乐器、特藏独立资源是本体的重点,即图中粗体字所在的节点;较大的节点表明该类有具体的名目或受控词汇表由该本体原创;边框为双线的表明该节点为可具体访问的馆藏信息资源,如其中的乐器类可指向中国音乐学院图书馆下属乐器博物馆的乐器实物等资源。

图3 中国传统音乐本体模型主要类间的语义关联(仅对象属性)

资源中的语义关系可分为三类:一是层级关系,即类之间的subClassOf关系,或文化遗产类型主题词间的等级关系(cidoc-crm:P127_has_Broader_Term);二是类之间的语义关联(对象属性);三是“涉及”关系,可视作“情境实体,提供有关文化遗产对象的情境信息……实现文化遗产对象与相关的人物、地点、主题等信息的关联”。

参考复用的主要本体有:BIBFRAME,基于FRBR的书目本体FaBiO,音乐本体如The Music Ontology(mo)、kanzaki,文化遗产领域的概念参考模型CIDOC-CRM,dbpedia(来自维基百科),伦敦大学玛丽皇后学院数字音乐中心开发的事件本体(Event)和时间本体(TimeLine),个人和组织机构FOAF(Friend of A Friend)本体,地域本体geoNames和The Places Ontology(places),以及武汉大学数字人文中心的Intangible Culture Heritage本体(ich,一个较简单的非物质文化遗产本体)。元数据方面有:都柏林核心元数据方案(dc、dcterms),音乐元数据MusicBrainz,等等。要点如下。

(1)采用BIBFRAME作为复用参考的基准。尤其用于文献分类,即将独立的每一项“特藏独立资源_作品”作为bf中Work类的子类,而“特藏独立资源_作品”也下辖如视频—MovingImage、音频—Audio、图片—StillImage、文字—Text、乐谱—NotatedMusic等,并都与bf:Instance一一对应。特藏独立资源来源于(bf:derivedFrom)采录事项类。

(2)将音乐人和音乐组织类作为来自foaf的agent类的子类,而音乐人的类中的细分子类主要参考了mo、kanzaki本体。将图书类和期刊文章类作为来自bf:Monograph(即图3中的“专题著作或论文”)的类,将采录事项作为Event的子类。正是因为传统音乐属于非物质文化遗产范畴,所以对其类型可做这样的设置:“类型(Type)实体主要应用于非遗知识元素分类体系的构建,其类别实例可以依据不同的分类准则进行定义,可以来源于各类受控词表,也可以依据不同的分类体系来定义,如依据我国《非物质文化遗产名录》将非遗分为民间文学、民间音乐、传统医药、民俗等十大类,依据非遗的民族特性又可划分汉族、土家族、苗族等类别。类别实例之间还可以利用类属性cidoc-crm:has broader term进行层级关系的搭建,建立一个多视角、多层次、灵活的分类体系,其他类实体可分别构建与类型实体的映射关系。”就此,采用CRDOC-CRM中的E55_Type类(即图3中的“文化遗产类型”节点)。它是一个知识分类体系,作为父类,下辖音乐类型(乐种)、乐器、民族三个子类。并对E55_Type增设自返关系的属性P127_has_broader_term,用以形成乐种、乐器、民族各自内部的层级关系。

(3)将音乐类型(乐种)、乐器、民族作为主题词,采用简单知识组织系统skos进行处理,并将诸如skos:broadTranstive等同于P127_has_broader_term。此外,用skos:closeMatch表示该乐种、乐器概念间的相关关系,用skos:exactMatch表示等同关系。

(4)就地域类,复用了E53_Place(并等价于bf:Place)。其下设中华人民共和国各级行政单位类及其子类,即省、市、县、乡、镇、村,直接复用来自轻量级的places本体中的类(places:Province、City、County、Township、Town、Village),以及Parliament本体中的parl:containedByPlace;属性(各级行政单位)上下级间的包含关系复用ich中的属性,并嵌套在parl:containedByPlace内;另复用geonames中的neighbour属性表示各级行政单位间的毗邻关系。

3.2  类和属性的列表(词表)与解释

考虑到未来的知识库应能够更好地实现音乐知识的扩检、缩检,为E55_Type的三个子类即音乐类型(乐种)、乐器、民族编制了层级、相关关系丰富的主题词表。先围绕此三个类解释如下。

3.2.1  “音乐类型(乐种)”类

该类不同于2.2中的Genre,为此本体方案独创。前文提到乐种的分类通过多角度相互交叉,可突破类标签的扁平化限制。基本分类层级如图4所示。

微信图片_20230727195014.png

a社会学层面(MusicType的子类)+形态学层面(FolkMusic的子类)+宗教音乐细分

微信图片_20230727195014_1.png

b民族器乐(狭义的“乐种”)的细分

图4 音乐类型(乐种)分类层级


图4a中,宗教音乐的子类有伊斯兰教音乐(IslamicMusic)、佛教音乐(BuddhistMusic)、基督教音乐(ChristianMusic)、道教音乐(TaoistMusic);乐声系(MusicKindOfInstrumentalAndVocalMusic)、乐舞系(MusicKindOfInstrumentalAndDanceMusic)作为综合性乐种的代表,被置于同形态学层面的五大类一个层级的位置;民间音乐五大类+乐声系、乐舞系的并集同时作为“民间音乐(FolkMusic)”的等价类。我国传统音乐类型的当下活态几乎都跳不出民间音乐范畴,而民间音乐的五大类分别对应五种种称(它们是广义的乐种),即民歌—歌种、说唱音乐(曲艺)—曲种、歌舞音乐—舞种、戏曲音乐—剧种、民族器乐—乐种。其中,民族器乐—乐种属于狭义的乐种(图4b),分类体系最健全、层级关系最丰富,这也是出于它们有一个可依靠的物化载体,即东方乐器类,并形成语义关联(参考图3)。五个种类中,除了歌舞音乐和戏曲音乐,其他类都不相交。

对音乐类型的主题词表的编制,参考的语料库范围包括但不限于《中国传统音乐概论》、《中国乐种学》,还对通过馆藏资源标注中新发现的种类进行收编。同时,针对前文2.2部分提到的既有分类受到的批评,采取的应对办法则是,不局限于树形结构,而允许一个下位词从属于不止一个上位词(或一个个体从属于不止一个类),如图5所示。其展示了音乐类型主题词表通过层级关系(P127i_has_narrower_term,即P127_has_broader_term的逆属性)形成的词网络,这个例子即兼容了地理分类和乐种学分类的两种情况。

微信图片_20230727195014_2.png

图5 传统音乐类型名目上下位关系的词网络图(有向无环图)

乐种的基本属性还包括:等同关系、起源/消亡时期、分布地域、对应的传统音乐支脉、由…衍变而成、使用…乐器、对应…民族或种族、定义与详释、有…代表曲牌、有…代表曲目。

3.2.2  “乐器”类

本案特在“乐器”类中,依上位到下位的顺序逐层设“东方乐器”“中华民族乐器”子类,将其“特化”(specialization)。这是因为此类乐器对乐种的形态多具有决定性作用,并区别于西方交响乐、室内乐中的乐器。乐器条目主要来自于《中国乐器大词典》。以数据属性(data property)标注乐器的声学分类。乐器所涉对象属性的语义关系含“对应…民族或种族”。再根据前文2.1中关于乐种学的立场,最重要的语义关系为“(乐种)使用…乐器”(即乐队编制)及其内嵌子属性“乐种的主奏乐器有”(以下protege的类表达语法中,简称“主奏乐器”)。在本案中,其所涉本体语言还有如下特点。

(1)鉴于乐器是乐种体系划分的基本原则,于是乐器为乐种(狭义)提供存在量词约束,根据protege的类表达式语法,展示如下:

弦索乐—(not主奏乐器 some 吹管类乐器) and (主奏乐器 some (拉弦类乐器) or 主奏乐器 some (弹弦类乐器))

丝竹乐—(主奏乐器 some 吹管类乐器) and (主奏乐器 some (拉弦类乐器 or 弹弦类乐器))

吹打乐—(主奏乐器 some吹管类乐器) and (主奏乐器 some (打击类乐器))

鼓钹乐—(主奏乐器 some打击类乐器)

鼓吹乐—(主奏乐器 some打击类乐器) and (主奏乐器 some 吹管类乐器)

鼓吹乐的等价类—唢呐系 or 笙管系 or 鼓笛系

唢呐系—主奏乐器 some 唢呐,笙管系—主奏乐器 some (管 or 笙),鼓笛系—主奏乐器 some 笛

民族器乐独奏—(乐种使用…乐器 exactly 1 东方乐器)

(2)开发出乐器条目主题词表并做语义化组织,尤其是突出乐器类目的上下位关系,如胡琴的下位类有二胡、四胡、京胡、马头琴、火不思,笛的下位类有曲笛、梆笛等。

(3)鉴于乐种和东方乐器的密切关系,尤其是概念词条通常相互交叠(如“大鼓”“三弦书”“梆子”“八角鼓”“四川扬琴”“常德丝弦”“阿昌族葫芦箫”这些词条既有可能指乐器,也有可能指乐种,乐器本身就可能是乐种的象征),它们共用若干数据属性,如:别称、其他音译名、有代表曲目、名称对应的历史时期、曾用名、以…为命名依据。

3.2.3  “民族”类

这里的“民族”主要是东方民族。从民族学的角度对音乐做分类,除了“民族”词条外,语料库另参考的范围包括《中国少数民族音乐概论》,该作的知识结构还充分地借鉴了语言学知识。民族的子类包括“中华民族”和“外国或外国民族”,主要涉及中国境内各民族及周边国家或民族。民族主题词表的一部分(如我国56个民族)直接选自国家图书馆通过中国分类主题词表发布的中国民族表,另一部分是民族支系,通过P127_has_broader_term关联上位词。其他对象属性有:有…代表性乐种,有…代表性乐器(与乐器“对应…民族或种族”互为逆属性)。数据属性有:属于…语系、属于…语族、属于…音乐体系、有…语言、有…文字。

3.2.4  “主体\乐人”类

“乐人”包括若干子类,其中较重要的是“音乐学者”和本案的原创类“民间乐人”,这种对比是为了凸显学院视角和民间视角(或局外人视角和原生态的局内人视角)的差异与关联。对“民间乐人”做三种规定:一是作为mo:SoloMusicArtist(或译作音乐人个体)的子类;二是存在量词约束,即(民间乐人擅长表演…音乐种类 some 音乐类型);三是owl:disjointWith 音乐学者,即两类不相交。此外,规定了数据属性“是否是国家级非物质文化遗产传承人”(属性值为“是/否”)  。与描述民间乐人相关的重要属性还有(以“主-谓-宾”关系列示):民间乐人 民间乐人擅长 东方乐器/音乐类型(乐种),民间乐人 来自…民族 中华民族,音乐组织 有…成员 民间乐人,师承关系,等等。

师承关系属性的父类是社交关系,而表现在学者之间的社交关系主要是学术网络中的人际引用关系。对其采用OWL语言的“属性链公理”进行设置,即通过“(音乐学者A)-[是…的作者]->(专题著作或论文X)-[引用]->(专题著作或论文Y)<-[是…的作者]-(音乐学者B)”构成A引用B的关系。

3.2.5  “曲目的演出”类

如前文所述,与严肃音乐有所不同的是,传统音乐存在音乐创作的集体性、变异性及一曲多用、非遗活态性等特征。因为该类音乐的形态偏向模式型,同样的曲调、曲牌、唱腔、曲目视作一种模式,但经过不同的人、不同环境下的演出,经过不同的变异,可能前后大相径庭,再者,换用不同的乐器做演绎,也可能会逾越为不同的乐种。所以,对所谓“曲目”常存在界定或区分不清的问题。也就是说,从bf:Work类的定义来看,一首曲调的概念的本质可能会发生变化,即变成另一部作品。为了适应由专曲专用转变为一曲多用的情况,又可使曲目的区分具有唯一性,特将作品与表演交叉融合,提出“曲目的演出”类,而暂不单设“曲目”类。这种划分也兼顾了作为模式型的音乐形态或文化,其内涵更多地考虑了音乐表演的场域和背景的理论要求。另外,在mo本体中,也是将表演视作事件的子类。综上,把曲目和演出绑定起来,同时作为“特藏独立资源_Work”和事件的子类。这样形成的更精细的区分是有意义的。

与此类相关联的其他对象属性则有:特藏独立资源包含…曲目的演出,曲目类型【含三个子属性,即曲目的演出使用…乐器、曲目的民族风格是、曲目的音乐类型(乐种)或体裁是,值域(range)为E55_Type】、的作曲者是、的表演者是。数据属性有:曲目的体裁、创作年。

3.2.6  其他类或属性

特藏独立资源之外,则是同为Work的一般馆藏资源bf:Monograph,即文字文献,可细分为专题著作或论文,并通过“研究(vivo:hasResearchArea)”指向文化遗产类型。

基于创作过程的集体性,在Agent类的子类中,一方面淡化了mo:SoloMusicArtist的子类,即作曲者;另一方面突出了作为集体的音乐组织(mo:MusicGroup),并下辖民间音乐组织,即传统音乐学所关注的乐社对象,且通过“有…成员”指向民间乐人。

最后,通过protege5.5.0版本做本体设计,并通过“本体服务中心”平台发布和共享,生成本体可视化图谱(见图6,可通过扫描此处二维码读取)如下。该元数据本体方案已上传至本体服务中心,并提供可供下载的owl文档。

微信图片_20230727195015.png


注:图中深蓝色节点、连边上的标签分别代表复用本体的类和属性,浅蓝色节点则为原创本体资源,黄色矩形标签为数据属性,虚线轮廓的节点和有矩形箭头的虚线表示不同的类共用同一数据属性。就其他符号规则,可参考VOWL: Visual Notation for OWL Ontologies。

图6 中国传统音乐文化知识库本体可视化图谱

来源:http://www.usources.cn/webvowl/#iri=http://www.usources.cn/ont/ontology/visont?g=http://ont.library.sh.cn/graph/ctm


4 总结

CONCLUSION

就本研究目前存在的局限性、改进的思路与未来使用去向总结如下。

本案局限性,首先源于领域知识自身固有的问题。音乐类型的名目难以从根本上厘清,对于同名异种、同种异名的现象,学界本身也没有梳理清楚,缺乏共识,且存在学界和民间对之称谓、认知不一致的情况。即质的规定性不够清晰,影响到本体作为一个共享概念模型的有效性和普适性。传统音乐还没有形成一个科学、严密、易形式化操作的分类体系。例如,在局外人看来,外在同样的一个对象(乐器或乐种),不同地域、不同民族社群的局内人对之会有不同的认知、称谓,那么,就成为不同的对象了。这种情况为乐种的划分或乐器的划分造成了较大的困难。再如,不易为曲牌、唱腔或声腔在本体中找准角色与位置,故暂未设置相应的类。如上这些局限与传统音乐的模式型等特征有关。

其二,则是该本体模型更适合地理空间的、共时性研究,而对时间向度上的历时性研究考虑有限。文化遗产本身具有时间性,因此CIDOC-CRM作为—个以事件为核心的本体模型,须兼顾时空性。但是传统音乐知识库对时间要素的考虑相对淡化。这是因为传统音乐在宏观上具有超稳定性的特点,所以本体设计首先将现当代音乐的空间布局视作一个相对稳定的系统,即基于共时性研究的立场。对于这种设计,也不必求全责备:鉴于音乐史学和传统音乐学本身就有隔阂,尤其是名目上的不尽相同,所以姑且淡化历时的视角,仍用共时性的角度看问题。此外,这样做也是出于一种前设,即当下的传统音乐收集、整理、研究,主要是出于文化遗产抢救的目的,而不是艺术创新的目的,因此这种关注当下现状的共时性研究仍然具有较大的现实意义,譬如,可以通过社会网络分析的社群图观念,从音乐地理学的问题意识出发,对知识库形成的语义网络进行网络分析,尤其是结合地域信息进行真实地图式的观察。这些有待通过知识库前端的拓扑图形交互设计实现。

其三,本案目前以中国音乐学院的特藏资源库为基础进行开发,受限于当前案例的特征。如果想真正发展成适合中国传统音乐学科的、具有普适性的知识库元数据本体,不妨从如下几点做出规划。第一,可进一步结合民族音乐学的民族志等研究思路,深度提炼和优化元数据方案。第二,加强对传统乐谱类的观照,因为记谱曲目和非记谱曲目的存在方式和传播方式还是有较大区别的。对于有明确记谱的音乐,须和乐谱实体相关联,再对乐谱的元数据本体做细化设计。第三,中国传统音乐是文化中的音乐,而中国古代文化有“尚文字”的传统,即语言与文学具有至高的地位,故传统音乐的知识结构与文学领域的关联须加强。例如语言和方言问题、民歌和歌词问题、说唱和话本问题及戏曲的剧目和声腔、唱腔问题。

最后,就该本体方案的使用去向简介如下。首先是希望能够以此案抛砖引玉,推动打通全国音乐图书馆等场景,促进资源共建和语义网建设。其次,一定程度上推演至世界民族民间音乐学知识库的研究,从而不必受制于目前主流的音乐元数据方案的西方化(甚至是“西方中心主义”)和音乐产业化特征的桎梏。再次,保存传统音乐的目的更多的是在继承中革新,即如何将传统音乐的精华元素于今天的中国专业化民族音乐甚至具有民族风格的流行音乐的创作中得到继承与革新,这也意味着,该本体方案未来将尝试向如上领域进行延伸与拓展。

本文的写作尝试同时面向艺术学者和信息管理学者,做出一种跨学科的对谈。而要将对谈能够做到凝练而不乏深度,确是有难度的。因为个人学识与能力有限,还请两路方家包涵与指正。而这样的尝试,于己看来,也是值得的,希望能做一块“垫脚石”,为更高明、有效的研发铺路。

排版:许凯乐

校对:傅斯鎏 李向诚