武汉大学的司莉和郭财强在其合著论文《基于内容分析的数字人文领域中知识组织价值体现研究综述》中,运用内容分析法系统梳理了元数据、本体、语义标注、关联数据等知识组织方法与技术在数字人文领域的应用情况。
本体应用情况
-
复用本体:常见的复用本体有:
CIDOC CRM
广泛应用于古建筑、传统节日、戏剧、民俗舞蹈等领域;FOAF(Friend of a Friend)
描述网页上的个人信息,用于人际关系网络的表示;GeoNames
用于表示地理位置和地理实体;还有EDM(European Data Model)
、BIBFRAME(书目框架)
、FRBR(书目功能记录需求)
、Ontology for Media Resource(媒体资源本体)
等 -
自建本体模型:研究者通过自顶向下或自下而上的构建原则,自建本体模型用于描述和揭示特定领域的知识结构,主要应用于古建筑、民俗文化(例如传统工艺、民俗舞蹈等)、历史人物与事件等领域。
语义标注应用情况
数字人文领域的语义标注主要是面向图像资源, 其次是文本资源,而面向多媒体资源的较少。
- 图像资源语义标注:武汉大学的敦煌壁画数字图像研究、中山大学的多维度智慧图像系统
- 文本资源语义标注:对文学作品或古籍文献进行语义标注研究
- 多媒体资源语义标注:黄洞瑶族“度戒”非遗多媒体资源、“郧西七夕”的语义标注
关联数据应用情况
- 文化遗产
- 非物质文化遗产的语义揭示与组织、异构资源整合与聚合、以及相应的本体或知识图谱发布
- 物质文化遗产关联数据模型、实现和平台构建
- 档案资源数字化
- 非遗档案资源本体模型开发
- 档案资源开发与利用平台建设,例如中国历代人物传记数据库(CBDB)项目
- 历史人物关系揭示
- 利用 CBDB 数据构建师生关系、学术关系和亲属关系图谱
- 构建历史人文知识图谱
元数据应用情况
-
基于元数据标准的应用
元数据标准 应用领域 具体应用 Dublin Core 网络资源著录、古建筑描述、文化遗产资源管理 设计民国建筑数字化博物馆元数据编目方案,云南少数民族文化资源元数据方案 VRA Core 艺术、建筑、史前古器物、民间文化等艺术类可视化资源 古道文化遗产信息资源元数据标准,非遗视频资源语义组织本体模型 CDWA 描述艺术品(如油画、雕刻、陶艺、设计、表演艺术等) 古民居数字资源元数据模型,维吾尔族达斯坦曲艺故事的视频、图片和文本元数据 MIDAS 描述历史遗迹为主的物质文化遗产 构建不可移动文物知识图谱 -
自编元数据的应用
应用领域 具体应用 少数民族口头传统 制定由19个父元素和104个子元素构成的元数据方案,用于描述传统史诗的声音记录 非遗资源 构建非遗项目对象的信息结构和语义成分的元数据模型,提出适用于我国国情的非遗元数据标准 古籍资源 制定古籍钤印元数据规范,参照现有钤印元数据规范及中山大学图书馆徽州文书数据库的元数据规范标准 -
研究者复用已有元数据标准
应用领域 具体应用 古建筑 以DC为基础提出民国建筑数字化博物馆元数据编目方案,基于VRA Core和CDWA的术语对古建筑进行描述 文化遗产 参考DC、VRA Core、CDWA、MODS等设计维吾尔族达斯坦曲艺故事的元数据,实现徽州文化语义描述元数据及相关操作 历史人物 参考并复用DC及其他本体模型,构建张学良史料资源的语义本体规范,确定赫哲族非遗资源体系中的核心元数据元素集
参考文献
- 司莉,郭财强.基于内容分析的数字人文领域中知识组织价值体现研究综述[J].图书情报工作,2022,66(13):127-137.DOI:10.13266/j.issn.0252-3116.2022.13.012.