一、选题依据
1、课题来源及研究的目的和意义 1.1课题来源: 在大数据时代,文化不再局限于精神层面,更多地被视为一种资源,在促进经济发展的过程作用愈发显著。党的十八大以来,国家层面积极推行传统文化的创新发展,突出了文化作为国家软实力的体现在社会经济发展中所处的重要地位。文化和科技作为社会发展的重要生产力,二者相互依存、不可分割,五千年的中华文明培育了优秀的中国传统文化,数字时代引发了文化的变革,文化与科技的深度交融正在不断推进着传统文化的革新与转型。 2017年1月,中共中央办公厅及国务院办公厅发布了《关于实施中华优秀传统文化传承发展工程的意见》,指出国家在传承保护文化遗产、深入阐发文化精髓中的重要使命,这是建国以来第一次以中央文件形式要求全国开展传统文化活动。2019年8月,科技部、中央宣传部、文化和旅游部、广播电视总局等六个部门共同出台的《关于促进文化和科技深度融合的指导意见》,将文化和科技之间的融合提升到空前的高度,成为文化领域内改革供给侧、引领需求侧的新引擎、新动力。当前,随着数字人文的兴起,人文学界中跨专业交流愈发频繁,自然科学领域的研究范式越来越多地被引入并应用于人文研究领域。如2019年11月全国哲学社会科学工作办公室在《大数据时代的社会科学研究新范式》中提出统计学习、机器学习、深度学习、人工智能等数据分析工具的发展,可以为形成数据驱动的人文学科研究新范式提供支撑,有力推动人文学科的创新发展。2020年11月,教育部新文科建设工作组举办的新文科建设工作会议发布的《新文科建设宣言》,标志着新文科建设正式起航,人文学科与其他学科交叉发展融合之势已成必然,加强理论与实践创新且不忘坚守人文传统已成为业界和学界的共识,受到广泛认同。因此,在文化科技融合与新文科建设背景下,用文化引领科技发展、科技赋能文化前进,来探讨文化资源的组织服务模式符合当今时代的需要和社会的发展趋势。 利用不断发展的、先进的数字技术和方法进行人文学科研究,对日益增长的文化数字资源进行组织与分析处理,可以高效、深入的发掘和利用文化资源。历史文化名人的遗迹在时代发展长河中占据着独特的意义,历史文化名人数字资源作为典型的一类特藏资源,蕴含着珍贵的文化内涵和精神财富,涉及历史文化名人的行迹、业绩、著述、故居、遗物、祠墓、故事等方方面面,具有主题鲜明、价值突出、来源广泛、数量巨大、类型多样等特征。目前,我国历史文化名人数字资源建设正经历着从“藏”到“用”的重心转移:一方面,在文旅部“全国文化信息资源共享工程”等各类政府和民间项目推动下,历史文化名人资源日渐为图书馆、档案馆、博物馆等社会记忆机构所青睐并成为开展数字记忆工程的首选,建成了一批高质量的结构化数据库,中国历代人物传记资料库即是其中典范;另一方面,数字旅游业及数字人文研究热潮的兴起使得历史文化名人数字资源服务需求急剧扩大,探寻历史文化名人数字资源形式化、可视化、智慧化的组织路径变得尤为重要,知识图谱即是其中最新兴的手段。 知识图谱一方面可作为一项关键的知识组织技术打破不同场景下的数据隔离,推动历史文化名人资源的关联化组织,实现历史文化名人资源数据基础设施建设从数字化、文本化、数据化向语义化、智慧化的发展;另一方面,借助知识图谱强大的语义处理能力和可视化特性,可对历史文化名人资源加以知识重构和场景重,通过深度挖掘进而展示隐含的知识关联,重现人文研究的典型场景,为历史文化名人的数字人文研究提供数字化方法支撑。 1.2研究目的和意义: 如古训言“读万卷书,行万里路”,人生经历恰是我国历史文化名人的生活典型,最能体现其人格养成和知识演化行径。本研究聚焦于苏轼的人生经历,立足于苏轼数字资源建设从“藏”到“用”的转变,以高度结构化的苏轼关系模式数据为数据源,以苏轼人生经历的相关资源(包括其著述作品、历史事件、出行轨迹和人物关系等)为研究对象,探索一套简洁有效的苏轼人生经历知识图谱构建方案,以期进一步完善苏轼人生经历的数据基础设施建设,并挖掘和重现苏轼人生经历中的知识关联及知识场景,最终促进相关数字资源的深度开发利用。 在历史文化名人数字资源建设中,高度结构化的关系数据库仍是常见、简洁、有效的存储模式,探索以关系数据库为数据源构建知识图谱的有效路径,能可视化地重现苏轼的人生轨迹,并形式化地挖掘苏轼人生轨迹中蕴含的知识关联,促进相关数字资源的深度开发利用。本研究立足于数字人文视角,以CBDB、中图人名规范库、中图古籍资源、各地地方志、古诗文网、历史人物年谱等研究资料为数据来源,在CBDB数据库框架的基础上析取和完善苏轼人生轨迹关系数据模型,借助MySQL、Navicat、D2R、LODLIVE等工具分别进行数据的存储、转化与发布、浏览查询与可视化,最终实现苏轼人生轨迹知识图谱的构建与展示。研究方案以简洁有效的方式实现了关系数据库向知识图谱的转化,满足了用户基于知识图谱对苏轼人生轨迹数字资源进行可视化浏览、查询与知识发现的多元化需求,为苏轼的数字人文研究奠定了数据基础。 |
2.1文化资源语义知识组织与发现研究 目前,本体、关联数据、知识图谱已成为语义环境中知识组织与发现与表达数据语义的关键性技术,在很多领域获得广泛应用。近年来,图书情报、计算机、人文学科领域的一些学者开始进行数字文化资源语义融合的研究和实践,国外通过引入本体、关联数据、知识图谱等技术,对文化资源知识组织与知识发现的延伸发展进行了众多研究和探讨。如JinhuaD(2018)等通过本体及自然语言处理技术进行了中国非遗领域知识图谱的构建研究;DayanyD(2019)等对关联数据文化资源注释的知识组织系统进行分析,描述了应用于文化遗产领域中的知识组织系统构建过程;仝召娟(2014)等以数字图书馆的非遗数字资源作为研究对象,利用关联数据技术进行聚合研究,构建了有关“欧塑”的数字资源聚合平台;张修文(2015)等基于本体和关联数据进行了馆藏资源融合模型的研究;翟姗姗(2015)基于关联数据以楚剧为例建立了楚剧资源聚合服务平台;曾子明(2018)等以关联数据为基础进行了数字人文视觉资源知识组织模型的构建,以敦煌文化遗产为例进行了实证研究;滕春娥(2018)等进行了非遗资源领域内知识组织本体的构建研究;周溢青(2019)等对“江海文化”相关资源进行了语义描述、深度关联、多维度聚合和知识发现与利用等相关的研究;侯西龙(2019)等基于关联数据进行了非遗知识的管理研究;周莉娜(2019)等通过知识图谱进行了Know-Poetry平台的设计,实现了唐诗领域内知识探索、时空轨迹、语义查询等智能化知识发现服务;姚天泓(2019)等以张学良的史料为例进行了史料资源的语义知识组织研究;刘美杏(2019)等基于关联数据进行了古道线性文化遗产资源关联模型的设计,以潇贺古道作为实例进行了实际的分析研究;王晓光(2020)等对敦煌壁画进行了叙词表的构建以及关联数据的发布研究。 在实现文化资源知识组织软件工具的应用上,梁艳琪(2017)利用Protégé构建并标注本体,结合D2R工具完成了文物资源关联数据的发布;张乐(2018)等以Drupal为基础构建了民国建筑知识库,并进行了关联数据的发布;张永娟(2020)等基于IIIF和语义知识图谱进行了印章资源整合与知识发现的研究;何春雨(2021)等以Protégé为主要软件工具进行了非物质文化遗产本体模型的构建,并且以赫哲族为例进行了具体的实例知识的查询、可视化、发现和共享;王菁薇(2021)等通过Neo4j图数据库进行了对中医古籍《伤寒论》的知识图谱构建研究,完成了对《伤寒论》深度的知识发现;陈涛(2021)等基于IIIF-IIP平台结合AI技术展开了对文化遗产领域新模态的探究,对文化资源从发布注释到关联复用进行了全流程设计。 2.2名人数字资源知识图谱的研究现状 国内外以人物资源为核心对象的知识图谱研究主要呈现出三类特色:其一,注重通过知识图谱满足对名人社会关系的发现、展示及问答,例如杨海慈等对CBDB中宋代学术师承关系的可视化展示、周亦等设计的历史人物实体关系可视化系统、单良等构建的中国历史人物知识智能问答系统都是其中典型代表,旨在改善人物数字资源可视化及可读性较差的现状;其二,注重通过知识图谱发布人物数字资源,并与外部开放资源建立有效链接,例如刘宁静等构建的学术名人知识模型、陈涛等构建的Sinopedia平台均属此类,旨在完善学术名人数据规范,并优化其知识组织、知识链接、知识发现等服务;其三,注重通过知识图谱达到社会交互及知识发现之目的,例如于娟等通过构建人物关系知识图谱推理人物关系,PhilippF等通过描述数字人文领域大规模案例展示用户交互情境,ChristineS等借助知识图谱展示艺术家及其作品之间的相关知识等。以上研究以各类“名人数字资源”为核心对象,借助关联数据与知识图谱的方法技术,推进了名人数字资源知识图谱的相关研究,达到了深化名人数字资源组织、管理与利用之目的。 2.3知识图谱构建与展示的方法论现状 就相关知识图谱的构建方法而言,不同结构化类型的数字资源,其知识图谱构建的技术路径略有差异,纵观现有研究大致分为以下三种:①以关系数据库为数据源构建知识图谱,宋代学术师承图谱、非遗知识关联数据集与知识服务平台均为此类,其关键在于完成对关系表的RDF描述;②在领域本体的基础上完善实体信息从而构建知识图谱,唐诗本体模型驱动的唐诗知识图谱、数字人文视觉资源本体驱动的敦煌文化遗产知识图谱即为其中典型,其关键为先建构本体以搭建“骨架”,再补充实体属性等具体信息以完善“血肉”;③直接依托图数据库构建知识图谱,如MarcoB等依托图数据库建构生物知识图谱、冯俐借助Neo4j构建中学语文诗词知识图谱,其关键在于以图数据库设计并存储数据进而实现各记录的关联映射。不同的构建方法各具优势又殊途同归,选择的依据在于充分考虑数据源的数据结构,从而采用最简捷有效之技术路径。 2.4文献综述 综上,当前名人数字资源相关的知识图谱研究已经取得了较为丰富的成果,特别是在构建方法上形成了多元化体系,均为本研究的开展奠定了坚实基础。但聚焦到本研究命题上,还有诸多关键问题尚未被解决:其一,本研究聚焦在历史文化名人出行数字资源组织上,主题更为细化凝聚,需要进行多渠道整合和主题优化以完善关系数据模型;其二,既有研究针对从“关系数据库”向“知识图谱”转化的一般原理归纳不足,本研究期望揭示基于关系数据库构建知识图谱的普适性技术路径和方法模型;其三,构建知识图谱的根本目的在于“用”,本研究尝试在历史文化名人出行知识图谱的基础上展开数字人文研究及应用。 |
|
[1] China Biographical Database [EB/OL]. [2020-07-23]. https://projects.iq.harvard.edu/cbdb. [2]陈涛,刘炜,单蓉蓉,等.知识图谱在数字人文中的应用研究[J].中国图书馆学报,2019,45(6):34-49. [3]夏翠娟.面向人文研究的“数据基础设施”建设——试论图书馆学对数字人文的方法论贡献[J].中国图书馆学报,2020,46(3):24-37. [4]陈涛,单蓉蓉,张永娟,等.数字人文研究的语义支撑平台构建研究——以ECNU-DHRS平台为例[J/OL].图书馆杂志:1-12[2020-10-27]. [5]刘炜,叶鹰.数字人文的技术体系与理论结构探讨[J].中国图书馆学报,2017,43(5):32-41. [6]杨海慈,王军.宋代学术师承知识图谱的构建与可视化[J].数据分析与知识发现,2019,3(6):109-116. [7]周亦,周明全,王学松,等.大数据环境下历史人物知识图谱构建与实现[J].系统仿真学报,2016,28(10):2560-2566. [8]单良,刘欣.基于中国历史人物知识的智能问答系统构建[J].情报探索,2019(6):101-105. [9]刘宁静,刘音,王莫言,等.数字人文视角下学术名人知识模型构建研究——以李政道数字资源中心为例[J].图书情报工作,2019,63(23):113-121. [10]陈涛,刘炜,朱庆华.中文百科概念术语服务平台SinoPedia的构建研究[J].中国图书馆学报,2018,44(4):4-18. [11]于娟,黄恒琪,席运江,等.基于图数据库的人物关系知识图谱推理方法研究[J].情报科学,2019,37(10):8-12. [12] Philipp F, Michael M, Sebastian T, et al. OntoWiki[1]An authoring, publication and visualization interface for the Data Web[J]. SEMANTIC WEB, 2015, 6(3): 215-240. [13] Christine S, Daniel I. InfluViz - A Visualization Tool for Exploring and Analyzing Creative Influence between Artists and their Works[C]//21st International Conferenceon Information Visualisation (IV). IEEE International Conference on Information Visualisation. London: IEEE, 2017: 336-343. [14]侯西龙,谈国新,庄文杰,等.基于关联数据的非物质文化遗产知识管理研究[J].中国图书馆学报,2019,45(2):88-108. [15]周莉娜,洪亮,高子阳.唐诗知识图谱的构建及其智能知识服务设计[J].图书情报工作,2019,63(2):24-33. [16]曾子明,周知,蒋琳.基于关联数据的数字人文视觉资源知识组织研究[J].情报资料工作,2018(6):6-12. [17] Marco B, Ajit S, Christopher R, et. al. Towards FAIRer Biological Knowledge Networks Using a Hybrid Linked Data and Graph Database Approach[J]. Journal of integrative bioinformatics, 2018, 15(3): 23-33. [18]冯俐.基于Neo4j图数据库构建中学语文诗词知识图谱[D].西安:陕西师范大学,2019. [19] Juan X C, Wei L. Name Authority Control in Digital Humanities: Building a Name Authority Database of Shanghai Library[J]. International Journal of Librarianship, 2018, 3(1): 21-35. [20]夏翠娟,林海青,刘炜.面向循证实践的中文古籍数据模型研究与设计[J].中国图书馆学报,2017,43(6):16-34. [21]曲佳彬,欧石燕.关联数据可视化研究进展分析[J].图书与情报,2018(4):51-61. [22]JinhuaD,JingyanQ,ZanxiaJ,etal.Knowledgegraphbasedondomainontologyandnaturallanguage processing technology for Chinese intangible cultural heritage[J]. Journal of VisualLanguages & Computing, 2018, 48:19-28. [23]Dayany D, Javier L, Miguel Á L, et al. Profiling of knowledge organisation systems for theannotation of Linked Data cultural resources[J]. Information Systems, 2019,84:17-28. [24]仝召娟,许鑫,钱佳轶.基于关联数据的非遗数字资源聚合研究[J].图书情报工作,2014,58(21):21-26. [25]张修文,张晓梅,付佳,等.基于本体和关联数据的馆藏资源融合模型[J].中华医学图书情报杂志,2015,24(8):50-54. [26]翟姗姗.基于关联数据的非物质文化遗产资源聚合研究[M].科学出版社,2015. [27]曾子明,周知,蒋琳.基于关联数据的数字人文视觉资源知识组织研究[J].情报资料工作,2018(6):6-12. [28]滕春娥,王萍.非物质文化遗产资源知识组织本体构建研究[J].情报科学,2018,36(4):160-163. [29]周溢青,徐晨飞.基于关联数据的“江海文化”资源多维语义聚合研究[J].情报科学,2019,37(9):72-78. [30]侯西龙,谈国新,庄文杰,等.基于关联数据的非物质文化遗产知识管理研究[J].中国图书馆学报,2019,45(2):88-108. [31]周莉娜,洪亮,高子阳.唐诗知识图谱的构建及其智能知识服务设计[J].图书情报工作,2019,63(2):24-33. [32]姚天泓,陈艳梅,刘革,等.基于CIDOC-CRM的数字人文史料资源语义化知识组织研究——以张学良史料资源为例[J].图书馆学刊,2019,41(7):35-43. [33]刘美杏,徐芳.古道线性文化遗产信息资源关联数据模型构建及其实证研究[J].图书馆学研究,2019(14):40-50. [34]王晓光,侯西龙,程航航,等.敦煌壁画叙词表构建与关联数据发布[J].中国图书馆学报,2020,46(4):69-84. [35]梁艳琪.基于关联数据的文物数字资源语义融合与服务研究[D].武汉:华中师范大学,2017. [36]张乐,常娥.基于Drupal的民国建筑知识库关联数据的组织与发布研究[J].图书馆学研究,2018(19):64-70. [37]张永娟,刘炜,于建荣,等.基于IIIF和语义知识图谱的印章资源整合与知识发现研究[J].图书情报工作,2020,64(7):127-135. [38]何春雨,滕春娥.非物质文化遗产知识本体构建——以赫哲族非遗资源为例[J].情报科学,2021,39(4):140-147. [39]王菁薇,肖莉,晏峻峰.基于Neo4j的《伤寒论》知识图谱构建研究[J].计算机与数字工程,2021,49(2):264-267. [40]陈涛,刘炜,孙逊,等.IIIF与AI作用下的文化遗产应用研究新模态[J].中国图书馆学报,2021,47(2):67-78. |
二、研究方案
1.研究目标、研究内容和拟解决的关键问题 研究目标: 立足于苏轼数字资源建设从“藏”到“用”的转变,以高度结构化的苏轼关系模式数据为数据源,以苏轼人生经历的相关资源(包括其著述作品、历史事件、出行轨迹和人物关系等)为研究对象,探索一套简洁有效的苏轼人生经历知识图谱构建方案,以期进一步完善苏轼人生经历的数据基础设施建设,并挖掘和重现苏轼人生经历中的知识关联及知识场景,最终促进相关数字资源的深度开发利用。 研究内容: 论文将研究共划分为七个章节,总体按照研究问题-方案-内容-结论的基本思路展开研究。 绪论部分。阐述本研究的背景、目的和意义,对当前文化资源语义知识组织与发现研究、名人数字资源知识图谱的研究、知识图谱构建与展示的方法论进行了系统地梳理,归纳出当前背景下,名人数字资源知识图谱研究存在的问题。在此基础上,提出了本文研究的方法、研究内容框架与创新之处。 第二章,相关理论和技术。该章节论述了本文所用的相关理论以及方法工具,将其划分为两个部分。第一部分主要阐明了本研究所运用的语义组织方法与理论,包括本体、关联数据、知识图谱等,第二部分与理论方法相对应介绍了本研究所用的具体软件工具与系统。 第三章,苏轼人生经历资源概述。对苏轼人生经历进行具体的调研与分析,包括著述作品、历史事件、出行地点、所著诗词和人物关系等方面。 第四章,苏轼人生经历模型构建。首先对建模方法思路进行概述,而后借助本体软件工具通过苏轼诗词人生实体与属性分析,对核心类进行定义,构建对象属性与数据属性,实例导入完成本体的构建。 第五章,苏轼人生经历关联数据技术应用。在完成系统环境配置的基础上完成Drupal平台的搭建,通过资源标识、内容类型、属性构建、RDF映射完成数据的具体配置,最后进行具体实例的可视化呈现分析。 第六章,苏轼诗词人生知识图谱构建。借助MySQL、Navicat、D2R、LODLIVE等工具分别进行数据的存储、转化与发布、浏览查询与可视化,最终实现苏轼人生轨迹知识图谱的构建与展示。 第七章,结论与展望。通过对整体的研究作出归纳总结,分析研究工作的价值与意义,对于存在的不足之处作出分析,针对今后研究工作及未来发展方向进行展望。 拟解决的关键问题 1.苏轼诗词和人生经历资源概述。 2.苏轼诗词和人生经历模型构建。 3.苏轼人生经历关联数据技术应用。 4.苏轼诗词人生经历知识图谱构建。 |
研究方法: (1)文献调研法 使用文献调研法对研究的背景、现状、相关理论、技术方法以及研究所需的诗词资源数据进行充分的调研。通过CBDB、中图人名规范库、中图古籍资源、各地地方志、古诗文网、历史人物年谱等进行文献信息的检索,广泛阅读大量相关资料,对研究的背景、国内外研究现状进行归纳分析,同时梳理和掌握相关概念内涵、分析国内外相关理论实践以及现有研究存在的不足,成为后续研究的重要基础。通过数据库与纸本文献对苏轼人生经历资源进行调研与收集,形成比较全面而权威可靠的数据,为本文研究提供有力的数据支撑。 (2)实验研究法 通过梳理苏轼人生经历相关资源和作品,深层次对资源进行分析,对其包含的著述作品、历史事件、出行地点和人物关系等进行分析与确定,从而构建完整的苏轼人生经历体系。对于苏轼人生经历,进行从资源采集分析、本体模型构建、关联数据发布、知识图谱构建的全流程语义知识组织与知识发现的实验研究,根据最终结果分析验证本体模型的正确性与数据的可靠性。 (3)案例分析法 通过以苏轼人生经历作为具体例证进行研究分析,进行了关联数据发布的实例化探索以及知识图谱构建的实证研究,通过实例化的展示形象具体地揭示了人物、诗词、时空等多元实体的关系,为本文研究提供了具体化的实例。 技术路线: 选用“关系型数据+本体模型+D2R+三元组数据库+ECharts/D3.js+RelFinder”作为基础技术路线。 通过重新构建关系数据模型整合CBDB、中国图书馆人名规范库、中国图书馆古籍资源、地方志、古诗文网、历史人物年谱、苏轼相关传记等多元数据源,其中除典型的关系数据库CBDB外,面向数字人文服务融合多元人名知识库建立的中国图书馆人名规范库以及在古籍数据模型基础上融合多种古籍目录与古籍数据库数据的中国图书馆古籍联合目录及循证平台也是高质量的结构化数据源,可加以补充以满足数据源的高度覆盖性 借鉴LODLIVE可视化工具的优越性,以其替代ECharts、D3.js等方式,使得苏轼人生经历资源中蕴含的知识关联以更加清晰可视的形式进行展示。 实验方案: 为简洁表达苏轼人生经历知识图谱构建过程,本文采用概念建模方式,参考知识图谱构建的一般流程,提出了以关系数据库为基础构建苏轼人生经历知识图谱的方法模型,从数据准备与模型构建、数据存储、数据转化与发布、数据服务等环节对苏轼人生经历知识图谱构建过程的任务、技术、工具、中间物进行概括。 可行性分析: 相关研究成果丰富:从学界和业界的相关研究与实践成果来看,现有实践对文化遗产资源知识组织的数字化、语义化到知识发现的智慧化进行了一定探索,现阶段知识组织向语义化方向发展趋势明显,已经指明本体、关联数据等语义网方法是当前知识组织研究的核心和重点,国内相关研究在充分借鉴国外研究的基础上发展迅猛,已形成一定的研究特色。同时,文化资源的数字化建设已在世界范围内广泛开展,各地区均根据自身的文化特点,搭建了相应的平台,取得了不同的成果,本体、关联数据、知识图谱等作为知识组织技术在文化资源建设中也有了一定的实践应用,对知识组织向知识发现进一步展开则是后续研究的方向。 本人具备相应素质:本人针对苏轼生平经历及知识图谱理论积累大量的知识,并且已具备研究生基本能力和素养,在指导老师和同学的帮助下能够独立完成课题,并形成毕业论文一篇。 |
(1)2022年8月—2022年10月 选题与调研阶段。查阅相关文献资料,了解课题的研究背景和现状,分析课题的需求和发展趋势,找准课题的重点难点,对课题有一个整体的把握。 (2)2022年10月—2022年12月 根据课题要求,查阅大量有关书籍、杂志、期刊、论文集等文献,查阅相关课题材料,为知识图谱的构建做好充分的理论准备。 (3)2022年12月—2023年2月 着手于展开对苏轼人生经历的归纳与分析,以便于进一步在知识图谱中进行联结和实现。 (4)2023年3月—2023年7月 进行知识图谱的搭建,赋予可行的运行逻辑来展开对苏轼人生经历的数字化呈现。 (5)2023年7月—2023年10月 进行最后知识图谱的最后收尾工作并初步完成论文的写作。 (6)2023年10月—2024年5月 将各部分任务的论文修改整合,打印论文、展板;准备终期答辩
知识抽取 目前,构建知识图谱的数据常由人工整理,工作量大,相对而言,人工干预较多,自动化、数字化程度不高,难以形成规模化、系统化、标准化的数据体系,因此,如何自动便捷地抽取传统文化信息并加工是形成知识图谱的关键。 知识融合 在对数据进行知识和信息抽取后,如何有效整合这些异构多元化的信息实现知识融合是最关键的、必不可少的一环。知识融合是指将多个数据库来源的知识进行对齐和合并工作,形成统一标准的知识和数据标识,实现数据与知识间的互联互通。 知识加工 利用数字化技术自动对知识和数据进行抽取与融合处理后,还需对知识进行加工,主要包括知识推理、知识更新、质量评估等内容。这些数据和知识在被收藏时由于统计标准、记录形式不一等原因,导致按照统一标准进行标识后还可能存在重复或遗漏统计等问题,因此,有必要对抽取的知识和数据进行再确认、再整理、再加工。
|
(1)研究视角 研究对象具有一定的创新性,以苏轼人生经历资源作为研究对象来进行研究,立足于文化与科技融合的大背景下,解决领域实际问题,从苏轼人生经历知识组织与知识发现的角度出发,探讨历史名人人生经历的数据基础设施建设,并挖掘和重现历史文化名人人生经历中的知识关联及知识场景,最终促进相关数字资源的深度开发利用的可能性,具有一定的创新性。 (2)研究方法 从研究方法上来看,从文化与科技融合的角度,为历史文化名人研究中引入本体、关联数据以及知识图谱技术,建立历史文化名人本体模型对苏轼人生经历资源进行知识组织,通过关联数据技术对苏轼人生经历资源进行知识关联聚合,提出针对历史文化名人资源及其实体网络的关联融合体系,利用知识图谱完成苏轼人生经历资源的知识发现,为苏轼人生经历资源从信息资源转化为知识资源提供了方法创新。
|
立足于苏轼数字资源建设从“藏”到“用”的转变,以高度结构化的苏轼关系模式数据为数据源,以苏轼人生经历的相关资源(包括其著述作品、历史事件、出行轨迹和人物关系等)为研究对象,探索一套简洁有效的苏轼人生经历知识图谱构建方案,以期进一步完善苏轼人生经历的数据基础设施建设,并挖掘和重现苏轼人生经历中的知识关联及知识场景,最终促进相关数字资源的深度开发利用。 |
三、研究基础
研究生本人及导师与本课题有关的研究工作基础和已取得的研究成果 |
四、开题报告会上专家提出的主要问题及建议