目录
项目背景
中医药学包含着中华民族几千年的健康养生理念及其实践经验,是中华文明的瑰宝之一,凝聚了中华民族的博大智慧。中医药的作用,在这次抗击疫情种展现出了非同凡响的一面。随着时代的发展,中医在全世界的认可度、被接受度越来越高。对于越来越多的外国留学生以及对中医文化感兴趣的外国友人来说,获取到有效的中医信息是很难的。为了推动中医药走向世界,充分发挥中医药防病治病的独特优势和作用,为建设健康中国,实现中华民族伟大复兴的中国梦贡献力量,我们团队决定建立一个基于web和微信小程序的中医汉英语料库资源平台,对建立的中英语料库进行数据处理与挖掘,提取病理、疾病、中药名等不同的信息进行匹配,对提取的信息实现关键字查找、模糊查询、排序优化,实现内容的快速检索。传统医药是优秀传统文化的重要载体,平台的建立可以使我国优秀的中医文化加以传播,建立对中医药学的自信,促进文明互鉴,维护人类健康。
项目开展思路、实施方案
(1)中医药学学科划分和语料选取
首先依据国家十三五规划对中医药高等教育学科的划分,按照Biber (1993)
的语料库建库标准,以中医相关电子版材料为基础进行语料选取。
语料选取中主要通过扫描或网页数据爬取等方式获取语料,并将语料统一
转化为TXT电子文档,便于建立汉英双语语料库。同时本研究将采用Xpath
降噪减重方法,去除文本语料中多余的文本信息或文本句子格式整合的错误。