- 博客(6)
- 收藏
- 关注
原创 selenium爬取文献
故事的起因:师姐想让我帮她下载25篇文献,给了一串URL,需要手动的去下载,需要一直点点点。 咱就说有点浪费时间。突然发现有一个模块:selenium可以代替人工点点点。嗯…真不错#需要下载selenium#如果下载过就自动忽略这一步#pip install seleniumimport requestsimport reimport urllib.requestfrom selenium import webdriver#url所在的位置url_file="E:/url.txt"
2021-12-08 16:22:12 266
原创 知识图谱融合
1.知识图谱融合的概念知识融合,即合并两个知识图谱(本体),基本的问题都是研究怎样将来自多个来源的关于同一个实体或概念的描述信息融合起来。
2021-03-14 13:03:56 4789
原创 知识抽取(二)
前面介绍了面对非结构化数据的知识抽取,那么接下来介绍面对结构化和和半结构化数据的知识抽取。1. 面向结构化数据的知识抽取垂直领域的知识往往来源于支撑企业业务系统的关系数据库,因此,从数据库这种结构化数据中抽取知识也是一类重要的知识抽取方法。在该领域,已经有一些标准和工具支持将数据库数据转化为RDF数据、OWL本体等。W3C的RDB2RDF工作组于2012年发布了两个推荐的RDB2RDF映射语言:DM(Direct Mapping,直接映射)和R2RML。DM和R2ML映射语言用于定义关系数据库中的数
2021-03-08 20:35:30 1600 4
原创 snomed ct
SNOMED CT(Systematized Nomenclature of Medicine – Clinical Terms,医学系统命名法-临床术语,医学术语系统命名法-临床术语) 是系统组织的计算机可处理的医学术语集合,提供了临床文档和报告中使用的代码,术语,同义词和定义。SNOMED CT被认为是世界上最全面,多语言的临床医疗术语。 SNOMED CT的主要目的是对健康信息中使用的含义进行编码,并支持对数据进行有效的临床记录,以改善患者护理水平。SNOMED CT提供了电子健康记录
2021-02-09 15:23:37 3805 4
原创 知识图谱 第一章(上)
知识图谱:方法、实践与应用Q:知识图谱的理念来自什么?A:来于万维网之父Tim Berners-Lee 关于语义网的设想,旨在采用图结构来建模和记录世界万物之间的关联关系和知识,以便有效实现更加精准的对象级搜索。Q:什么是语义网?A:用相互连接的节点和边来表示知识。节点表示对象、概念,边表示节点之间的关系。 其优点:1. 容易理解和展示。 2.相关概念容易聚类。 其缺点:1. 节点和边的值没有标准,完全是由用户自己定义。
2021-01-16 22:11:59 371 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人