知识图谱
行路南
公众号:CV前沿
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
[自然语言处理] 中文自然语言处理工具LTP部署和使用
LTP 是哈工大社会计算与信息检索研究中心历时十年开发的一整套中文语言处理系统。LTP 制定了基于 XML 的语言处理结果表示,并在此基础上提供了一整套自底向上的丰富而且高效的中文语言处理模块 (包括词法、句法、语义等6项中文处理核心技术),以及基于动态链接库(Dynamic Link Library, DLL)的应用程序接口,可视化工具,并且能够以网络服务(Web Service)的形式进行使用。LTP 系统框架图如下所示:LTP提供了一系列中文自然语言处理工具,用户可以使用这些工具对于中文文本进行原创 2020-10-21 22:26:16 · 3829 阅读 · 0 评论 -
王昊奋知识图谱学习笔记--第三讲知识抽取与知识挖掘(下)
第一部分 DeepDive 知识抽取实战注意:iDeepDive 仅支持Liux或者Mac,不支持Windows。1.1 工程组成1.2 先验数据导入1.3 待抽取文章导入1.4 流程1.5 文章数据预处理对文章进行自然语言处理,包括分词、词性标注、命名实体识别等操作。在app.ddlog 中利用nlp.markup.sh 这个脚本去实现NLP的处理,并将内容放入到sentences 表中。1.6 候选实体抽取候选实体对生成关系特征抽取数据标注因原创 2020-10-19 22:36:32 · 465 阅读 · 0 评论 -
王昊奋知识图谱学习笔记--第三讲知识抽取与知识挖掘(上)
第一部分 知识抽取任务1.1 知识图谱数据来源和知识抽取方式知识图谱的数据源分为三种类型:结构化、半结构化和非结构化。结构化数据:链接数据、数据库。针对数据库的知识抽取方法主要是D2R,难点是嵌套表等复杂表数据的处理针对链接数据的知识抽取方法主要是图映射,难点是数据对齐。从开放知识图谱中希望做一个领域知识图谱,一种方便的做法是图映射,基于自己领域知识图谱中定义的schema, 就需要有开放知识图谱与自己领域知识图谱的数据对齐。半结构化数据:网页中的表格、列表、百科中的信息。针对半结构原创 2020-10-18 21:57:26 · 2456 阅读 · 0 评论 -
RDF、RDFS和OWL之间的关系
RDF是一种数据模型,定义了知识图谱的图结构,以主谓宾三元组的形式来进行表示。它是一个自底向上的、以数据驱动而形成的知识图谱。RDF 有很多序列化的方法,主要有RDFS、OWL、N-Triples、JSON-LD等。这些方法也会表示成三元组的形式,它们与RDF的区别是它们会对谓语和宾语做预定义的词汇。举例如下:当主谓宾三元组中的谓语是rdf:type,表示资源是一个类的实例。如 xiaoming rdf:type Person当谓语是rdfs:subClassOf 时,表示资源是一个类的子类。如 P原创 2020-10-17 11:27:53 · 2748 阅读 · 0 评论 -
王昊奋知识图谱学习笔记--第二讲知识表示与知识建模
知识表示语言 RDF / RDFSRDF 资源描述框架Resource:资源;Description:属性、特征、关系;Framework:框架、语言和描述的语法。RDF 中,知识总是以三元组(triple)形式出现: 主+谓+宾举例说明:将一条语句,转换为两条三元组。RDF 可以被看做一个图。在RDF三元组中,三元组的主谓宾都有一个全局标识URI。RDFS 和 RDF 的区别是RDFS 预定义了一些词汇。基于这些词汇可以形成更丰富的三元组关系,并实现一定程度的推理。即使没有s原创 2020-10-16 19:57:39 · 1196 阅读 · 0 评论 -
王昊奋知识图谱学习笔记--第一讲知识图谱概述
从链接文本到链接数据事物的类型很多,一个人、一本书、一个抽象的概念。都可以是作为事物。同时事物之间有多种类型的连接。一个节点代表实体,边表示实体的属性或者实体与实体间的关系。知识图谱,由谷歌首先提出这个概念,用于语义搜索。...原创 2020-10-15 18:48:17 · 1384 阅读 · 2 评论
分享