知识图谱学习笔记
野生胡萝卜
这个作者很懒,什么都没留下…
展开
-
知识图谱简介
知识图谱:把复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制而显示出来,展现学科的核心结构、发展历史、前沿领域及整体知识框架。 人的大脑依赖所学的知识进行思考、逻辑推理、理解语言,机器学习更多强调技术和算法,更多表现于基于大数据的学习能力,能够在视频、音频等各种形式的信息中表现出来很强的感知、识别、判断能力;知识图谱能提供更强大的推理能力,这种推理能力可能基于事先定义好的规则,也可能基于数...原创 2019-09-10 11:05:31 · 407 阅读 · 0 评论 -
知识提取
知识提取的主要任务就是构建知识图以及生成图节点之间的关系,具体的子任务有:实体名提取、语义类提取、属性和属性值提取和关系抽取等。实体名提取也叫命名实体识别,语义类提取是指从文本中自动抽取信息来构造语义类并建立实体和语义类的关联。属性提取的任务是为每个语义类构造属性列表(如城市的属性包括面积、人口、所在国家等),而属性提取值则为一个语义类中所包含的实体(如北京)附加属性值(如其面积、人口、所在国家等...原创 2019-09-11 21:23:41 · 464 阅读 · 0 评论 -
包装器简介
包装器定义:包装器是一个能够将数据从HTML网页中抽取出来,并且将他们还原为结构化的数据的软件程序。 包装器归纳是基于有监督学习的,他从标注好的训练样例集合中学习数据抽取规则,用于从其他相同标记或相同网页模板抽取目标数据。 1、网页清洗:有些网页结构不规范,例如前后标签不对称,没有结束标签符。不规范的网页结构容易在抽取的过程中抽取的过程中产生噪声。清洗可以用tidy来完成。 2、网页标注:网页...原创 2019-09-14 23:49:24 · 3157 阅读 · 0 评论