【数据应用案例】知识图谱技术与应用指南

案例来源:@机器之心

1. 知识图谱
1)包含实体与实体间关系
2)实体与关系可以有属性
3)学界常采用RDF三元组存储(如Jena),缺点是难以表达实体的属性;业界常用图存储数据库(如Neo4j、OrientDB、JanusGraph),可以表达实体和关系的属性,同时利于检索
4)知识抽取过程
a. 命名实体识别
b. 实体间关系识别
c. 实体统一
d. 指代消解(如他她它)

2. 金融知识图谱搭建:业务理解与知识图谱的设计非常重要
1)定义具体业务问题:如金融领域的欺诈。注意如果要使用知识图谱而不是传统数据库,要考虑几个问题:
a. 有强烈的可视化需求
b. 经常涉及深度的关系搜索
c. 对关系查询有实时性要求
2)数据收集与预处理:内部信息源与外部数据,外部一般需要做实体识别和关系识别等处理
3)知识图谱设计
a. 业务原则:图谱能反映业务逻辑
b. 分析原则:
c. 效率原则:知识图谱尽量轻化,一些关系不大、分析时使用较少的属性可以放在传统数据库中。可以把知识图谱和传统数据库的关系看成内存与硬盘的关系
d. 冗余原则
4)上层应用开发:主要有两类,一类是基于规则的,一类是基于概率的
a. 基于规则的方法论
i1. 不一致性检查:找出潜在矛盾点,如两个人的公司电话是相同的,但是公司却不同
i2. 基于规则的特征提取:如“申请人的二度实体里有多少进了黑名单”
i3. 基于模式的判断:通过一些模式找出可能存在风险的子图(如团伙欺诈)。可以根据共享的实体数量定义团伙,也可以定义强连通子图为团伙
b. 基于概率的方法论:如社区挖掘、标签传播、聚类
c. 基于动态网络的分析:知识图谱网络在T到T+1时刻发生了显著变化,可能蕴含着风险信息

3. 知识图谱在其它领域的应用
1)教育领域:根据学习路径构建知识网络,帮助学生制定个性化培养方案
2)证券领域:我们经常关心“A事件发生会影响哪些公司的股价”,可以用知识图谱回答哪些公司会受到影响

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值