TextGrapher:基于图谱方式的语义挖掘表示代码解读

前言

源码:https://github.com/liuhuanyong/TextGrapher

代码不是笔者写的,这里仅对上述大佬的代码进行一个解读,做一下笔记,便于后续学习,有任何问题,大家还是直接拜读大佬的源代码。

本代码的功能:

从一篇文档中根据多种关系抽取信息,最后以知识图谱的形式在浏览器中显示该种关系

文本挖掘方面需要包:pyltp

pyltp包使用说明:自然语言处理pyltp(词性标注、命名实体识别、角色标注等)_Seeklhy的博客-CSDN博客_pyltp命名实体识别

pyltp包下载:pyltpwheel安装包(含py35,py36).zip_pyltpwheel-其它代码类资源-CSDN下载

关于ltp 编译好的安装包:

链接:https://pan.baidu.com/s/12uqQmz3x0QeaLKeZFQwT2Q 
提取码:bw6i 

先看一下最终效果:

输入文本

5月22日,据纽约时报报道,特朗普政府正在考虑将中国监控巨头海康威视(002415)列入黑名单,限制其购买美国技术。上述报道称,海康威视是全球最大的视频监控产品制造商之一。

对此,海康威视董秘黄方红在朋友圈发布消息称,已关注到纽约时报今早的报道,期望公司得到公平、公正的对待。

黄方红表示:海康威视是一家商业公司,我们恪守商业公司的本分。公司未曾因前述报道提及的所谓问题受到任何政府、任何相关机构等的调查取证,也未有海外媒体就该问题向海康威视进行全面的、深入的核实真实情况。海康威视是一家产品供应商,我们未做过前述报道提及的不恰当行为。公司已主动聘请美国专业人士对公司相关业务进行独立审查,专业人士将在获得充分的证据后,回应海外各相关方的关注。

黄方红称,海康威视是全球安防行业的龙头,我们的成就是依赖全球34000名员工坚韧不拔的努力获得的。十八年来,海康威视坚守工匠精神,持续以技术创新驱动业务发展,以专业厚实、诚信正直的品德赢取信任,我们珍视每一个国家和地区的客户,我们将持之以恒的为客户创造价值。

海康威视官网显示,海康威视是以视频为核心的智能物联网解决方案和大数据服务提供商。海康威视拥有视音频编解码、视频图像处理、视音频数据存储等核心技术,及云计算、大数据、深度学习等前瞻技术,针对公安、交通、司法、文教卫、金融、能源和智能楼宇等众多行业提供专业的细分产品、IVM智能可视化管理解决方案和大数据服务。在视频监控行业之外,海康威视基于视频技术,将业务延伸到智能家居、工业自动化和汽车电子等行业。

挖掘结果:

 代码说明

textrank是一种基于pagerank的算法,很简单,可以看

Textrank算法介绍 - 绽放的四叶草 - 博客园

【NLP】【三】jieba源码分析之关键字提取(TF-IDF/TextRank) - muqiusangyang的个人空间 - OSCHINA - 中文开源技术交流社区

关于pyltp要加载的包,下载地址:ltp-models_免费高速下载|百度网盘-分享无限制

欢迎关注笔者微信公众号,更多trick:

 

  • 5
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值