【机器学习】TextRank transfer from PageRank

最新推荐文章于 2022-06-01 14:49:11 发布

思考实践

最新推荐文章于 2022-06-01 14:49:11 发布

阅读量194

点赞数

分类专栏：人工智能、机器学习、深度学习文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43332715/article/details/120961218

版权

人工智能、机器学习、深度学习专栏收录该内容

106 篇文章 9 订阅

订阅专栏

抽取式TextRank算由PageRank算法发展而来，所以讲解TextRank的时候不得不先学习一下PageRank算法的思想。

看博客都是千篇一律差不多的，就不给大家添乱了，整理了一下资料，方便大家进行学习。

链接1和4涉及代码实现,链接一看到最后才发现调用了一个nx.pagerank（graph）去计算pagerank值（还在想这个函数可以修改参数就变成了textrank了吗，结果看评论也有人遇到我一样的问题了），这个算法没有涉及textrank公式的权重 $Wji$ 的计算，不过也选到了些许东西真是又气又感谢。

中文分词库使用jieba库有三种模式，精准模式、模式、搜索引擎模式非常好用，请参考第5个链接，还有text4rank包，可以通过直接调用text4rank包实现抽取式摘要，这在链接4得到了很好的解读，text4rank还可以分词基于jieba包封装成了一个更高级的api，还有gensim是word2vec工具的一个python实现包，里面包含了skip_gram与cbow的训练和参数解读，还有networkx包一个与图息息相关的包（中途去学习了一下图与矩阵的关系，这是基本的，不然你都不知道别人调着包干嘛），下图为textrank实现抽取式摘要的一个流程，看国内的博客几乎没有能把textrank讲明白的，也花了两天时间自己好好弄了一下，重新讲解一下textrank这里是传送门，第四个链接直接就是github传送门，这部分代码是透明的所有的理论都能在这个仓库里面找到。

参考资料：

TextRank算法详细讲解与代码实现（完整） - 方格田 - 博客园

PageRank算法_黄规速博客:学如逆水行舟，不进则退-CSDN博客_pagerank

机器学习经典算法之PageRank - 程序员姜小白 - 博客园

GitHub - summanlp/textrank: TextRank implementation for Python 3.

What is Gensim?

Gensim入门教程 - 公子天 - 博客园

Gensim简介

Gensim简介_zxhohai的博客-CSDN博客_gensim

Gensim库的使用——Gensim库的核心概念介绍

Gensim库的使用——Gensim库的核心概念介绍_一个小菜鸟的博客-CSDN博客_gensim库

刘建平先生关于gensim包的描述

如何让jieba分词不分开某些词（suggest_freq方法的使用）

如何让jieba分词不分开某些词（suggest_freq方法的使用）_拼命小李博客-CSDN博客

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。