R语言自动提取新闻摘要的简单实现

本文介绍如何在R语言中实现textRank算法提取新闻摘要。通过jiebaR包和dplyr包,作者成功将python的textRank算法转化为R代码,实现了自动摘要功能,有助于理解和应用textRank算法。
摘要由CSDN通过智能技术生成

之前用R做过一些文本处理的工作,主要就是对新闻做做分类、提取关键词之类的,通过jiebaR包和自定义词典可以轻松地完成大部分工作,分类也就是整理一下各类别的特征然后跑一个分类模型就能得到比较满意的结果,唯独自动生成摘要这块一直没有找到很好的解决方法,没有找到R中现成的工具包。由于写代码能力也比较捉鸡,所以参考了java和python中的代码之后还是无法写出像样的程序出来。于是最终的解决方案就是把文章的前几句话截取出来当成摘要,效果可想而知...

随着对R和python越来越熟悉,并且最近读到了一篇详细讲解python实现textRank算法的文章(你还在被标题党蒙骗吗?是时候试试文本摘要技术了(附源码)),于是动手试了一下将其改成R代码,经过一番“艰苦”的搬运之后终于能在R中实现自动提取摘要的功能了。

textRank算法的原理就不过多介绍了(想了解的可以参考

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值