【手撕 - 自然语言处理】手撕 TextRank(03)我自己实现的 C++ 版

作者LogM分享了自己基于TextRank算法的C++实现,旨在遵循原论文思路,追求代码简洁及优化计算速度。文中提到,为适应不同输入和兼容旧编译器,代码简洁度有所牺牲。项目灵感来源于letiantian、comoody和lostfish的代码,提供了优化的中文处理、图构建和PageRank实现。项目源码可在作者的Github上找到,需要注意特定的字符串处理函数需替换或自定义实现。
摘要由CSDN通过智能技术生成

作者:LogM

本文原载于 https://segmentfault.com/u/logm/articles ,不允许转载~

1. 概述

TextRank 论文地址: https://www.aclweb.org/anthology/W04-3252

上一篇博客 TextRank C++ 版本 提到,两位大佬的代码还有改进空间,所以我自己也实现了一个版本。

2. 致谢

首先要非常感谢3位大佬,我的代码是借鉴了他们3人的代码实现的。

主要借鉴的点:letiantian 对中文的处理;comoody 对图的构建;lostfish 对 PageRank 的实现。

letiantian: https://github.com/letiantian/TextRank4ZH.git

comoody: https://github.com/comoody/TextRank.git

lostfish: https://github.com/lostfish/textrank.gi

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值