python根据关键字截取文本_用Python给你的文本提取关键词

 对代码、编程感兴趣的可以关注「老K玩代码」公众号和我交流!

分享代码、经验、项目和资讯

用Python给你的文本提取关键词关键词提取是自然语言处理中常见的业务模块;

要实现关键词提取,Python已经有比较好的现成的开源库可以用,比如我今天要介绍的jieba。

让我们来看看如何进行关键词提取:

1. 导入jieba关键词提取模块

import jieba.analyse as anajieba被较多地应用于中文文本的自然语言处理,最常用到的功能是分词。

但除了分词以外,它还有很多其它api接口给到我们,而今天要提到的关键词提取就是其中之一。

2. 用textrank方法获取关键词

keyword = ana.textrank(sentence)

可选参数说明: - topK: 输出的关键词数量,如果是None则全部关键词都输出; - withWeight: 输出的关键词是否附带textrank计算出来的权重值; - allowPOS: 该参数为列表,表示仅显示符合该参数设置词性的关键词; - withFlag: 输出的关键词是否附带词性;TextRank

-- TextRank算法是利用局部词汇之间关系(共现窗口)对后续关键词进行排序,直接从文本本身抽取。

-- 参考详文: https://www.cnblogs.com/xueyinzhe/p/7101295.html

3. 用tfidf方法获取关键词

keyword = ana.tfied(sentence)

可选参数说明: - topK: 输出的关键词数量,如果是None则全部关键词都输出; - withWeight: 输出的关键词是否附带textrank计算出来的权重值; - allowPOS: 该参

  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值