python使用jieba库实现关键词提取的方法主要分为两种:
第一种,使用extract_tags方法:
keywords = jieba.analyse.extract_tags(text, topK=5)
第二种,使用textrank方法:
keywords = jieba.analyse.textrank(text, topK=5)
其中text为与分析的文本,topK为输出的关键词数量
具体代码如下:
import jieba.analyse
def analyse(text, id):
# kwords = jieba.analyse.extract_tags(text, topK=5)
# print(kwords)
keywords = jieba.analyse.textrank(text, topK=5)
keys = ''
for keyword in keywords:
keys += keyword + ' '
try:
updatekeyword(keys, id)
print('更新成功',id,keys)
except:
print('更新失败',id)
if __name__ == '__main__':
texts = selectintroduction()//该处我读取的数据库数据
for text in texts:
try:
analyse(text['introduction'],text['id'])
except:
print('Error!')
标签:__,jieba,提取,python,text,关键词,analyse,topK,id
来源: https://www.cnblogs.com/yuanxiaochou/p/12489690.html