python如何做词频统计？

最新推荐文章于 2023-06-23 08:35:07 发布

阿P的哲学

最新推荐文章于 2023-06-23 08:35:07 发布

阅读量1k

点赞数

分类专栏：统计词频文章标签： python 自动化统计词频

本文链接：https://blog.csdn.net/wydyzq12/article/details/122900138

版权

统计同时被 2 个专栏收录

1 篇文章 0 订阅

订阅专栏

词频

1 篇文章 0 订阅

订阅专栏

#词频统计
# -*- coding: utf-8 -*-
# coding=utf-8

import jieba
import jieba.analyse

# text = "
赛琪冬款全场5折 春装8.8折 


双星全场春款8.5折


冠军冬款3折春装5折


乔丹冬款五折起，春款全部8.5折


森马冬款六点五折，春款8.8折


元宵节
吉普盾休闲外套特惠129元
羽绒服原价799元特惠299元


李宁疯狂抢购3天全场鞋服4.9折起

赛琪冬款全场5折 春装8.8折 


双星全场春款8.5折


冠军冬款3折春装5折


乔丹冬款五折起，春款全部8.5折


森马冬款六点五折，春款8.8折


元宵节
吉普盾休闲外套特惠129元
羽绒服原价799元特惠299元


李宁疯狂抢购3天全场鞋服4.9折起

赛琪冬款全场5折 春装8.8折 


双星全场春款8.5折


冠军冬款3折春装5折


乔丹冬款五折起，春款全部8.5折


森马冬款六点五折，春款8.8折


元宵节
吉普盾休闲外套特惠129元
羽绒服原价799元特惠299元


李宁疯狂抢购3天全场鞋服4.9折起

赛琪冬款全场5折 春装8.8折 


双星全场春款8.5折


冠军冬款3折春装5折


乔丹冬款五折起，春款全部8.5折


森马冬款六点五折，春款8.8折


元宵节
吉普盾休闲外套特惠129元
羽绒服原价799元特惠299元


李宁疯狂抢购3天全场鞋服4.9折起

赛琪冬款全场5折 春装8.8折 


双星全场春款8.5折


冠军冬款3折春装5折


乔丹冬款五折起，春款全部8.5折


森马冬款六点五折，春款8.8折


元宵节
吉普盾休闲外套特惠129元
羽绒服原价799元特惠299元


李宁疯狂抢购3天全场鞋服4.9折起

赛琪冬款全场5折 春装8.8折 


双星全场春款8.5折


冠军冬款3折春装5折


乔丹冬款五折起，春款全部8.5折


森马冬款六点五折，春款8.8折


元宵节
吉普盾休闲外套特惠129元
羽绒服原价799元特惠299元


李宁疯狂抢购3天全场鞋服4.9折起

赛琪冬款全场5折 春装8.8折 


双星全场春款8.5折


冠军冬款3折春装5折


乔丹冬款五折起，春款全部8.5折


森马冬款六点五折，春款8.8折


元宵节
吉普盾休闲外套特惠129元
羽绒服原价799元特惠299元


李宁疯狂抢购3天全场鞋服4.9折起
"
text = ''
#jieba.load_userdict("jieba_dict.txt")  # 用户自定义词典 （用户可以自己在这个文本文件中，写好自定制词汇）
f = open('0212.txt', 'r', encoding='utf8')  # 要进行分词处理的文本文件 (统统按照utf8文件去处理，省得麻烦)
lines = f.readlines()
for line in lines:
    text += line

# seg_list = jieba.cut(text, cut_all=False)  #精确模式（默认是精确模式）
seg_list = jieba.cut(text)  # 精确模式（默认是精确模式）
print("[精确模式]: ", "/ ".join(seg_list))

# seg_list2 = jieba.cut(text, cut_all=True)    #全模式
# print("[全模式]: ", "/ ".join(seg_list2))

# seg_list3 = jieba.cut_for_search(text)    #搜索引擎模式
# print("[搜索引擎模式]: ","/ ".join(seg_list3))

tags = jieba.analyse.extract_tags(text, topK=5)
print("关键词:    ", " / ".join(tags))

阿P的哲学

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python如何做词频统计？

#词频统计# -*- coding: utf-8 -*-# coding=utf-8import jiebaimport jieba.analyse# text = "赛琪冬款全场5折春装8.8折双星全场春款8.5折冠军冬款3折春装5折乔丹冬款五折起，春款全部8.5折森马冬款六点五折，春款8.8折元宵节吉普盾休闲外套特惠129元羽绒服原价799元特惠299元李宁疯狂抢购3天全场鞋服4.9折起赛琪冬款全场5折春装8.8折双星全场春款8.
复制链接

扫一扫

专栏目录