python如何做词频统计?

#词频统计
# -*- coding: utf-8 -*-
# coding=utf-8

import jieba
import jieba.analyse

# text = "
赛琪冬款全场5折 春装8.8折 


双星全场春款8.5折


冠军冬款3折春装5折


乔丹冬款五折起,春款全部8.5折


森马冬款六点五折,春款8.8折


元宵节
吉普盾休闲外套特惠129元
羽绒服原价799元特惠299元


李宁疯狂抢购3天全场鞋服4.9折起

赛琪冬款全场5折 春装8.8折 


双星全场春款8.5折


冠军冬款3折春装5折


乔丹冬款五折起,春款全部8.5折


森马冬款六点五折,春款8.8折


元宵节
吉普盾休闲外套特惠129元
羽绒服原价799元特惠299元


李宁疯狂抢购3天全场鞋服4.9折起

赛琪冬款全场5折 春装8.8折 


双星全场春款8.5折


冠军冬款3折春装5折


乔丹冬款五折起,春款全部8.5折


森马冬款六点五折,春款8.8折


元宵节
吉普盾休闲外套特惠129元
羽绒服原价799元特惠299元


李宁疯狂抢购3天全场鞋服4.9折起

赛琪冬款全场5折 春装8.8折 


双星全场春款8.5折


冠军冬款3折春装5折


乔丹冬款五折起,春款全部8.5折


森马冬款六点五折,春款8.8折


元宵节
吉普盾休闲外套特惠129元
羽绒服原价799元特惠299元


李宁疯狂抢购3天全场鞋服4.9折起

赛琪冬款全场5折 春装8.8折 


双星全场春款8.5折


冠军冬款3折春装5折


乔丹冬款五折起,春款全部8.5折


森马冬款六点五折,春款8.8折


元宵节
吉普盾休闲外套特惠129元
羽绒服原价799元特惠299元


李宁疯狂抢购3天全场鞋服4.9折起

赛琪冬款全场5折 春装8.8折 


双星全场春款8.5折


冠军冬款3折春装5折


乔丹冬款五折起,春款全部8.5折


森马冬款六点五折,春款8.8折


元宵节
吉普盾休闲外套特惠129元
羽绒服原价799元特惠299元


李宁疯狂抢购3天全场鞋服4.9折起

赛琪冬款全场5折 春装8.8折 


双星全场春款8.5折


冠军冬款3折春装5折


乔丹冬款五折起,春款全部8.5折


森马冬款六点五折,春款8.8折


元宵节
吉普盾休闲外套特惠129元
羽绒服原价799元特惠299元


李宁疯狂抢购3天全场鞋服4.9折起
"
text = ''
#jieba.load_userdict("jieba_dict.txt")  # 用户自定义词典 (用户可以自己在这个文本文件中,写好自定制词汇)
f = open('0212.txt', 'r', encoding='utf8')  # 要进行分词处理的文本文件 (统统按照utf8文件去处理,省得麻烦)
lines = f.readlines()
for line in lines:
    text += line

# seg_list = jieba.cut(text, cut_all=False)  #精确模式(默认是精确模式)
seg_list = jieba.cut(text)  # 精确模式(默认是精确模式)
print("[精确模式]: ", "/ ".join(seg_list))

# seg_list2 = jieba.cut(text, cut_all=True)    #全模式
# print("[全模式]: ", "/ ".join(seg_list2))

# seg_list3 = jieba.cut_for_search(text)    #搜索引擎模式
# print("[搜索引擎模式]: ","/ ".join(seg_list3))

tags = jieba.analyse.extract_tags(text, topK=5)
print("关键词:    ", " / ".join(tags))

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值