python如何分析高频词_python数据分析高频词提取,pyecharts词云制作并保存

import pandas as pd

import jieba

import jieba.analyse

filename = "E:\\数据处理\\隐患类型.txt"

#载入数据

df_data = pd.read_csv(filename, header=0, encoding=‘gbk‘, dtype=str)#DataFrame

#去重并转换为list

ls_data = df_data.drop_duplicates().values.tolist()#df_data.values为array类型

ls_data = ";".join([str(j) for i in ls_data for j in i])#将列表元素转换为一个字符串,供lcut函数使用

print(ls_data)

seg_list = jieba.lcut(ls_data, cut_all=False, HMM=True) # 精确切割模式(默认为精确模式)

seg = ‘/‘.join(seg_list)#str类型

#关键词抽取

tags = jieba.analyse.extract_tags(seg, topK=300, withWeight=True, allowPOS=(‘ns‘, ‘n‘, ‘vn‘, ‘v‘),)

import pyecharts.options as opts

from pyecharts.charts import WordCloud

def wordcloud():

g = WordCloud()

g.add(series_name="热点分析", data_pa

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值