- 博客(4)
- 资源 (1)
- 收藏
- 关注
原创 使用wordcloud库生成词云
一、基本框架1.配置对象参数w = wordcloud.WordCloud(<参数>)参数描述width指定词云对象生成图片的宽度,默认400像素height制定词云对象生成图片的高度,默认200像素min_font_size制定词云中字体的最小字号,默认4号max_font_size指定词云中字体的最大字号,根据高度自动调节f...
2019-03-13 13:24:57 5040
原创 使用Python进行英文词频统计
对一篇英文文章进行词频统计重点在于内容去噪和归一化,可用split()进行分词。本文以《飘》为例,统计词频最高的前十位。1.读取文件,通过lower()、replace()函数将所有单词统一为小写,并用空格替换特殊字符。def gettext(): txt = open("piao.txt","r",errors='ignore').read() txt = txt.lower...
2019-03-11 16:54:42 26721 3
原创 使用jieba(中文分词)库统计词频
一、 基本框架以统计水浒传人物出场次数为例,列出出场次数最高的前三名。import jieba #引用中文分词库txt = open("shuihu.txt","r",encoding="gb18030").read() #读取文件,注意编码excludes = {"两个","一个"} #通过不断优化排除结果中
2019-03-10 23:46:48 6034 2
原创 用matplotlib库进行数据可视化的基本框架
1.导入绘图模块import matplotlib.pyplot as plt2.解决中文显示、负号显示问题plt.rcParams['font.sans-serif'] =['SimHei'] plt.rcParams['axes.unicode_minus'] = False3.构建数据x = range(5)y = [1123,2345,5435,6743,4353]4...
2019-03-08 18:15:39 311
《谁说菜鸟不会数据分析》(入门篇)
2019-04-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人