自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 资源 (1)
  • 收藏
  • 关注

原创 使用wordcloud库生成词云

一、基本框架1.配置对象参数w = wordcloud.WordCloud(<参数>)参数描述width指定词云对象生成图片的宽度,默认400像素height制定词云对象生成图片的高度,默认200像素min_font_size制定词云中字体的最小字号,默认4号max_font_size指定词云中字体的最大字号,根据高度自动调节f...

2019-03-13 13:24:57 5014

原创 使用Python进行英文词频统计

对一篇英文文章进行词频统计重点在于内容去噪和归一化,可用split()进行分词。本文以《飘》为例,统计词频最高的前十位。1.读取文件,通过lower()、replace()函数将所有单词统一为小写,并用空格替换特殊字符。def gettext(): txt = open("piao.txt","r",errors='ignore').read() txt = txt.lower...

2019-03-11 16:54:42 26570 3

原创 使用jieba(中文分词)库统计词频

一、 基本框架以统计水浒传人物出场次数为例,列出出场次数最高的前三名。import jieba #引用中文分词库txt = open("shuihu.txt","r",encoding="gb18030").read() #读取文件,注意编码excludes = {"两个","一个"} #通过不断优化排除结果中

2019-03-10 23:46:48 6004 2

原创 用matplotlib库进行数据可视化的基本框架

1.导入绘图模块import matplotlib.pyplot as plt2.解决中文显示、负号显示问题plt.rcParams['font.sans-serif'] =['SimHei'] plt.rcParams['axes.unicode_minus'] = False3.构建数据x = range(5)y = [1123,2345,5435,6743,4353]4...

2019-03-08 18:15:39 300

《谁说菜鸟不会数据分析》(入门篇)

《谁说菜鸟不会数据分析》(入门篇)高清全彩pdf电子版。《谁说菜鸟不会数据分析》,是一部由电子工业出版社于2011年6月20日出版的图书,作者是张文霖、刘夏璐、狄松。此书按照数据分析工作的完整流程来讲解。 《谁说菜鸟不会数据分析》适合需要提升自身竞争力的职场新人;在市场营销、金融、财务、人力资源管理中需要作数据分析的人士;经常阅读经营分析、市场研究报告的各级管理人员;从事咨询、研究、分析等专业人士。

2019-04-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除