数据分析篇
1 数据分析和环境介绍
1.1什么是数据分析
数据分析:是用适当的方法对收集来的大量数据进行分析,帮助人们作出判断,以便采取适当行动
1.2 jupyter notebook
一些简单操作:
cmd-jupyter notebook
new python3文件
2 Matplotlib
2.1 Matplotlib介绍
最流行的Python底层绘图库,主要做数据可视化图表,名字取材于MATLAB,模仿MATLAB构建
2.2 Matplotlib基础操作(折线图为例)
首先绘制简单无信息折线图:
from matplotlib import pyplot as plt
x = range(2, 26, 2)
y = [15, 13, 14.5, 17, 20, 25, 26, 26, 24, 22, 18, 15]
plt.plot(x, y)
plt.show()
接下来我们希望实现如下操作:
2.2.1.设置图片大小
figure图形图标的意思,在这里指的就是我们画的图
通过实例化一个 figure并且传递参数,能够在后台自动使用该作figure实例
在图像模糊的时候可以传入dpi(每英寸上点的个数)参数,让图片更加清晰
fig = plt.figure(figsize=(50, 10), dpi=80)
2.2.2.保存图片到本地
保存格式有很多:png,svg(矢量图)…
plt.savefig("./t1.svg")
plt.savefig("./t2.png")
2.2.3.调整x或者y的刻度的间距
注意用xticks设置的刻度,只有设置范围内有刻度,非设置范围内不会有刻度
(1)直接以x的坐标间隔为横坐标
plt.xticks(x)
(2)可以自己建一个label,来表示横坐标的间隔
x_labels = [i/2 for i in range(0, 60)]
# x_labels=[0,0.5,1,1.5.....30]
plt.xticks(x_labels)
(3)用断间隔的方式去处理X也可以
plt.xticks(x[::2])
(4)如果要把新的label和原来的x对应:
x_labels = [i/2 for i in range(0, 12)]
plt.xticks(x,x_labels)
这样的话其中的x的横坐标显示会变成x_labels(x和x_label要对应关系)
2.2.4 转换matplotlib界面显示为中文
ctrl+B查看函数源码
方法1:
import matplotlib
font = {
'family': 'Microsoft Yahei',
'weight': 'bold',
'size': '10'}
matplotlib.rc("font", **font)
方法2:
import matplotlib
matplotlib.rc("font", family