数据分析
数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。这一过程也是质量管理体系的支持过程。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。
- 数据分析过程
- 数据收集:本地数据或者网络数据的采集与操作.
- 数据处理:数据的规整,按照某种格式进行整合存储。
- 数据分析:数据的科学计算,使用相关数据工具进行分析。
- 数据展现:数据可视化,使用相关工具对分析出的数据进行展示。
matplotib
最流行的Python底层绘图库,主要做数据可视化图表,名字取材于MATLAB,模仿MATLAB构建
导入
- from matplotlib import pyplot as plt
设置图片大小
- fig = plt.figure(figsize=(20,8), dpi = 150)
设置x轴 y轴
绘图
- (调用多次的话是绘制多个图片)
- plt.plot(x,y)
图形样式
- 标题 label
- 颜色 color
- 线条风格 linestyle
- 线条粗细 linewidth
- 透明度 alpha
设置x/y轴刻度
- plt.xticks
- 调整间距: 可以传递步长合适的可迭代对象
- 比如 刻度 字符串 稀疏/密集 等参数可以传递
- 可以用for循环传入字符串 format
保存图片
- plt.savefig(保存路径)
展示图像
- plt.show()
添加图像的描述信息
- 设置中文字体
- 第一种方法是百度找直接默认好的
- 第二种
- 设置标题
- label ( title 标题, xlabel x轴标题, ylabel y轴标题 )
- 设置网格
- plt.grid( alpha= 0.4, linestyle= )
- 图例
- plt.plot(lebel= , prop= 图例的字体, loc= 图例的位置)
matplotlib
matplotlib能够绘制折线图,散点图,柱状图,直方图,箱线图,饼图
-
折线
- 特点:能够显示数据的变化趋势,反映事物的变化情况。(变化)
-
直方图 plt.hist(a, num_bins, normed=1/true 频率直方图 默认为频数)
- 特点:绘制连续性的数据,展示一组或者多组数据的分布状况(统计)
- a是数据 bum_bins 分多少组
-
条形图plt.bar 竖形 plt.barh 横形
- 特点:绘制连离散的数据,能够一眼看出各个数据的大小,比较数据之间的差别。(统计)
-
散点图:plt.scatter(x,y)
特点:判断变量之间是否存在数量关联趋势,展示离群点(分布规律)
matplotlib常见问题总结
- 应该选择那种图形来呈现数据
- matplotlib.plot(x,y)
- matplotlib.bar(x,y)
- matplotlib.scatter(x,y)
- matplotlib.hist(data,bins,normed)
- xticks和yticks的设置
- label和titile,grid的设置
- 绘图的大小和保存图片