目录
1 概述. 2
2 数据结构:series和dataframe 3
3 数据取值. 4
4 数据操作. 8
5 结构调整. 17
6 统计函数. 19
7 相互关系. 21
8 文件读取. 22
9 数据集操作. 25
10 字符串操作. 28
11 绘图matplot 30
12 时间序列处理. 37
11 绘图matplot
理论:构建一个图像Figure,在其上通过定义坐标轴划分子区域subplot,在坐标轴区域上绘制各种图形。
简化方式:plot(x,y)
支持图形:柱状图bar,直方图hist,折线图plot,散点图scatter,饼图pie,箱形图box。
11.1 matplot二维矩阵:subplots
11.2 matplot样式调整
间距:subplots_adjust
颜色color、线性linestyle、标记marker、图名称set_title。
坐标轴刻度set_xticks、坐标轴刻度标签set_xticklabels、坐标轴名称set_xlabel。
图例:传入label属性,legend(loc=”best”)
注释:可以添加文本、箭头等注释。
图形:可以添加矩形、三角形等图形。
11.3 matplot图表导出:savefig
11.4 Pandas绘图:Plot
11.5 统计图:柱状图、堆叠柱状图、直方图、核密度图、散点图
柱状图:kind=‘bar’。展示数据的大小。
堆叠柱状图:柱状图+stacked=True
直方图hist:数据的分布情况的柱状图。Bins表示要分为几个区段
核密度图:使用数据本身的分布情况yo估计密度。
散点图:呈现两个变量之间关系时最常用的图表。用于快速查看两个变量是否有关系(也就是相关性)。