numpy:一个多位数组处理工具类库
matplotlib:数据绘图工具类库
定义数据 numpy数据
定义子图 subplots
画图:plot scatter
显示
样式定义:import matplotlib as mpl
mpl.stule.use('classic')#经典样式
bar:条型图
hist:柱型图
上列都是说明数据的变化
boxplot:箱型图(分析数据分布情况)
pie:饼型图(此说明的数据每个分类占比)
pandas:是一个数据分析的类库
数据结构有以下两种
第一个:series 是一个一维的ndarray
特点是:带有标签,可以使用标签作为索引
尺度不能改变,里面数据可以改变
第二个:dataframe 是一个二维的ndarray
特点是:带标签,可以同行列标签索引,尺度可变,数据可变
数据访问和变化及统计
切片用到了iloc
访问里面要学会的操作:select、where、
limit(loc(以标签索引)、iloc(以下标索引))
groupby
数据展示
series:数据类型只有一种因为是一维的
dataframe:是二维的有多种其中dtypes是取得每一列的数据类型
数据可以读入的有:read_json、HTML、CSV、Excel、SQL
数据写出是:to_json、csv、excel,sql、html
matplotlib:数据绘图工具类库
定义数据 numpy数据
定义子图 subplots
画图:plot scatter
显示
样式定义:import matplotlib as mpl
mpl.stule.use('classic')#经典样式
bar:条型图
hist:柱型图
上列都是说明数据的变化
boxplot:箱型图(分析数据分布情况)
pie:饼型图(此说明的数据每个分类占比)
pandas:是一个数据分析的类库
数据结构有以下两种
第一个:series 是一个一维的ndarray
特点是:带有标签,可以使用标签作为索引
尺度不能改变,里面数据可以改变
第二个:dataframe 是一个二维的ndarray
特点是:带标签,可以同行列标签索引,尺度可变,数据可变
数据访问和变化及统计
切片用到了iloc
访问里面要学会的操作:select、where、
limit(loc(以标签索引)、iloc(以下标索引))
groupby
数据展示
series:数据类型只有一种因为是一维的
dataframe:是二维的有多种其中dtypes是取得每一列的数据类型
数据可以读入的有:read_json、HTML、CSV、Excel、SQL
数据写出是:to_json、csv、excel,sql、html