Pandas-1.介绍
Pandas介绍
封装了matplotlib, 和 numpy。
有三种 数据格式。Dataframes
Dataframes
1. 创建
- . 普通创建
pd.DataFrame(data=None, index=None, columns=None) - . 创建日期
2. 属性
- . 对象.shape
- . 对象.index
- . 对象.columns
- . 对象.values
- . 对象.T
- . 对象.head()
- . 对象.tail()
3. 设置索引
- 修改行列索引
必须整行或整列的修改 - 重设索引(从其他列选一个当索引)
对象.reset_index() - 设置新索引
对象.set_index()
如果设置的索引有两个,那么就是multiIndex
MultiIndex 和Panel
- 做了解即可
1.MultiIndex
- 两个或多个索引的是MultiIndex
- 获取inde 的方法
对象.index
对象.index.names
Series
1. 创建
通过ndarray 创建,也可以通过索引创建,通过字典创建
2. 属性
- 对象.index
- 对象.values
总结
Dataframes 对比二维数组
Series 对比一维数组
MultiIndex 对比三维数组
前一天的总结
常见图形汇总
1. 折线图
plt.plot()
2. 散点图
plt.scatter()
散布规律
3. 柱状图
plt.bar()
4. 直方图
plt.hist()
5. 饼图
plt.pie()
Numpy
N维数组-ndarray
1. ndarray 的属性
ndarray.shape
ndarray.ndim
ndarray.size
ndarray.itemsize
ndarray.dtype
2. 生成数组的方法
1. 0 和1 的数组
np.ones()
np.ones_like()
2. 现有数组中生成
np.array -- 深拷贝
np.asarray -- 浅拷贝
3. 生成固定范围的数组
np.linspace()
nun -- 生成等间隔的多少个
np.arange()
step -- 每间隔多少生成一个
np.logspace()
生成10 的n次幂
4. 生成随机数组
均匀分布 np.random.uniform()
正态分布 np.random.normal()