学习目标
1.掌握数据结构分析,索引操作及高级索引;
2.掌握算术运算符与数据对齐,数据排序;
3.掌握读写数据操作;
4.掌握统计计算与描述,层次化索引。
学习内容:
1.pasdas的数据结构分析
Pandas中有两个主要的数据结构:Series和DataFrame。
Series是一维的数据结构。Series是一个类似一维数组的对象,它能够保存任何类型的数据,主要由一组数据和与之相关的索引两部分构成。
值得注意的是:Series的索引位于左边,数据位于右边。
index | element |
---|---|
0 | 1 |
1 | 2 |
2 | 3 |
3 | 4 |
4 | 5 |
构造方法创建:
DataFrame是二维的,表格型的数据结构。DataFrame是一个类似于二维数组或表格(如excel)的对象,它每列的数据可以是不同的数据类型。在获取DataFrame的一列数据时,推荐使用列索引的方式完成,主要是因为在实际使用中,列索引的名称中很有可能带有一些特殊字符(如空格),这时使用“点字符”进行访问就显得不太合适了
DataFrame的索引不仅有行索引,还有列索引,数据可以有多列。
DatFrame index columns a b
0 x x 1 x x 3 x x 4 x x 5