DataFrame
DataFrame是什么
(有行有列的数据就是df)
- Dataframe简称df、或df数据集
- df = pd.read_csv(’…/xxx.csv’)`返回的是dataframe对象
- dataframe对象是一种特殊的数据结构,和excel中的表格、mysql中的表类似,有行有列
- spark中也有dataframe这种数据结构,二者在如何组织数据这一层面上来说,完全相同
DataFrame的常用API
API:指各种属性、方法、函数;调用他们能够得到我们想要的东西(对象)
- print(df) 展示全部表数据
- df.head(n) 展示n行数据,默认展示5行
- df.shape 获取行列数量
- df.info() 以列为维度,获取数据表的整体统计情况
1 每列有多少数据
2 每列数据是什么样的数据类型,是小数还是整数等待
3 每列数据中是否存在空值
DataFrame局部数据的API(取数)
loc 和iloc(重要)
功能:
- 按行取数据
- 按列取数据
- 按范围取数据
区别:
- loc是根据索引值取数据
- iloc是根据索引序号取数据