1、pandas数据读取
通过pandas的read_csv读取csv文件,并通过head函数显示前几行。
通过tail命令显示后几行
显示列名
显示dataframe的大小,总共61行8列
2、索引和计算
1、索引
通过切片取2到6行的数据
取第2,5,10行的数据
通过列名匹配获取列的内容
获取两列的内容
2、计算
对面积和单价进行乘法计算得到总价,由于house_info[‘面积’]的数据内容是str类型,而且含有m²,需要通过lambda以及map函数对每个数据做去除m²操作后,astype改变str类型为float64类型,然后进行乘法运算。
分别对总价进行最大值,最小值,均值计算。其他内置函数可通过help来查看
3、排序
4、处理空值
如果列里有空值,那么计算出来的结果就是nan,如何处理呢?
等同于mean()
5、分类汇总
pivot_table函数来实现
通过dropna函数去掉缺失值的行
通过fillna填充缺失值
定位到83行查看总价
6、处理索引值
排序后索引序号是乱的,如何整理?
7、自定义函数
自定义func函数,然后通过house_info.apply函数调用func
查看每一列空值的数量
8、Series介绍
通过Series函数生成新的series