动手学数据分析,首次笔记

动手学数据分析

载入数据

相对路径

在ipynb文件的相对路径下载入数据,比如在同级目录下,直接输入文件名就可以导入。

绝对路径

数据文件在计算机中的路径。MacOS下的绝对路径技巧:右键文件的info,然后复制文件位置,最后加上文件名即可

如何在mac系统中获得绝对路径

如何在mac系统中获得绝对路径
在这里插入图片描述

逐块提取数据的功能

时数据的尺寸非常大,计算机的内存不一定能同时处理整个文件,所以要使用逐块提取数据:设置一个size,每次提取这个size的数据,完成遍历后,组成一个完成的数据文件
chunker的数据结构类似数组,打印出来后是根据size均分的数个数组组成的数据文件

指定提取数据

读取特定的行与列

提取前n行
在这里插入图片描述
提取n+1~n+1+m行

在这里插入图片描述
指定某行
在这里插入图片描述

修改DataFrame的列名

在载入时修改:

df = pd.read_csv(‘文件名’,names=[‘要改的表名’, … ], indexCol=‘主索引键列名’,header=0)

在载入后修改

在这里插入图片描述

查看df的基本信息

在这里插入图片描述

查看指定行数信息

前n行:df.head(n)
后n行:df.tail(n)
head是头,tail是尾巴

中间行,可以使用切片

iloc在这里插入图片描述
索引:df[n:m]
此结构为左闭右开
在这里插入图片描述

查看空数据

判断空数据,返回true
在这里插入图片描述
判断整个表是否有空
在这里插入图片描述
判断哪些列有空
在这里插入图片描述
统计列的空值个数
在这里插入图片描述
统计所有空值的个数(也可以用.sum().sum()
在这里插入图片描述
打印有空值的rows
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值