pandas下——进阶学习

该篇博客详细介绍了pandas中处理缺失数据的方法,包括缺失值的运算与分组、填充与剔除、插值等。此外,还探讨了文本数据的处理,如字符串类型的区别、拆分与拼接、替换等。同时,讲解了分类数据的创建和结构。最后,涉及到时序数据的创建、索引属性以及重采样和窗口函数的应用。通过端午节淘宝粽子交易和墨尔本气温数据举例,提供实战练习。
摘要由CSDN通过智能技术生成

  6、缺失数据

缺失观测及其类型:了解缺失信息、三种缺失符号、Nullable类型与NA符号、NA的特性、convert_dtypes方法

缺失数据的运算与分组:加号与乘号规则、groupby方法中的缺失值

填充与剔除:fillna方法、dropna方法

插值:线性插值、高级插值方法、interpolate中的限制参数

 

 

 

【问题⼀】 如何删除缺失值占比超过25%的列

【问题⼆】什么是Nullable类型?请谈谈为什么要引入这个设计

【问题三】对于一份有缺失值的数据,可以采取哪些策略或方法深化对它的了解?

  7、文本数据

  • string类型的性质:string与object的区别;string类型的转换
  • 拆分与拼接:str.split方法;str.cat方法
  • 替换:str.replace的常见方法
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值