TASK01|pandas基础

pandas中与库版本或依赖库版本相关的API主要有以下4个:
pandas.version:查看pandas简要版本信息。
pandas.git_version:查看pandasgit版本信息。
pandas._version.get_versions():查看pandas详细版本信息。
pandas.show_versions():查看pandas及其依赖库的版本信息。

汇总

head, tail 函数分别表示返回表或者序列的前 n 行和后 n 行,其中 n 默认为5
info, describe 分别返回表的 信息概况 和表中 数值列对应的主要统计量

特征统计

sum, mean, median, var, std, max, min特征函数
quantile, count, idxmax 这三个函数,它们分别返回的是分位数、非缺失值个数、最大值对应的索引

唯一值

unique 和 nunique 可以分别得到其唯一值组成的列表和唯一值的个数
value_counts 可以得到唯一值和其对应出现的频数
观察多个列组合的唯一值,可以使用 drop_duplicates

  • keep ,默认值 first 表示每个组合保留第一次出现的所在行,
  • last 表示保留最后一次出现的所在行,
  • False 表示把所有重复组合所在的行剔除

duplicated 和 drop_duplicates 的功能类似

替换

三类替换:映射替换、逻辑替换、数值替换

  • 映射替换:
    包含 replace 方法、
    第八章中的 str.replace 方法
    第九章中的 cat.codes 方法

    • replace:
      通过字典构造,或者传入两个列表
      method参数为ffill用前面一个最近的未被替换的值进行替换
      method参数为bfill使用后面最近的未被替换的值进行替换

正则替换 str.replace

逻辑替换包括了 where 和 mask ,这两个函数是完全对称的: where 函数在传入条件为 False 的对应行进行替换,而 mask 在传入条件为 True 的对应行进行替换,当不指定替换值时,替换为缺失值。

在这里插入图片描述

在这里插入图片描述
df.info()
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
填充缺失值
fillna()
interpolate()插值
pandas其实自带一个很强大的插值函数:interpolate。interpolate可以用在DataFrame对象上,也可以用在Series对象上。

在这里插入图片描述
在这里插入图片描述
转换为首字母大写
capitalize()
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

http://joyfulpandas.datawhale.club/Content/ch2.html#id9

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值