- 索引对齐特性!!在用dataframe的列计算时,一定要注意,犯过多次错误了
- 列的删除:drop del pop
一定要注意是否改变了原dataframe
drop设置inplace=True,其他两个是在原df上修改,且pop会返回删除的内容 - 增加新列:直接/assign(小心索引,不会改变原df)
- 根据类型选择列select_dtype
- Series转df
s.name=‘to_DataFrame’
s.to_frame() - .T .head .tail .head(n) .nunique(查唯一值的个数)
- .unique(显示出所有的唯一值)
- .count(返回缺失值个数)
- .value_counts(每个元素有多少)
- .info(有哪些列,有多少非缺失值,每列的类型)
- .describe(统计数字类型数据的各个统计量,包括均值,四分点,标准差,自行选择分位数等)
- .idxmax 返回最大值索引
- .nlargest(m)返回前几个最大元素值.nsmallest
- .clip(m,n)对超过m低于n的数进行截断
- .mad平均绝对偏差
- replace(用字典格式修改)
- apply!!不仅仅是数学函数,还可以改格式
- 排序:索引排序.sort_index(),值排序.sort_values(by=[])
pandas小白学习day3
最新推荐文章于 2024-06-02 19:37:58 发布