pandas笔记-General functions 常用函数

本文详细介绍了Pandas库中用于数据操作的方法,包括数据转换、缺失值处理、日期时间处理、数据合并与拼接、数据透视及统计分析等核心功能。通过实例展示了如melt、pivot、merge、pivot_table等函数的用法,帮助读者掌握Pandas在数据预处理中的强大能力。
摘要由CSDN通过智能技术生成

1、数据操作

melt() # DataFrame从宽到长格式的转变,选择性地保留标识符设置。
pivot() # 返回按给定 索引/列值 组织的新DataFrame。
pivot_table() # 创建电子表格样式的数据透视表作为DataFrame。
crosstab() # 计算两个(或更多)因素的简单交叉表。
cut() # 把一组数据转换为离散的间隔。
qcut() # 基于分位数的离散化函数。
merge() # 使用数据库样式联接合并DataFrame或Series。
merge_ordered() # 使用可选填充/插值执行合并。
merge_asof() # 执行asof合并。
concat() # 沿特定轴连接对象,沿其他轴连接可选的设置逻辑。
get_dummies() # 将分类变量转换为虚拟/指示符变量。
factorize() # 将对象编码为枚举类型或分类变量。
unique() # 基于哈希表的唯一性。
wide_to_long() # 宽格式到长格式。

2、缺失数据

isna() # 检测类似数组的对象缺少的值。
isnull() # 检测类似数组的对象缺少的值。
notna() # 检测类似数组的对象的非缺失值。
notnull(obj) # 检测类似数组的对象的非缺失值。

3、转换

to_numeric() # 将参数转换为数字类型。

4、处理日期和时间之类的问题

to_datetime() # 将参数转换为日期时间。
to_timedelta() # 将参数转换为时间增量。
date_range() # 返回固定频率的日期时间索引。
bdate_range() # 返回固定频率日期时间索引,以工作日作为默认频率。
period_range() # 返回一个固定的频率周期索引。
timedelta_range() # 返回固定频率时间增量索引,以天作为默认频率。
infer_freq() # 根据输入索引推断最可能的频率。

5、处理时间间隔

interval_range() # 返回一个固定的频率间隔索引。

6、评价

eval() # 使用各种后端将Python表达式作为字符串进行求值。

7、散列

util.hash_array() # 给定1d数组,返回确定性整数数组。
util.hash_pandas_object() # 返回索引/系列/数据帧的数据哈希。

8、测试

test()
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值