1、数据操作
melt() # DataFrame从宽到长格式的转变,选择性地保留标识符设置。
pivot() # 返回按给定 索引/列值 组织的新DataFrame。
pivot_table() # 创建电子表格样式的数据透视表作为DataFrame。
crosstab() # 计算两个(或更多)因素的简单交叉表。
cut() # 把一组数据转换为离散的间隔。
qcut() # 基于分位数的离散化函数。
merge() # 使用数据库样式联接合并DataFrame或Series。
merge_ordered() # 使用可选填充/插值执行合并。
merge_asof() # 执行asof合并。
concat() # 沿特定轴连接对象,沿其他轴连接可选的设置逻辑。
get_dummies() # 将分类变量转换为虚拟/指示符变量。
factorize() # 将对象编码为枚举类型或分类变量。
unique() # 基于哈希表的唯一性。
wide_to_long() # 宽格式到长格式。
2、缺失数据
isna() # 检测类似数组的对象缺少的值。
isnull() # 检测类似数组的对象缺少的值。
notna() # 检测类似数组的对象的非缺失值。
notnull(obj) # 检测类似数组的对象的非缺失值。
3、转换
to_numeric() # 将参数转换为数字类型。
4、处理日期和时间之类的问题
to_datetime() # 将参数转换为日期时间。
to_timedelta() # 将参数转换为时间增量。
date_range() # 返回固定频率的日期时间索引。
bdate_range() # 返回固定频率日期时间索引,以工作日作为默认频率。
period_range() # 返回一个固定的频率周期索引。
timedelta_range() # 返回固定频率时间增量索引,以天作为默认频率。
infer_freq() # 根据输入索引推断最可能的频率。
5、处理时间间隔
interval_range() # 返回一个固定的频率间隔索引。
6、评价
eval() # 使用各种后端将Python表达式作为字符串进行求值。
7、散列
util.hash_array() # 给定1d数组,返回确定性整数数组。
util.hash_pandas_object() # 返回索引/系列/数据帧的数据哈希。
8、测试
test()