文章目录
一、转换函数
示例:
name age gender
p1 小张 22 female
p2 小罗 23 female
p3 小周 20 male
1、astype()
类型转换函数,如将整型数据转换为浮点型
df["age"].astype(float)
# 输出结果:
p1 22.0
p2 23.0
p3 20.0
Name: age, dtype: float64
2、isna()
判断DF数据为NaN的值
df.isna()
输出结果:
name age gender
p1 False False False
p2 False False False
p3 False False False
3、notna()
判断DF数据不是为NaN的值
df.notna()
# 输出结果:
name age gender
p1 True True True
p2 True True True
p3 True True True
4、copy()
赋值DF数据,默认为deepcopy
dd = df.copy(deep=True) #deepcopy
dd = df.copy(deep=False) #shallow copy
二、计算函数
示例:
boys girls
class1 10 20
class2 20 40
class3 30 60
1、describe()
显示DF中各列的统计信息
df.describe()
# 输出结果:
boys girls
count 3.0 3.0
mean 20.0 40.0
std 10.0 20.0
min 10.0 20.0
25% 15.0 30.0
50% 20.0 40.0
75% 25.0 50.0
max 30.0 60.0
分别显示各列的计数、均值、标准差、最小值和最大值
2、all()
判断一列或者一行(默认为列)是否都为True,是返回True,否则返回False。
一行或者一列中,只要有一个值为False,都返回False
df.all(axis=0)
# 输出结果:
boys True
girls True
dtype: bool
3、any()
判断一行或一列(默认为一列)是否有任意一个为True,是则返回True,否则返回False。
一行或一列中,只要有一个元素为True,都返回True,只有所有的元素都为False时,才返回False
实例:
boys girls
class1 10 0
class2 20 40
class3 0 0
df.any(axis=1)
# 输出结果:
class1 True
class2 True
class3 False
dtype: bool
4、median()
计算行或列(默认列)的中位值
示例:
boys girls
class1 10 20
class2 50 80
class3 30 60
class4 20 50
df.median(axis=0)
# 输出结果:
boys 25.0
girls 55.0
dtype: float64
5、product()、prod()
两种函数的效果相同
计算一行或一列的乘积,默认忽略NaN值
示例:
boys girls
class1 10.0 20
class2 50.0 80
class3 NaN 60
class4 20.0 50
df.product(axis=0,skipna=True)
# 输出结果:
boys 10000.0
girls 4800000.0
dtype: float64
6、round()
将浮点型数据四舍五入为指定位数小数的值
示例:
A B C
first 0.096844 0.124581 0.458094
second 0.303052 0.676214 0.872044
third 0.170628 0.308129 0.506324
指定所有的列:
df.round(2)
输出结果:
A B C
first 0.10 0.12 0.46
second 0.30 0.68 0.87
third 0.17 0.31 0.51
指定指定列:
df.round({'A': 1, 'C': 2})
# 输出结果:
A B C
first 0.1 0.124581 0.46
second 0.3 0.676214 0.87
third 0.2 0.308129 0.51
7、idxmax()、idxmin()
idxmax():获取指定列或行的最大值的索引
idxmin():获取指定列或行的最小值的索引
示例:
boys girls
class1 10 20
class2 50 80
class3 90 60
class4 20 50
df.idxmax(axis=0)
# 输出结果:
boys class3
girls class2
dtype: object