pandas成长之路——DataFrame的方法

一、转换函数

示例:

	name	age	gender
p1	小张		22	female
p2	小罗		23	female
p3	小周		20	male

1、astype()

类型转换函数,如将整型数据转换为浮点型

df["age"].astype(float)
# 输出结果:
	p1    22.0
	p2    23.0
	p3    20.0
	Name: age, dtype: float64

2、isna()

判断DF数据为NaN的值

df.isna()
输出结果:
		name	age	gender
	p1	False	False	False
	p2	False	False	False
	p3	False	False	False

3、notna()

判断DF数据不是为NaN的值

df.notna()
# 输出结果:
	name	age	gender
	p1	True	True	True
	p2	True	True	True
	p3	True	True	True

4、copy()

赋值DF数据,默认为deepcopy

dd = df.copy(deep=True)		#deepcopy
dd = df.copy(deep=False)	#shallow copy

二、计算函数

示例:

		boys	girls
class1	10		20
class2	20		40
class3	30		60

1、describe()

显示DF中各列的统计信息

df.describe()
# 输出结果:
			boys	girls
	count	3.0		3.0
	mean	20.0	40.0
	std		10.0	20.0
	min		10.0	20.0
	25%		15.0	30.0
	50%		20.0	40.0
	75%		25.0	50.0
	max		30.0	60.0

分别显示各列的计数、均值、标准差、最小值和最大值

2、all()

判断一列或者一行(默认为列)是否都为True,是返回True,否则返回False。
一行或者一列中,只要有一个值为False,都返回False

df.all(axis=0)
# 输出结果:
	boys     True
	girls    True
	dtype: bool

3、any()

判断一行或一列(默认为一列)是否有任意一个为True,是则返回True,否则返回False。
一行或一列中,只要有一个元素为True,都返回True,只有所有的元素都为False时,才返回False
实例:

		boys	girls
class1	10		0
class2	20		40
class3	0		0
df.any(axis=1)
# 输出结果:
	class1     True
	class2     True
	class3    False
	dtype: bool

4、median()

计算行或列(默认列)的中位值
示例:

	boys	girls
class1	10	20
class2	50	80
class3	30	60
class4	20	50
df.median(axis=0)
# 输出结果:
	boys     25.0
	girls    55.0
	dtype: float64

5、product()、prod()

两种函数的效果相同
计算一行或一列的乘积,默认忽略NaN值
示例:

		boys	girls
class1	10.0	20
class2	50.0	80
class3	NaN		60
class4	20.0	50
df.product(axis=0,skipna=True)
# 输出结果:
	boys       10000.0
	girls    4800000.0
	dtype: float64

6、round()

将浮点型数据四舍五入为指定位数小数的值
示例:

A	B	C
first	0.096844	0.124581	0.458094
second	0.303052	0.676214	0.872044
third	0.170628	0.308129	0.506324

指定所有的列:

df.round(2)
输出结果:
			A		B		C
	first	0.10	0.12	0.46
	second	0.30	0.68	0.87
	third	0.17	0.31	0.51

指定指定列:

df.round({'A': 1, 'C': 2})
# 输出结果:
			A		B			C
	first	0.1		0.124581	0.46
	second	0.3		0.676214	0.87
	third	0.2		0.308129	0.51

7、idxmax()、idxmin()

idxmax():获取指定列或行的最大值的索引
idxmin():获取指定列或行的最小值的索引
示例:

		boys	girls
class1	10		20
class2	50		80
class3	90		60
class4	20		50
df.idxmax(axis=0)
# 输出结果:
	boys     class3
	girls    class2
	dtype: object
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值