Python 缺失值的填补(以TItanic数据集为例)

本文介绍了如何处理Titanic数据集中Age字段的缺失值,通过分别使用年龄的均值和根据舱位的中位数进行精细化填充。探讨了不同填充方法的适用性,并表示将持续寻求优化方案。
摘要由CSDN通过智能技术生成

一、普通青年的缺失值填补(自己举的例子)

raw=[1,2,3,np.nan,4,6,5,8]
sds=[3,2,7,5,4,8,3,5]
raw1=pd.DataFrame([raw,sds],columns=list('abcdefgh'))
raw1.set_index=list('AB')
raw1.iloc[1,4]=np.nan
raw1.iloc[1,3]=np.nan
raw1
	a	b	c	d	e	f	g	h
0	1	2	3	NaN	4.0	6	5	8
1	3	2	7	NaN	NaN	8	3	5
raw1.fillna(0)
	a	b	c	d	e	f	g	h
0	1	2	3	0.0	4.0	6	5	8
1	3	2	7	0.0	0.0	8	3	5
raw1.fillna(raw1.iloc[0,:].mean())#填充某一行的均值

a	b	c	d	e	f	g	h
0	1	2	3	4.142857	4.000000	6	5	8
1	3	2	7	4.142857	4.142857	8	3	5
raw1.dropna(thresh=7)#默认是保留的行的个数
	a	b	c	d	e	f	g	h
0	1	2	3	NaN	4.0	6	5	8
raw1.dropna(thresh=1,axis=1)#可以设置列保留的最低门槛

a	b	c	e	f	g	h
0	1	2	3	4.0	6	5	8
1	3	2	7	NaN	8	3	5
raw1.fi
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值