pandas数据预处理

data.head

读取数据前五行,当数据太大时,对查看数据是否正确。

data.query

记录满足查找条件的行索引

data.query("x<2.5 & x>2 & y<1.5 & y>1.0")

时间处理

time = pd.to_datetime(data["time"], unit="s")
#转成时间
pd.DatetimeIndex(time)

data.groupby(“特征”).count()

对某一特征进行统计

缺失值处理

# True:直接修改原对象,改为平均值
# False:创建一个副本,修改副本,原对象不变(缺省默认)
x["age"].fillna(x["age"].mean(),inplace = true)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值