python 数据缺失值处理

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

#缺失值处理
movie = pd.read_csv("./BRNN/data/IMDB-Movie-Data.csv")
#显示所有列
pd.set_option('display.max_columns', None)
# print(movie)
x1 = movie.head()
# print(x1)
x2 = pd.notnull(movie)
# print(x2)

# 返回False说明有缺失值
x3 = np.all(pd.notnull(movie))
# print(x3)
# 返回True说明有缺失值
np.any(pd.isnull(movie))


#处理方式
#1.1删除
# data = movie.dropna()
# #判断是否还有缺失值
# np.all(pd.notnull(movie))

#1.2 替换
#求平均值
#表中的那一列求平均值
x4 = movie["Revenue (Millions)"].mean()
print(x4)

#替换方法
# movie["Revenue (Millions)"].fillna(movie["Revenue (Millions)"].mean(), inplace=True)
# movie["Revenue (Millions)"]这是选择的要替换的列  fillna()空的替换函数 替换的内容为 movie["Revenue (Millions)"].mean()
# print(movie)

#循环替换
for i in movie.columns:
    if np.any(pd.isnull(movie[i])) == True:
        print(i)
        movie[i].fillna(movie[i].mean(), inplace=True)
x6 = np.any(pd.isnull(movie))
print(x6)

如果不是NAN,空值是? 怎么操作 

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值