data cleansing

import numpy as n[]

import pandas as pd

conn=

sql1=select * from table

data=pd.read_sql(sql1,conn)

print(data.describe())

#cleaning missing numbers

data["price"][(data["price"]==0)]=None

for i in data.columns: 

  for j in range(0,len(data)):

    if (data[i].isnull())[j]:

        data[i][j]="36"

         x+=1

print(x)

 

pandas 空值定义为numpy.nan

对整体的series或Dataframe判断是否未空,用isnull()
eg:
pd.isnull(df1) #df1是dataframe变量

对单独的某个值判断,可以用 np.isnan()
eg: np.isnan(df1.ix[0,3]) #对df1的第0行第3列判断

 

 

#print(data_1.isnull())
data_2=data_1.isnull()
print(data_2.head())
for i in data_2.columns:
print(i)
print(data_2[i][1])
for j in range(1,440):
print(data_2[i][j])
if (data_2[i][j]==True) :
pass
else:
#data_1[i][j].astype(int).astype(str))
data_1[i][j]=int(data_1[i][j])
data_1[i][j]=str(data_1[i][j])

转载于:https://www.cnblogs.com/rabbittail/p/7859309.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值