pandas数据预处理实训题目(1缺失数据处理,2逐渐合并,3数据标准化)

在这里插入图片描述
在这里插入图片描述

import pandas as pd
from scipy.interpolate import lagrange
data = pd.read_csv('missing_data.csv',sep=',',encoding='gbk')
data1 = data[data.isnull().values==True]
#print(miss.iloc[2,1])
print(data1)
#自定义列向量插值函数
def ploy(s,n,k=6):
    y=s[list(range(n-k,n))+list(range(n+1,n+1+k))]#取数
    y=y[y.notnull()]
    return lagrange(y.index,list(y))(n)
for i in data.columns:
    for j in range(len(data)):
        if(data[i].isnull())[j]:
            data[i][j]=ploy(data[i],j)
print(data.isnull().sum())
data.to_excel('misslagrange.xlsx')




import pandas as pd
import numpy as np
ele = pd.read_csv('ele_loss.csv',sep=',',encoding='gbk')
ala = pd.read_csv('alarm.csv',sep=',',encoding='gbk')
print(ele.shape)
print(ala.shape)
ele_ala = pd.merge(ele, ala, left_on=['ID', 'date'], right_on=['ID', 'date'], how='inner')
print(ele_ala.shape)
print(ele_ala)


import pandas as pd
model = pd.read_csv('model.csv',sep=',',encoding='gbk')
def StandardScale(data):
    data = (data-data.mean())/data.std()
    return data
#print(model.columns)
print(model)
data1 = StandardScale(model['电量趋势下降指标'])
data2 = StandardScale(model['线损指标'])
data3 = StandardScale(model['是否窃漏电'])
print('标准差标准化后:\n',data1.head())
print('标准差标准化后:\n',data2.head())
print('标准差标准化后:\n',data3.head())


  • 1
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值