任务一:对用户信心更新表和登陆信息表进行长宽转换
需求说明:通过对数据的描述性统计、以及时间数据信息提取,分组聚合操作已经获得了相当多的信息,但用户信息更新表和登录信息表是长表,而主表是宽表,需要通过长宽表转换将数据合并在一张以用户编号为主键的表内。
任务二:插补用户用电量数据缺失值
需求说明:用户用电量数据呈现一定的周期性关系, missing data.csv表中存放了用户A、用户B
和用户C的用电量数据,其中存在缺失值,需要进行缺失值插补才能进行下一步分析。
任务三:合并线损、用电量趋势与线路告警数据
需求说明:线路线损数据、线路用电量趋势下降数据和线路告警数据是识别用户窃漏电与否的3个重要特征,需要对由线路编号(ID)和时间(date)两个键值构成的主键进行合并。
任务四:标准化建模专家样本数据
需求说明:为了消除特征之间量纲和和取值范围差异可能会造成的影响,需要对数据进行标准化处理。对线路线损特征、线路用电量趋势下降特征、线路告警特征进行标准化有助于后续分析的准确性。
- 1
[ data文件
](https://www.codecode.net/engintime/python-
data/datas/Lab009/raw/master/data.zip)
"""
# @Time : 2020/5/21
# @Author : JM
"""
import pandas as pd
logInfo =