基于深度学习技术的电表大数据检测系统
来源:《 人工智能与机器人研究》 ,作者方向
关键词: 智能电表;数据分析;深度学习时序模型;
摘要: 随着我国电厂不断发展,我国智能电表装机量不断扩大,日臻成熟,对智能电表的监测越来越重要。本文通过对电表数据的采集、清洗,完成数据格式化。运用皮尔森相关系数分析以及K折交叉验证等方法,进行数据分析。通过采用深度学习时序模型进行预测研究,最终达到检测电表运行状态的目的。通过利用智能电表大数据对电表运行状态的分析,可以判断电表运行是否正常,如果异常是属于故障还是有偷漏电发生,判断相关位置,以便进一步采取行动。该检测系统的研究与应用,可以避免智能电表的物理检测,可以达到延长正常电表的使用寿命,节省大量的资源的目的。
1. 引言
智能电网的基础是高速双向智能通信网络。通过传感测量、控制技术等实现高效、安全的电网运行,保证电网的智能化建设 [1]。智能电表作为智能电网的重要部分,主要涉及以下部分:测量、通信、数据处理单元等 [2],是一种智能化仪表,能够有效地测量电力参数、计量双向电能 [3],能够实现实时数据交互,对电能的质量进行监测,实施远程监控。
智能电表中使用了诸多新的科学技术,突破了电子式表的发展,以智能芯片作为核心,集成数据库、读表器以及操作系统等,通过计算机通信平台,实现自动化的电力计量和计费,更加快捷便利 [4]。智能电表是智能电网的智能终端和数据入口,为了适应智能电网,智能电表具有双向多种费率计量、用户端实时控制、多种数据传输模式、智能交互等多种应用功能。智能电网建设为全球智能电表及用电信息采集、处理系统产品带来了广阔的市场需求 [5] [6]。预计到2020年全球将安装近20亿台智能电表,智能电网将覆盖全世界80%的人口,智能电表渗透率达到60% [7]。
目前国家规定的智能电表使用年限一般为8年,但实际上在智能电表使用8年后,大部分可以正常使用,而以前采用的物理检测方式使拆下的电表基本全部更换了。如果可以只对异常电表进行更换,则可以为国家和个人节省巨大的每年高达百亿以上的经济成本。本次研究的目的是根据采集的用电小区的用电数据,对其进行数据分析,以期在不对电表进行物理处置的情况下通过挖掘出用户电表的异常信息,发现存在异常的电表 [8],为不拆电表进行物理检测提供相关依据与方法。
2. 数据分析与处理
2.1. 数据整理与分析
2.1.1. 解决问题的思路
本文研究的主要目的是根据电表的数据预测分析电表是否异常,异常的情况包括故障或者偷漏电等。
目前国内也有一些相关方面的研究已经或正在进行。其中有通过分析不同用户的电力消费类型,得出不同时间类型下的用户消费模型差异。利用支持向量机理论,来检测用电异常。这种方法所需训练时间较少,无需对人工异常数据进行分类,能有效降低方案的应用成本 [9]。
还有基于受攻击的智能电表CPU利用率和网络通信流量异常上升,提出AMI中基于大数据的检测方法。由各智能电表记录其CPU负荷率及网络通信流量,将此数据与电量功率数据一起上传到用电管理中心数据服务器,再由异常甄别系统对相同型号智能电表的CPU负荷率及网络通信流量进行对比,即可利用大量表计数据的统计特性,识别出CPU负荷率和通信流量明显偏高的异常电表 [10]。
国外针对智能电表端的研究进行得较为深入,目前主要在窃电、恶意软件检测等方面。
Babu V,Nicol D M等针对恶意代码在AMI网络中的传播问题,提出了在网络层和应用层部署新的协议,通过对报文语义和语法的检查,使得恶意代码的检测精度达到了99.72%至99.96% [11]。
Depuru S S R等通过对电力数据分类,利用SVM方法训练样本,使得对该样本的检测精度达到了98.4%。
智能电网的信息采集和量测主要是在量测设备上进行采集和汇总,主要包括电网状态量测系统和个人用户量测系统两类。如图1所示 [12]。
Figure 1. Smart grid testing system classification
图1. 智能电网量测系统分类
针对本项目小区电表的研究,在数据方面的处理应遵循:1) 通过特征工程各种方法,尽可能提取影响电表误差的特征;2) 通过特征和误差的关系建立回归模型,预测测试集中一个点/一段时间的误差,结论为误差是否在电表正常范围内,不在正常范围则判断小区电表是否有异常存在;3) 如存在异常电表,则根据单电表的用电特性行为模型,找出异常电表的存在。
2.1.2. 数据格式设置
针对获取的小区电表数据,设定相关参数如下:
每15分钟的小区总表电压U_super_15;
每15分钟的小区总表电流I_super_15;
每60分钟的用户表电压U_sub_60;
每60分钟的用户表电流I_sub_60;
每24小时用户表电量W_sub;
每24小时小区总表电量W_super&#