面向调控大数据的数据分析挖掘方法研究

设备风险影响度影响因素分析

设备重要度

1)电压等级。同类设备电压等级越高,设备在电力系统中就越重要

2)设备造价。设备造价是从经济角度衡量设备重要度的指标之一

3)供电区域属性。设备所在的供电区域不同,设备的重要性也不同,设备所处的供电区域越重要,其设备本身也就越重要

4)相关联的设备规模。设备发生故障或者异常时可能会引起与其相关联的设备也失效甚至故障或损坏,从而增加维修工作量和成本

设备隐患

1)告警严重程度
定义告警严重程度为设备告警发生后的告警级别的加权求和,表征设备告警的严重程度,其表达式为:
A R = ∑ i = 1 k a i X i AR=\sum_{i=1}^{k}a_{i}X_{i} AR=i=1kaiXi
其中, a i a_i ai 表示告警级别对应的数据等级, X i X_i Xi 表示某次告警级别发生的频次, k k k 表示告警级别的数目

2)故障影响度
定义为设备发生故障后引起的设备事件的等级加权求和
F R = ∑ i = 1 k f i N i FR=\sum_{i=1}^{k}f_iN_i FR=i=1kfiNi
其中, f i f_i fi 为设备发生故障所引起的事故类型的数据等级, N i N_i Ni 为某故障类型发生的频次, k k k 为设备事故类型数目。根据电力事故等级划分标准,设备事故(事件)被划分为7种等级。

3)检修频次
设备检修次数包括计划检修次数和非计划检修次数。

设备风险影响度计算模型

基于设备风险影响度指标体系,建立了设备风险影响度计算模型,表达式如下:
R I i = D I i × D H i ( i = 1 , 2 , ⋯   , N ) RI_i = DI_i \times DH_i(i=1,2,\cdots,N) RIi=DIi×DHi(i=1,2,,N)
其中, R I i RI_i RIi 表示设备 i i i 的风险影响度, D H i DH_i DHi 表示设备 i i i 的重要度, D H i DH_i DHi 表示设备 i i i 的隐患。

选取设备重要度指标集 K = { I n } , n = 1 , 2 , ⋯   , N 1 K=\{I_n\},n=1,2,\cdots,N1 K={In},n=1,2,,N1, N 1 N1 N1 为设备重要度影响个数。 I 1 I_1 I1为供电区域属性, I 2 I_2 I2 为设备造价, I 3 I_3 I3为电压等级, I 4 I_4 I4 为相关联的设备规模。设备集 D = { d i } , i = 1 , 2 , ⋯   , N D=\{d_i\},i=1,2,\cdots,N D={di}i=1,2,,N, N N N 为设备数目, d i d_i di 为设备标识,将不能量化的设备重要度指标的值映射到其相对应的数据等级,可量化的重要度指标本身对应其对应的数据等级。构成指标数据等级值序列 s i ( I n ) s_i(I_n) si(In), 表示设备 d i d_i di 在指标 I n I_n In 下的数据等级值。通过设备重要度指标数据等级值序列计算指标 I n I_n In 下的设备相对重要度矩阵 A ( I n ) A^{(I_n)} A(In),其表达式如下:
A ( I n ) = [ a 11 ( I n ) a 12 ( I n ) ⋯ a 1 N ( I n ) a 21 ( I n ) a 22 ( I n ) ⋯ a 3 N ( I n ) ⋯ ⋯ ⋯ ⋯ a N 1 ( I n ) a N 2 ( I n ) ⋯ a N N ( I n ) ] \mathbf{A}^{(I_n)}=\begin{bmatrix} a_{11}^{(I_n)} & a_{12}^{(I_n)}& \cdots & a_{1N}^{(I_n)}\\ a_{21}^{(I_n)} & a_{22}^{(I_n)}& \cdots & a_{3N}^{(I_n)}\\ \cdots & \cdots & \cdots &\cdots\\ a_{N1}^{(I_n)} & a_{N2}^{(I_n)}& \cdots & a_{NN}^{(I_n)} \end{bmatrix} A(In)=a11(In)a21(In)aN1(In)a12(In)a22(In)aN2(In)a1N(In)a3N(In)aNN(In)
其中, a i j ( I n ) a_{ij}^{(I_n)} aij(In) 表示设备 d i d_i di 在指标 I n I_n In 下相对于设备 d j d_j dj 是否重要,重要则用2表示,不重要则用0表示,与 d j d_j dj 同等重要则用1表示。当 i ̸ ≡ j i\not\equiv j i̸j 时,
a i j ( I n ) = { 2 , s i ( I n ) &gt; s j ( I n ) 1 , s i ( I n ) = s j ( I n ) 0 , s i ( I n ) &lt; s j ( I n ) a_{ij}^{(I_n)}= \left\{\begin{matrix} 2, &amp; s_i(I_n)&gt;s_j(I_n)\\ 1, &amp; s_i(I_n)=s_j(I_n)\\ 0, &amp; s_i(I_n)&lt;s_j(I_n) \end{matrix}\right. aij(In)=2,1,0,si(In)>sj(In)si(In)=sj(In)si(In)<sj(In)
对同一指标 I n I_n In 下的设备相对重要度矩阵的行向量元素进行求和,得到 I n I_n In 下设备 d i d_i di 的相对重要度 a i I n = ∑ j = 1 N a i j ( I n ) a_i^{I_n} = \sum_{j=1}^{N}a_{ij}^{(I_n)} aiIn=j=1Naij(In) a i I n a_i^{I_n} aiIn描述了一个指标 I n I_n In 下的相对重要度,为了合理科学的计算设备的重要度,需要综合全部指标 I n I_n In 下的设备相对重要度。利用AHP法获取各重要指标的不同权重。利用构造设备重要度指标的判断矩阵求出最大特征值 λ m a x \lambda_{max} λmax 对应的特征向量 W \mathbf{W} W ,即权重向量 ( w 1 , w 2 , ⋯ &ThinSpace; , w N 1 ) (w_1,w_2,\cdots,w_{N1}) (w1,w2,,wN1) 。对 W \mathbf{W} W 作归一化处理,得到设备重要度指标的合理相对权重。
w i ′ = w i ∑ i = 1 N 1 w i w_i^{&#x27;}=\frac{w_i}{\sum_{i=1}^{N1}w_i} wi=i=1N1wiwi
向量 W ′ = [ w 1 ′ , w 2 ′ , ⋯ &ThinSpace; , w N 1 ′ ] W_{&#x27;}=[w_1^{&#x27;},w_2^{&#x27;},\cdots,w_{N1}^{&#x27;}] W=[w1,w2,,wN1] 为设备重要度指标归一化后的相对权重。将设备 i i i 的重要度指标加权求和就可以得到这个设备的综合相对重要度 a i s u m a_i^{sum} aisum:
a i s u m = ∑ n = 1 N 1 w n ′ × a i ( I n ) a_i^{sum}=\sum_{n=1}^{N1}w_{n}^{&#x27;}\times a_i^{(I_n)} aisum=n=1N1wn×ai(In)
采用线性归一化法来避免设备重要度计算的结果之间的差异过大或者过小,表达式如下:
f ( z ) = B z f(\mathcal{z})=B\mathcal{z} f(z)=Bz
式中, z \mathcal{z} z 为待归一化的变量, B B B 为调节因子,用于根据实际需要来调节归一化后的数据范围,本文中取 B = 1 / m a x ( z ) B=1/max(\mathcal{z}) B=1/max(z) ,计算得到设备重要度的取值范围 ( 0 , 1 ] (0,1] (0,1]。将 a i s u m a_i^{sum} aisum 带入上式,计算得到归一化重要度值: D I i = f ( a i s u m ) DI_i = f(a_i^{sum}) DIi=f(aisum)。同理计算出设备 i i i 的设备潜在隐患 D H i DH_i DHi ,则可以计算出设备 i i i 的风险度影响度值。

面向调控大数据的HR-Tree挖掘方法

高风险设备定义

在设备故障事务中挖掘高风险设备的过程中,设备 d i d_i di 的风险,记为 r i s k ( d p ) risk(d_p) risk(dp), 指设备 d p d_p dp 的支持度 s u p p o r t ( d p ) support(d_p) support(dp) 和设备风险影响度 F ( d p ) F(d_p) F(dp) 的乘积,即:
r i s k ( d p ) = s u p p r t ( d p ) × F ( d p ) risk(d_p) = supprt(d_p)\times F(d_p) risk(dp)=supprt(dp)×F(dp)
定义电网中的一定风险阈值 m i n r i s k min_risk minrisk,若 m i n r i s k ≤ r i s k ( d p ) min_risk \leq risk(d_p) minriskrisk(dp), d p d_p dp 是高风险设备,否则,就是低风险设备。

HR-Tree挖掘方法

算法描述

为了方便描述算法,作如下定义:
定义1 单个设备 d p d_p dp 在单条事务T_l中的设备风险值为 R ( d p , T l ) R(d_p,T_l) R(dp,Tl),表达式如下:
R ( d p , T l ) = F ( d p ) × q ( d p , T l ) R(d_p,T_l) = F(d_p)\times q(d_p,T_l) R(dp,Tl)=F(dp)×q(dp,Tl)
其中, F ( d p ) F(d_p) F(dp) 指设备 d p d_p dp 的风险影响度, q ( d p , T l ) q(d_p,T_l) q(dp,Tl) 表示事务 T l T_l Tl 在设备 d p d_p dp 中出现故障的频次。

定义2 设备集 X X X 在事务 T l T_l Tl 中的设备风险记为 R ( X , T l ) R(X,T_l) R(X,Tl), 定义为事务 T l T_l Tl 中设备集 X X X 中所包含的所有设备的风险值之和,其表达式如下:
R ( X , T l ) = ∑ d p ∈ X ∩ X ⊆ T l 1 R ( d p , T l ) R(X,T_l)=\sum_{d_p\in X \cap X \subseteq T_{l1}}R(d_p,T_l) R(X,Tl)=dpXXTl1R(dp,Tl)

定义3 设备集 X X X 在设备事务集 S S S 中的设备风险记为 R ( X R(X R(X ,定义设备集 X X X 中所有事务中的设备风险之和,其表达式如下:
R ( X ) = ∑ X ⊆ T l ∩ T l 1 ∈ S R(X)=\sum_{X\subseteq T_l \cap T_{l1}\in S} R(X)=XTlTl1S

定义4 事务 T l T_l Tl风险记作为 T R ( T l ) TR(T_l) TR(Tl) ,定义为事务 T l T_l Tl 中所有设备的风险之和,其表达式如下:
T R ( T l ) = R ( T l , T l ) TR(T_l)=R(T_l,T_l) TR(Tl)=R(Tl,Tl)

定义5 设备集 X X X 的事务权重风险记为 T W R ( X ) TWR(X) TWR(X), 定义为包含设备集 X X X 的所有事务风险值的总和, 其表达式如下:
T W R ( X ) = ∑ X ⊆ T l ∩ T l ∈ S R ( T l , T l ) TWR(X) = \sum_{X \subseteq T_l \cap T_l \in S}R(T_l,T_l) TWR(X)=XTlTlSR(Tl,Tl)

定义6 设备最小风险阈值为 m i n r i s k min_risk minrisk ,定义为设备故障事务数据集中事务总风险的一定百分比,表达式如下:
m i n r i s k = p e r c e n t × ∑ T l ∈ S T R ( T l ) min_risk = percent \times \sum_{T_l \in S}TR(T_l) minrisk=percent×TlSTR(Tl)

构建HR-Tree

HR-Tree构建过程中涉及到两个规则如下:
规则1:如果某设备的事务权重风险值小于设备的最小阈值,则其和其所有超集对于挖掘高风险的设备集均是无效的,将该设备从设备故障事务集中删除。

规则2:如果设备集 X X X 是一高事务权重风险设备集,则其子集也一定是一高事务权重风险设备集。

H T W R HTWR HTWR 为数据集 s s s 中所有高事务权重风险设备集合, H R HR HR s s s 中的全部高风险设备的集合,如果两者的最小风险阈值相同,则必有 H R ⊆ H T W R HR\subseteq HTWR HRHTWR

步骤1,建立设备 d p d_p dp 的设备风险影响度 F ( d p ) F(d_p) F(dp) 和海量历史数据的先验知识 S ( d ) S(d) S(d), 建立原始设备故障事务数据集 s s s

步骤2,扫描 s s s ,统计所有事务的事务风险值 T R TR TR 和设备的事务权重风险值 T W R TWR TWR 。依照设备的 T W R TWR TWR 进行降序排列,根据设备最下风险阈值和规则1对设备无效项进行剪枝。

步骤3,利用规则2和经步骤2处理后的设备故障书屋数据集构造HR-Tree。

构建HR-Tree的主要规则如下:

1)如果设备 d p d_p dp 为非候选高风险设备,则其所有的超集均不是高风险设备集;

2)如果设备 d p d_p dp 的事务加权风险值小于设备最小风险阈值,则其和其超集对于挖掘高风险设备集来说都是无效的,应当舍弃;

3)将全局非候选高风险设备从原始数据集移除,并且从相应的事务设备风险中减去全局非候选设备的设备风险

4)在构造HR-Tree时,通过移除子孙节点的设备风险来降低节点设备的估计风险

步骤4,从HR-Tree中按照递归的方式找出所有的候选高风险设备集,扫描原始设备故障事务数据集,计算候选高风险设备集的真正设备风险值,选择不小于设备风险阈值的设备集,输出高风险设备集。由上述的设备HR-Tree中递归生成候选高风险设备集。主要步骤如下:

1)在HR-Tree中跟踪路径由下而上一次构造每个设备项的条件模式基

2)利用条件模式树中的信息构造局部设备HR-Tree

3)递归的从局部设备HR-Tree中挖掘出候选高风险设备集,然后扫描原始故障事务数据集找出真正的高风险设备集

局部路径风险:将路径中包含该设备的风险进行相加

设备风险最小值:是指该设备在其包含该设备的事务中的设备最小风险值

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值