2020e的想法

1.第一问应该是求九个宿舍的用水量,并且不应该以月来算,应该按天算。食堂也是三个食堂的一天算,教学楼还行。花圃没有代表性,所以其他区域直接舍弃。除此之外,应该处理出日均每小时用水量变化数据。

2.第二问,其实按实际,一二级之间没直接关系应该,所以应该做差再拟合的。

3.第三问,假设检验,后面还要用最小二乘法,T检验,一个是检验模型,第二个是检验拟合系数,还需要看拟合度,并利用其他模型进行相应优化处理。

4.神经网络模型过于抽象,用是可以用,但不是最优解,欢迎大佬提别的解决模型。

5.单目标规划,以维修费为目标函数,判断漏损的经济损失是否大于维修费,若是,则维修,反之,不维修。

 

基于大数据挖掘的多元优化维修模型

摘要

随着社会经济及科技实力的不断发展,校园公用设施的更新与升级越来越受到人们的关注,其中校园供水系统更是成为学校大力投资的基础设施。本文通过校园内使用的智能水表所获得的大量实时供水系统运行数据,着重考虑了输水管网的漏损和地下水管暗漏等因素对供水系统运行的影响,建立了合适的、系统的、完整的[1] 数学模型,通过数据挖掘,对其产生的影响进行了合理的[2] 评价,从而针对供水系统中存在的问题提出了合理化[3] 建议。

针对问题1,我们首先按照附件给出的不同季度各水表数据,将91个水表区进行归类处理,分为不同的功能区。统计出不同功能区各个水表的数据情况,进行相关数据处理。其次,基于matlab平台绘制出相应图表,例如宿舍、食堂、教学楼、花圃的月用水量变化的折线统计图等等,并进行对比观察,从而进行可视化分析。最后,得出水表数据的变化规律及不同功能区的用水特征[4] 等结论。

针对问题2,按照附件给的水表层级数据,我们选取了一级水表403X以及它连接二级以上的25个水表,我们将每一个水表的记录用水数据视为变量,把一级水表视为应变量,建立多元线性回归模型,注意到不同层级的水表之间也存在着线性相关关系,因此简化变量的个数到21个[5] 。最后得出一级水表同二级水表以上的数据关系[6] 。

针对问题3,我们基于假设检验模型,给出了水表数据日用水量在99.73%的置信度下的置信区间,通过matlab来[7] 筛选出大于置信区间上限的异常值,我把异常值视为漏水情况,统计出学校内不同功能区的漏水情况和漏水量[8] 。

针对问题4,要求我们提供发生暗漏的位置,我们采用BP神经网络模型,设置发生漏损的误差阀值为5%。通过对各网络节点的识别来确定漏水节点。BP神经网络能精准判别大量漏水情况。[9] 

针对问题5,要求我们对漏损点进行维修方案设计,已知水价和人工费材料费,我们采用多目标规划模型,限制在较低漏损情况下,实现维修费用的最低。[10] 

 

 

 

 

 

 

关键词:可视化分析 多元线性回归 假设检验 神经网络 多目标规划

 

 

 

 

 

 

 

 

一、 问题重述:

1.1 问题背景

随着中国经济的快速发展,教学用具从黑板到投屏再到智能触屏,先进的科技产品大大提高了学校的教学水平,改进了老师的教学模式。在优越设备使学生成绩大幅提升,学校在享受名誉的同时,也逐渐重视相关设施所带来的经济负担以及资源浪费问题。勤俭节约,艰苦奋斗是我国的传统美德,因此,学校设备的运行与改进也越来越引起重视,其中供水系统尤其引人注目。综上所述,学校在使用科技这把利剑的同时也也要重视它所带来的弊端。而在众多需要解决的问题之中,我们首当其冲需要解决学校供水问题。供水系统的正常运行能够大大减轻学校的经济压力,除此之外,这对于环境保护方面也具有重要意义。

 

1.2 问题重述[11] 

在科技与经济实力迅速发展的当下,我们在提升自我的同时对校园高性能设施的改进要求也越来越高。就对供水系统问题的研究,为提供精准分析后的调查结果以及数学模型,你们尝试解决以下问题:

1、统计各水表数据并对其变化规律加以分析,评价校园不同功能区(办公楼、教学楼、宿舍、食堂等)的用水特征。

2、联系校内各水表间的层级关系,建立水表数据间的关系模型,并利用已有的数据进行模型误差分析。

3、资料显示,输水管网漏损严重。在维护良好的公共供水网络中,输水管网的平均失水在5%左右;而在较为老旧的管网中,失水则更多。请利用附件给出的数据,建立相关数学模型,分析该校供水管网的漏损情况。

4、由于难以发现地下水管暗漏,对供水管道的漏损进行检测及定位需要花费大量人力。要是可以从水表的实时数据及时发现,并确定发生漏损的位置,将十分有益于学校发展。请帮助学校解决这个问题。

5、管网维修尽管需要人工费和材料费,但能够降低管网漏损程度。请根据上述结果和你知道的水价以及维修成本确定最优维修管网漏损的决策方案。

 

二、 问题分析

2.1 对问题一的分析

问题一本质上就是探究各水表数据的变化,考虑可视化方法,通过图表直观分析,最终确定水表数据的变化规律及校园不同功能区的用水特征。具体步骤如下:

1.收集各功能区的水表数据,并加以统计归类。

2.根据所收集的相应数据绘制图表,将相关图表进行对比,进而利用可视化分析得出相应结论。

3.通过分析结果找出各水表数据的变化规律,并给出校园内不同功能区的用水特征。

 

2.2 对问题二的分析

问题二要求我们算出不同层级之间水表的关系,[12] ,我们采取将末端电表的用电数据视为自变量,将一级电表视为应变量。[13] 通过多元线性回归模型来进行拟合求解,考虑到模型和系数的显著性水平,我们分别对回归模型和回归系数进行了显著性为1-α[14] 水平下的检验,得到较优的模型结果。

 

2.3 对问题三的分析

问题三要求我们计算校园供水管网的漏水情况,我们采取假设检验模型,规定在(x-3σ,x+3σ)的值为正常值,超过x+3σ即视为异常值,即为漏损情况。

我们对这部分的用水量进行统计。

 

2.4 对问题四的分析

问题四要求我们确定校园漏水的位置,我们采用BP神经网络进行识别[15] ,用较为平稳的一段数据来预测其他区域的用水情况,如果相差过大,即视为是漏水情况。BP神经网络模型对变化幅度较大的数据非常敏感,能准确识别出漏水点。

 

2.5 对问题五的分析

    问题五要求我们通过调查当地水价和维修费用,来确保管网漏损的最优解,我们采用了多目标规划,通过将漏损率控制在一定的范围内(5%左右)。同时根据上述问题提出的易发生漏损问题的位置,对这些地方进行专门的维护。

 

三、 基本假设

1.假设没有人为浪费水资源。

2.假设各个宿舍生活用水习惯近似。

3.假设题目给出的数据真实可靠。

 

  • 符号说明

符号

说明

SSR

回归平方和

SSE

误差平方和

Cjj

(XTX)-1对角线上的元素

VijWij

权值连接向量

η

学习效率

注:未列出符号及重复的符号以出现处为准

 

 

五、 模型的建立与求解

5.1 问题一模型的建立与求解

5.1.1 问题一的模型建立

问题一要求统计分析各个水表的数据的变化规律,并给出校园内各个功能区的用水特征,这里,我们先对数据进行可视化处理,以便观察并删除水表数据中的异常值。由于数据量很大,难以对每个功能区的各个区域进行数据处理,因此我们随机选取了各个功能区的一部分数据进行建模。在宿舍区选取了第八学生宿舍,在食堂区选取了第二食堂,在教学楼区选择了XXXL楼,在其他区域选取了花圃。通过模型来计算出各个功能区的用水集中趋势、用水量以及用水时段分布,针对不同功能区进行分析。

 

5.1.2问题一的模型求解

按照功能区的划分确立四个指标,分为宿舍区、食堂区、教学楼区、其他区域,并针对这四个指标开始分析。

首先对宿舍区水表进行数据分析,基于MATLAB平台,根据宿舍区全年的数据作出以下用水量趋势图:

 

 

图1 第八宿舍月用水量变化图

 

从图中我们可以发现宿舍区用水有以下变化规律:

1、用水量呈周期性波动。

2、在1-2月份处于用水低峰期,且用水量持续下降。

3、在2-4月份用水量持续高幅度上升。

4、在2-12月份处于用水高峰期,且呈不断上升趋势。

 

对食堂区水表进行数据分析,基于MATLAB平台作出食堂区全年的用水量趋势图:

     

 

 

图2 食堂月用水量变化图

 

从图中我们可以发现食堂区用水有以下变化规律:

1、在1-2月份处于用水低峰期,且用水量持续下降。

2、在7-9月份处于用水高峰期。

3、在2-5月份用水量持续高幅度上升。

4、在6-8月份处于用水高峰期,且呈不断上升趋势。

 

 

对教学楼区水表进行数据分析,基于MATLAB平台作出教学楼区全年的用水量趋势图:

 

 

 

图3 XXXL楼月用水量变化图

从图中我们可以发现食堂区用水有以下变化规律:

1、在1-2月份处于用水低峰期,且用水量持续下降。

2、在7-9月份处于用水高峰期。

3、在2-4月份用水量持续高幅度上升。

4、在6-8月份处于用水高峰期,且呈不断上升趋势。

 

 

对其他区域水表进行数据分析,基于MATLAB平台作出花圃全年的用水量趋势图:

 

 

图4 花圃月用水量变化图

 

从图中我们可以发现食堂区用水有以下变化规律:

1、在1-2月份处于用水低峰期,且用水量持续下降。

2、在6-12月份处于用水高峰期。

3、在2-6月份用水量持续高幅度上升。

 

 

  其次,基于matlab[16] 绘制出图形,将四个区域的代表性地点的全年用水总量进行对比:

 

图5 不同区域年用水量柱状图

由此我们可以得到结论:不同区域的用水特征:花圃全年用水总量始终保持在最高,教学楼最低,而食堂用水总量较高于宿舍用水总量。四个区域的共同用水特征是1-2月呈下降趋势,2-12月总体呈上升趋势。[17] 

 

5.2 问题二模型的建立与求解

5.2.1问题二模型的建立

按照水表之间的层级关系可以得知,水表之间是呈现包含关系的,例如403X是一级水表,在与它连接的有二级水表:40338T,40337X,40336T,40335X,40334T,40333T,……,40313T。

同时二级水表下还有三级水表,三级水水表下有四级水表,一共25个水表,对于用水量的数据记录由它们共同决定,因此选择多元线性回归模型来进行初步的拟合分析。

建立多元线性回归分析的模型为

   y=β0+β1x1+……+β25x25+ϵϵ~N(0,σ2)                                 (1)

其中β0β1,……,β25都是与x1,……,x25无关的参数,称之为回归系数。

式中的x1,……,x25,指的是从一级水表到四级电表的自上而下的顺序编号,注意到末端水表可以可以用来计算上一级的水表,因此简化自变量的个数为20个。    注:x1,……,x20:[18] 

40338T,4033726T,4033725T,4033723T,4033720T,40336T,4033506T,403350301T,403350202T,403350201T,403350101T,40334T,40333T,40331T,40325T,40321T,40318T,40316T,40315T,40313T。

所以更新模型为

             y=β0+β1x1+……+β20x20+ϵϵ~N(0,σ2)                   (2)

其次对回归模型进行显著性检验,对于y与x1,……,x20存在如式2中的线性关系还需要进行检验,所以令原假设为H0:βi=0,(i=0,1,2,……,m) 备择假设为H1:βi不全为0。当H0成立时,F=SSR/mSSE/n-m-1 ~F(m,n-m-1)。

在显著性水平α下,对于上分位数Fα(n,n-m-1),如果F<Fα(n,n-m-1),接受原假设H0,否则拒绝。

注:m为电表数的个数,值为20。n为观测值个数,值为30。最后再对回归系数进行假设检验和区间估计,使用检验量:

tj=β/cjjSSR/(n-m-1) ~t(n-m-1) [19]                       (3)

对给定的α,如果|tj|<tα2(n-m-1),则接受原假设H0,否则拒绝原假设。其中cjj是c=(XTX)-1的对角线上的元素。

 

5.2.2模型的计算

5.2.2.1参数估计

模型中的参数β0β1,……,β20。用最小二乘法法来进行估计,选择估计值βi,使得当βi=βi时,,[20] i=1,2,……,20.要求误差平方和Q=i=1nϵi2=i=1n(bi-bi)^2达到最小。

其中bi为y[21] 的观察值,同时随机选取[ai1ai2,……,aim]为x1,……,x20的观测值,注:n>m.因此所要求的误差平方和可以改写为Q=i=1n(bi-β0-β1ai1-……-βmaim)^2[22] 

 

5.2.2.2 计算求解

 

 

5.3 问题三模型的建立与求解

5.3.1 问题三模型的建立

问题三要求我们解答校园水管的漏损情况,因此采用假设检验模型,通过计算学校日常用水量的置信区间来统计学校的漏水情况,所要求的为学校的漏水情况,所以超过置信区间的上限即视为为漏水情况。

具体建立如下模型:

x=xin                                         (4)

                  σ=i=1n(xi-x)2n                                    (5)

规定用水量在(X-3σ,X+3σ)范围内为正常用水范围,超出则规定为漏损。已知用水量在区间(X-3σ,X+3σ)的概率为P(X-3σ<ϑi<X+3σ)=0.9973。

基本上涵盖了所有的数据。因此能较好的对异常的用水量进行处理。

 

5.3.2问题三的求解

我们选取水表的数据来利用MATLAB作出学校日用水置信区间的范围图。[23] 

 

5.4 问题四模型的建立与求解

 

BP神经网络结构的确定:

我们选取三层结构的BP神经网络结构,每层结构有如下含义:

输入层向量:X=(x1,x2,x3,……,xn

隐含层向量:Y=(y1,y2,……,ym)

输出层向量:O=(O1,O2,……,Oi)

输入层到隐含层的权值连接向量:Vij=(V1,V2,……,Vm)

隐含层到输出层的权值连接向量:Wij=(w1,w2,……,wi)

BP神经网络的具体实施步骤如下:

第一步,根据输入X=(x1,x2,x3,……,xn) 和期望输出D=(d1,d2,……di)来确定网络输入层、隐含层和输出层神经元节点个数,初始化各连接权值WijVij,初始化隐含层阀值a,输出层阀值b,给定最大学习速率和神经元传递函数。

第二步,隐含层输出计算》输入向量X,隐含层和隐含层间连接权值Vij,以及隐含层阀值a,计算隐含层输出。

yi=f(j=1nvij-aj)=f(j=1nvijxi),i=1,2,……,m  (6)

其中m为隐含层节点,Vi0= -1,x0=aj,这里的传递函数我们选取单极限sigmoid函数:

                    f(x)=11+e-x。                               (7)

第三步,数据在预处理后,选择样本数据输入,得到输出层Oi

Oi=f(j=1mwjkxj),k=1,2,……,i。

第四步,计算误差。根据网络实际输出O和期望输出D,计算网络总体误差E。

E=12D-O2= 12(dk-Ok)2,k=1,2,……,i.  (8)

第五步,更新权值,根据网络总体误差E,按照以下公式

vij=vij+∆vij                             (9)

wjk=wjk+∆wjk                           (10)

vij=η(k=11δk0wjk)yj(1-yj)xi                  (11)

wjk=ηδk0yj                           (12)

其中δk0=(dk-okok(1-ok)。式中的η为学习效率。设置最大学习精度γ,按照问题上要求,我们设置阀值为5%,超过阀值即视为漏损。

 

5.4.2模型四的求解

 

5.5问题五模型的建立和求解

5.5.1 问题五模型的建立

问题五要求我们控制维修成本来实现水管漏损问题的最优解。我们采用多目标规划模型,查询资料得知,学校类的公共事业单位水价为3.9元/立方米,修水管的费用由明漏和暗漏两个价格,明漏价格在50~100元,暗漏价格在300~500元,学校作为公共事业单位,一般是联系专业的装修公司,暗漏一般有两个工人,人工费300元/人,加上材料,暗漏修费用大致范围在1200~1500之间。根据以上信息建立多目标规划模型。

我们设定5%的漏损率以下不需要进行大的维修。

设维修费为H

 

 

六、 模型的分析与检验

6.1 对问题一模型的分析与检验

6.1.1 模型分析

问题一是对用水量进行初步研究,通过统计分析等数学方法,找出各个水表数据信息的变化规律和内在特性,从而得出校园内不同功能区的用水特征。由于附件给出的水表度数是一定时间为间隔,我们选取每个月汇总用水量,制作图表。依据校园的建筑特性,我们将校园划分为宿舍区、食堂区、教学楼区和其他区。在四个区随机抽取一部分数据用Excel做出每个月各区用水量的折线图,可以很直观的看出宿舍区用水量比较大。

 

6.1.2 模型检验

 

6.2对问题二模型的分析与检验

6.2.1模型分析

问题二是结合校区水表层级关系,建立水表数据之间的关系模型。按照水表之间的层级关系可以得知,水表之间是呈现包含关系的,例如403X是一级水表,在与它连接的有二级水表40338T,40337X,40336T,40335X,40334T,40333T,……,40313T。同时二级水表下还有三级水表,三级水水表下有四级水表,一共25个水表,对于用水量的数据记录由它们共同决定,因此选择多元线性回归模型来进行初步的拟合分析。

 

6.2.2模型检验

(1)回归方程的显著性检验

模型为

             y=β0+β1x1+……+β20x20+ϵϵ~N(0,σ2)                    (13)

原假设为H0:βi=0,(i=0,1,2,……,m)

备择假设为H1:βi不全为0。当H0成立时,检验统计量F=SSR/mSSE/n-m-1 ~F(m,n-m-1)

回归平方和:SSR

残差平方和:SSE

对于给定的显著水平α,检验的拒绝域F>Fα(n,n-m-1)

(2)回归系数的检验

原假设为H0:βi=0,(i=0,1,2,……,m),备择假设为H1:βi不全为0。当H0成立时,检验统计量F=SSR/mSSE/n-m-1 ~F(m,n-m-1)

对于上分位数Fα(n,n-m-1),如果F<Fα(n,n-m-1),接受原假设H0,否则拒绝

也可使用检验量

tj=β/cjjSSR/(n-m-1) ~t(n-m-1)                            (14)

如果|tj|<tα2(n-m-1),则接受原假设H0,否则拒绝原假设。其中cjj是c=(XTX)-1的对角线上的元素。

 

七、 模型的优化与推广

7.1 模型一的优化与推广

 

 

 

 

7.2 模型二的优化与推广

 

 

 

7.3 模型三的优化与推广

 

 

 

八、模型的评价[24] 

8.1 对模型一的评价

优点:

问题一中,数据处理结果很好的反映出每月的变化情况,随机选取各个功能区一部分数据通过月用水量的变化反映了各楼、各功能区的用水特征。

 

缺点:

(1)它没有给出评估的准确性:

尽管这些信息可以准确地预见情况,但对相似性的看法仅是评估。问题一随机抽取四组数据,数据较少,评估缺乏准确性。

(2)单面:

信息表示的基本安排是通过人机界面进行的,这意味着原来是感知基础的信息可以是单方面的。
(3)缺乏帮助:

信息感知的缺点之一是它无能为力,这意味着其他人群可能会以意想不到的方式破译信息。

 

8.2 对模型二的评价

优点:

通过建立多元线性回归模型、参数估计和最小二乘法,使得残差平方和达到最小,得出此模型是可靠的。

 

缺点:

有时候在回归分析中,选用何种因子和该因子采用何种表达式只是一种推测,这影响了用电因子的多样性和某些因子的不可测性,使得回归分析在某些情况下受到限制。

 

8.3 对模型三的评价

优点:

通过建立假设检验模型来计算学校日常用水量的置信区间来统计学校的漏水情况,模型可信度高。

 

缺点:

通过置信区间可以知晓事务之间是否存在关联,但是置信度度量存在着自相矛盾这一缺陷。

 

8.4 对模型四的评价

优点:

采用BP神经网络结构,选取三层结构(输入层向量、隐含层向量、输出层向量)确定发生漏损的位置,目标明确。

 

缺点:

  1. BP神经网络中的参数众多,每次都需要更新很多阈值和权值,故会导致收敛速度过慢。
    (2)网络中隐含层节点个数尚无明确的公式

(3)从数学角度看,BP算法是一种速度较快的梯度下降算法,很容易陷入局部最小值的问题。

 

8.5 对模型五的评价

优点:

由于变量之间是非线性关系,故采用多目标规划模型,控制维修成本来实现水管漏损问题的最优解。

 

缺点:

  1. 各目标加权值的分配具有较大的主观性
  2. 优化目标仅为各目标的加权和,优化过程中各目标的优度进展不可操作

 

 

 

 

 

 

九、参考文献

 

附录

问题一:

重要数据:

 

 

图1 第八宿舍月用水量变化图:

x=[1 2 3 4 5 6 7 8 9 10 11 12];

y=[ 603.08 398.07 839.05 762.89 798.46 810.44 870.11 845.03 888.8 866.81 889.77 844.2];

plot(x,y);

title('第八宿舍月用水量变化图');

legend('月用水量');

xlabel('月份');

ylabel('用水量');

 

图2 食堂月用水量变化图:

x=[1 2 3 4 5 6 7 8 9 10 11 12];

y=[1197.18 724.13 1226.89 1447.8 1671.15 1631.13 1945.57 2057.09 1894.18 1567.66 1662.88 1598.15];

plot(x,y);

title('食堂月用水量变化图');

legend('月用水量');

xlabel('月份');

ylabel('用水量');

 

图3 XXXL楼月用水量变化图:

x=[1 2 3 4 5 6 7 8 9 10 11 12];

y=[92.72 76.22 185.47 187.74 217.8 230.31 276.39 324.65 190.92 196.65 201.11 213.89];

plot(x,y);

title('XXXL楼月用水量变化图');

legend('月用水量');

xlabel('月份');

ylabel('用水量');

 

 

 

图4 花圃月用水量变化图:

x=[1 2 3 4 5 6 7 8 9 10 11 12];

y=[2643.89 1550.47 2853.35 4110.75 5033.5 4369.83 5197.54 4454.84 4174.8 4726.48 4278.92 3944.77];

plot(x,y);

title('花圃月用水量变化图');

legend('月用水量');

xlabel('月份');

ylabel('用水量');

 

 

图5 不同区域年用水量柱状图:

x=[1 2 3 4];

y=[9416.71 18624.41 2393.87 47339.14];

bar(x,y);

hold on;

title('不同区域年用水量柱状图');

legend('年用水量');

grid on;

set(gca,'xgrid','off');

xlabel('区域');

ylabel('年用水量');

 

 

问题二:

 

import random
# 产生 1 到 365 的一个整数型随机数
print("一年中抽取的30天为:")
for i in range(31):
    print(random.randint(1,365),end=" ")

 

 


不要用这些词汇,要写具体点,下同

 [2]

 [3]

简单说一下什么规律、什么特征

从多少个到21个?

简单描述其关系

用的是matlab中的什么算法?Matlab可不提

大致描述一下

具体一些

多目标规划模型怎么求解的,得到了什么结论?

用自己的话来重述,尽量避免和题目用语的重复

 [12]

一块用公式编辑器编辑

先分析特点,在后面再引入为何采用神经网络算法

写成Matlab或MATLAB,其他地方检查

这些结论可以写在摘要里

换行

公式

 [20]

 [21]

上标

结果呢?

评价按条目写总的评价

 

  • 3
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值