2022.6论文学习
文章平均质量分 83
山外小楼听夜雨.
每天敲点代码..
展开
-
论文学习——鄱阳湖星子站水位时间序列相似度研究
写在前面:《中国水利学会2020学术年会议集》;张汶海;中国水利水电科学研究院时间序列的相似性度量是数据挖掘技术的关键,直接影响到时间序列数据挖掘的结果。水位时间序列作为一种特定的水文过程,是一种典型的水文时间序列。欧式距离和动态时间弯曲距离,是计算时间序列相似性的两种经典算法弃文了,抱歉,一阶连接性系数不是我想要的...原创 2022-07-02 20:31:39 · 165 阅读 · 0 评论 -
论文学习——水文时间序列相似性查询的分析与研究
写在前面:《水文》;2009年;作者:李薇、孙洪林传统的时间序列相似性搜索研究,主要强调精确匹配,但是在数据挖掘应用中,由于数据量巨大,一般采用基于近似匹配的“近似搜索”。水文时间序列相似性挖掘的关键工作有:子序列的划分。 在国家水文数据库中,洪水工程已经按照产汇流理论进行了划分,形成了各类要素的摘录表。但是,在日值类过程中,则需要按拟解决的问题类型进行划分,需要使得划分规则既符合水文理论,又适合计算机处理。序列特征提取。一般是对序列进行变换,例如傅里叶变换、小波变换或者分段平均等方法映射到特征空间。相原创 2022-06-30 21:01:26 · 807 阅读 · 0 评论 -
论文学习——考虑场次降雨年际变化特征的年径流总量控制率准确核算
写在前面:《水利学报》;2019年12月;中文核心作者:杨默远,潘兴瑶对于这两个雨量站之间的,年降雨序列相关系数我还是很好奇的。例如选择前后两日20时 至 20 时内的累计降雨量;其关键是,最小降雨间隔时间(T)的合理确定。场次降雨划分的最小降雨时间间隔是6h。考虑长序列历史降雨过程的周期性和趋势性变化特征。...原创 2022-06-29 10:31:40 · 375 阅读 · 0 评论 -
论文学习——降雨场次划分方法对降雨控制率的影响分析
写在前面:《中国给水排水》;中文核心期刊;作者:北京市水科学技术研究院 张宇航、杨默远对于某一确定的历史降雨序列,不同的场次划分方法,对应不同的设计雨量 - 降雨控制率曲线。1、与日降雨数据相比,场次降雨数据更能反映实际的降雨特征;2、 对于某一确定的历史降雨序列,降雨场次的划分方法不同,得到的划分结果也不同。3、目前在海绵城市建设中常用的降雨场次划分方法有两种:一是《指南》中采用的日降雨数据,即20时至次日20时内的累计降雨量;二是按照实际降雨过程进行划分,其关键是最小降雨间隔时间(T)的合理确定。4、原创 2022-06-26 20:46:23 · 1191 阅读 · 0 评论 -
论文学习——多元时间序列相似性度量方法
写在前面:《控制与决策》;中文核心作者:李正欣、郭建胜本文提出了一种实现方便、配置简单,并且能保证度量准确性的方法。时间序列是一种与时间相关的高维数据,广泛存在于金融、经济、工程领域。相似性度量是时间序列数据挖掘的核心技术之一,其度量精度直接影响着数据挖掘的效果。多元时间序列相似性度量的研究相对较少,还有较多尚未解决的问题。在这里呢,DbaseD_baseDbase说的是两个向量之间的基距离,通常使用欧式距离。...原创 2022-06-20 15:59:27 · 1270 阅读 · 0 评论 -
论文学习——基于Hadoop的水文时间序列相似性研究与应用
写在前面:《计算机与数字工程》;作者:顾昕辰、万定生传统DTW算法复杂度高,特别是当处理海量数据时,耗时长,效率低下。本文是从算法和实现手段两个方面提高水文时间序列相似性比较效率,提出基于,以实现的水文时间序列相似性查找方法。【算法是对DTW进行优化,提出FastDTW;然后实现手段方面的优化是Hadoop分布式平台】实现步骤:① 利用小波变换,对数据去噪;② 对水文时间序列进行语义化③ 在Hadoop的 MapReduce 过程中调用,FastDTW方法实现 DTW 距离的云计算,得到与查询序列最原创 2022-06-20 15:56:51 · 296 阅读 · 0 评论 -
论文学习——基于XGBoost算法的多元水文时间序列趋势相似性挖掘
写在前面:《计算机科学》;中文核心期刊;月刊作者:丁武、马媛Similarity measure for multivariate time series based on dynamic time warping这篇论文,提出了一种基于动态时间规整的相似度度量方法。Similarity measure for heterogenous multivariate time-series这篇论文针对不满足“长度匹配”或“轴向拉伸”的时间序列相似度量问题,提出了一种基于最长公共子序列的度量法。[7] 结合原创 2022-06-18 10:44:50 · 653 阅读 · 0 评论 -
论文学习——基于模式距离度量的时间序列相似性搜索
写在前面:期刊:《微计算机信息》;中文核心期刊作者:朱天(南昌大学),硕士研究生,江西省教育厅计划项目【啊,这,我没有觉得序列1 和序列3 的变化趋势一样啊】王达等人提出了 模式距离 的重要概念, 它给出了一个新颖的度量定义。能更好地反映序列间“变化趋势"的相似性。但是它存在缺陷,由于它将模式定义为一个三元集合上升,保持,下降,不能完全地刻画出时间序列的趋势变化,并且直接使用该距离度量不能解决时间轴方向上的缩放问题。分段线性表示,可以将整个时间序列截成若干子序列(不一定等长),每段用直线近似表示。这种表示方原创 2022-06-14 21:01:23 · 361 阅读 · 0 评论 -
论文学习——基于斜率表示的时间序列相似性度量方法
写在前面:《模式识别与人工智能》;2007年近年来,有关相似性搜索的问题,成为一个研究热点,主要包括降维、特征提取、相似性度量、相似性搜索等问题。【什么是一个合理的相似性度量,要能够自圆其说】欧式距离、普通规范距离、动态时间弯曲距离、模式距离、最小距离等等。这些在不同的背景下,都可以作为相似性度量。(度量相似性的有效方法)模式距离,更接近自然语言描述,模式定义的物理意义明确,划分更趋合理,但是其表示方法比较粗糙,得出的结论不够明确,因此,本文在此基础上提出一种基于斜率距离的相似性度量。时间序列的模式,表征原创 2022-06-14 17:02:46 · 512 阅读 · 0 评论 -
论文学习——水文时间序列模体挖掘
写在前面:期刊:《水利学报》;中国水利局;月刊;中文核心期刊作者信息:模体是指——在一组序列中重复出现的相似片段模式。时间序列模体数据挖掘就是利用数据挖掘思想,在时间序列中找出重复出现的相似片段的过程。算法流程:小波去噪 + 极值点分解 + 符号化得到离散数据,为模体挖掘Sequitur 算法提供输入。处理的是水位数据时间序列挖掘,其研究内容一般包括 【时间序列相似性搜索】、【聚类】、【分类】、【序列模式挖掘】、【海量时间序列可视化】、【时间序列预测】等等。模体是是生物学名词,它代表在一组序列中重复出现的原创 2022-06-08 14:41:21 · 290 阅读 · 2 评论 -
论文学习——一种基于关键点的SAX改进算法
写在前面:期刊《计算机研究与发展》;SAX方法采用PAA算法将时间序列平均划分,均分点 无法有效描述序列的形态变化,导致序列在对应分段的均值相等的情况下,无法有效计算序列之间的相似度。如下图,展示了两个时间序列,C和Q,以及它们标准化处理后的图像 和 正态分布图像根据我的主观分析,序列C长度是200,在90-180期间比较密集,没有太大的波动;而序列Q 的长度是500,在300左右有一个明显下降的趋势;所以,我认为这两个时间序列是不相似的,毕竟趋势都不一样。但是,如果使用SAX方法来计算,他们两个序列的原创 2022-06-06 10:48:38 · 385 阅读 · 1 评论 -
论文学习——一种基于DTW的符号化时间序列聚类算法
写在前面:期刊:《软件天地》;不知道这是什么期刊,2011年发表的。步骤如下:第一,先对时间序列进行降维处理,提取时间序列的关键点,并对其进行符号化;第二,利用 方法进行相似度计算;第三,利用矩阵和方法进行聚类分析。SAX 是一种运用符号化方法对时间序列进行表示、 维度约简及相似性度量的方法。但SAX方法采用PAA算法将时,是将时间序列平均划分,因此会丢失掉一部分的语义信息;而如果利用均分点+关键点,同时对序列进行分段,则既考虑了序列本身概率分布变化,又能兼顾到形态的变化。[1]本文提出一种基于DT原创 2022-06-05 20:59:32 · 1386 阅读 · 0 评论 -
论文学习——一种基于DTW聚类的水文时间序列相似性挖掘方法
写在前面:《一种基于DTW聚类的水文时间序列相似性挖掘方法》;期刊:《计算机科学》;主办单位:重庆西南信息有限公司;中文核心作者介绍:实验数据:以滁河六合站的日水位数据进行实验, 结果表明,所提方法能够有效地缩小候选集, 提高查找语义相似的水文时间序列的效率。水文时间序列的相似性分析,可以回答防汛指挥中经常会问到的 “当前水文过程相当于历史上哪一时期的同类过程” 等问题, 同时也是研究时序关联规则挖掘、聚类、模体挖掘以及异常发现等问题的基础,因而在洪水预报、防洪调度等方面有着重要的意义。在水文时间序列 相原创 2022-06-05 16:58:46 · 1046 阅读 · 0 评论 -
论文学习——基于语义相似的水文时间序列相似性挖掘
写在前面:《基于语义相似的水文时间序列相似性挖掘》;期刊:《水文》;主办单位:水利部水文局、水利部水利信息中心;月刊;中文核心期刊;作者:朱跃龙,博士生导师算法步骤安排:(1) 首先利用小波变换将时间序列进行平滑处理;(2) 在此基础上,进行极值点分段并符号化,每个符号代表一种语义模式,从而选取语义相似的子序列作为候选集;(3)将候选集中子序列,通过动态时间弯曲距离进行精确匹配从而得到相似子序列(以太湖流域大浦口站水位数据为例),实验证明,该方法能够在大幅度降低时间复杂度的基础上较准确地查找出相似子序原创 2022-06-03 20:44:25 · 199 阅读 · 0 评论 -
论文学习——降雨空间分布模式识别
写在前面:《降雨空间分布模式识别》;期刊:《水利学报》; 主办单位:中国水利学会;月刊;中文核心期刊作者信息:陈晓宏。博士,教授,主要丛书水文水环境研究。降雨在时间及空间分布上由于受到各种自然地理条件(地形、下垫面条件等)和气象条件的影响,即使在同一个气候区内, 一般也存在分布的时空差异性,从而造成区域内部水资源分布不均匀及由此引起枯水期或少雨地区水资源短缺。另外, 广东省与我国大部分地区一样,目前的雨量站分布稀疏且许多雨量站设站时间较晚, 在求 面平均降雨量 时往往需要插补或延长一些不完整站点的雨量资料,原创 2022-06-03 12:31:11 · 378 阅读 · 0 评论 -
论文学习——基于降雨类型直方图分析的降雨站点相似性研究
写在前面:《水文》;月刊;中文核心期刊这一篇论文和我之前看的一篇专利是对应的。降雨序列实质是不连续的时间序列,此前(2012年前)大多研究都是基于单纯日、月或年降雨量累积的宏观统计分析,没有从更细粒度分析单场降雨的统计特征。若单纯利用年降雨量的累计而不考虑单场降雨的具体情况,则无法区分一年内两个站点降雨类型的差异, 更无法区分降雨时空分布等信息; 若考虑单场降雨, 则可分析更多具有区分度的降雨信息,包括单场降雨和, 单场降雨日均值 ,大于或小于某个临界值的日降雨量, 单场降雨天数等。目前国内对单场降雨序列原创 2022-06-02 19:07:50 · 245 阅读 · 0 评论 -
论文学习——时间序列的距离模式
写在前面:《时间序列的模式距离》;《浙江大学学报(工学版); 2004年7月发表;》时间序列的知识发现,是数据挖掘的一个重要部分特别是时间序列的变化趋势,反映了序列的动态特性,具有更高的使用价值。但是,目前的序列匹配,一般是对序列采用点距离的度量,或者改进方法,进行计算。为了防止数据单位不用,导致数据量差异过大而造成的误差,必须先对比较序列进行标准化处理,这会大大增加处理的计算量。【我觉得,算一个标准化…也就,可能是因为现在2022年了,真的没有什么太大计算量…又不是算图神经网络…】(一个点距离的缺点)采用原创 2022-06-01 19:24:42 · 450 阅读 · 0 评论 -
章硕士论文学习——第二章数据挖掘中的聚类方法+时间序列相似性分析
时间序列相似性度量,是高效时间序列相似比较分析的基础,建立何种度量函数来实现时间序列相似度量直观重要—— 度量函数的选择!!!考虑各种度量函数的特性,以及具体应用领域的实际需求。原创 2022-06-01 10:22:19 · 182 阅读 · 0 评论