- 博客(285)
- 资源 (11)
- 收藏
- 关注
原创 高质量英文文献应该如何查找并且阅读?
通过中国计算机学会发布的CCF推荐国际学术刊物目录进行查找期刊或者会议是否属于顶刊顶会:https://www.ccf.org.cn/Academic_Evaluation/By_category/我们查找到相关论文后接下来要进行的步骤就是查看该论文发表期刊的等级。论文我一般看中科院一、二区或者CCF-A,CCF-B发表的论文,其余有兴趣的论文也可以自行决定阅读。使用connected papers进行查找论文的引用和被引用情况:https://www.connectedpapers.com/
2024-05-15 21:09:14 232
原创 论文合集整理推荐2024.5.15
2012年论文合集:论文入口2019年论文合集:论文入口2022年论文合集:论文入口2023年论文合集:论文入口2024年论文合集:论文入口
2024-05-15 21:07:42 442
转载 基于gan的不平衡工业时间序列异常检测方法
本文提出了一种基于GAN的异常检测方法,通过仅使用正常样本进行训练,并通过生成更高的异常评分来检测异常样本。在实验中,所提出的方法在两个滚动轴承数据集上都实现了100%的准确率。实验结果显示,该方法在两个数据集上均实现了100%的分类准确率,能够有效区分正常样本和异常样本,并对噪声具有良好的鲁棒性。论文总结了提出的方法在处理工业类不平衡数据上的有效性,并指出未来工作将包括结合多维时间序列数据以实现更好的诊断效果。仅使用正常样本进行训练,通过最小化生成器的输出误差,使生成样本尽可能接近真实样本。
2024-05-15 21:06:32 10
原创 时序医疗数据集---adfecgdb
该数据库包含了在波兰西里西亚医科大学妇产科,通过使用KOMPOREL系统收集的5位临产孕妇(孕38至41周)的多通道胎儿心电图(FECG)记录。这些记录通过腹部四个电极和安置在胎儿头部的直接心电图电极同步收集,以评估新的FECG处理技术的效果。记录采用EDF/EDF+格式存储,包括直接和间接FECG信号及R波位置的参考标记。技术规格包括1Hz至150Hz的带宽,1kHz的采样率和16位的分辨率,适用于提高非侵入式胎儿监测技术的研究与开发。edf:包含记录的5个通道30万个数据点。qrs:包含手动数据标签。
2024-05-10 21:08:24 210
原创 对时间序列异常检测的严格评价
新的评估基准:论文通过实验表明,即使在禁用PA协议的情况下,一个未经训练的模型也能达到与现有方法相当的检测性能。新评估协议:实验中引入了PA%K协议,这是一个修改版的PA,只在检测到的异常在某个段落中的比例超过阈值K时才将整个段落标记为异常。新的评估协议:为了克服传统评估方法的缺陷,论文提出了一个新的评估协议,旨在提供更准确和公平的性能比较方式。未来研究方向:论文最后提出了对未来时间序列异常检测研究的几点建议,包括发展更为精细的评估标准和改进现有的数据集,以更好地反映真实世界中的异常情况。
2024-05-09 16:38:07 249
原创 论文复现---FGANomaly
将生成的文件放入对应的文件夹中,比如MSL数据集生成的数据放入msl_raw_data文件夹下,其余数据集类似。运行data_preprocess.py文件,会在processed目录下生成对应的3个.pkl文件。我们对代码新增加了数据集预处理部分,通过预处理生成该项目所需要的训练数据格式。这里我们只复现SMAP数据集,其余数据集可直接进行替换设置。
2024-05-07 09:31:43 317
原创 快速解决:note: This error originates from a subprocess, and is likely not a problem with pip.
我使用pip install ***命令时报错 :note: This error originates from a subprocess, and is likely not a problem with pip.解决方法:使用conda install ***即可解决。
2024-04-17 15:45:21 874
原创 机器学习常用评价指标的公式和含义
定义: 在多类别或多标签任务中,对每个类别的平均精确率(AP)进行平均后得到的指标。- 公式: TP = 数量(真实标签 = 正类 and 预测标签 = 正类)- 公式: FN = 数量(真实标签 = 正类 and 预测标签 = 负类)- 定义: 精确率和召回率的调和平均,用于综合评价模型的精确率和召回率。- 定义: 在所有实际为正类的样本中,被模型正确预测为正类的比例。- 定义: 在所有被模型预测为正类的样本中,实际为正类的比例。- 定义: 错误地预测为正类的样本数量(实际为负类)。
2024-04-17 15:09:26 535
原创 论文复现---MUTANT
首先下载数据集并放入创建的data目录下,即可。这里复现的数据集是SMAP数据集,这里由于作者电脑性能不足删除了部分数据集,如圈2展示。运行data_preprocess.py文件,会在processed目录下生成对应的3个.pkl文件。要求python 3+版本,其中pandas安装不上,我采用的默认版本。
2024-04-17 10:35:41 302
原创 时序数据集---SMAP&MSL
SMAP和MSL是来自NASA的两个公开的真实世界专家标记数据集。每个数据集包含一个训练集和一个测试集,测试集中的异常被标记。它们分别包含27个和55个实体的数据,每个实体分别由55个和25个度量(变量)监视。
2024-04-16 19:56:09 620
原创 Script file ‘D:\Anaconda\Scripts\pip-script.py‘ is not present.
确认 pip 是否已经安装在 Anaconda 中。这通常发生在尝试使用 pip 时,但 pip 没有正确安装或者路径设置不正确时。如果上述步骤都不能解决问题,可能需要重新安装 Anaconda 或者修复 pip 安装。如果使用的是虚拟环境,确保激活了正确的虚拟环境。确认环境变量中的路径设置是否正确。是否在系统的 PATH 环境变量中。这个错误表明系统尝试执行的脚本文件。
2024-04-16 11:29:01 713
原创 虚拟环境下的Pip引用外部环境的解决方法
当你使用新创建的虚拟环境时,测试pip list却显示了一堆自己没有的功能包,这是因为你的环境错乱了,废话不多说直接上解决办法。在系统变量部分,Anaconda要求前边没有其余的python环境路径。设置-》高级系统设置。
2024-04-16 11:21:48 151
原创 基于变量间注意机制的Transformer多元时间序列异常检测
本文提出了一种基于变压器模型的多变量时间序列异常检测方法,命名为变量时间变换器(Variable Temporal Transformer, VTT),特别强调了通过结合时间自注意力和变量自注意力机制来捕捉时间序列数据中的时间依赖性和变量间的相关性。VTT模型的核心贡献包括:引入了一种新颖的自注意力机制,有效整合了时间依赖性和变量间相关性的分析,提高了多变量时间序列异常检测的准确性和效率。设计了异常解释模块,不仅能检测出异常,还能在一定程度上解释异常发生的原因,提高了异常检测的可解释性。
2024-04-11 11:31:05 1027
原创 多传感器时间序列信号的无监督深度异常检测
在本文中,提出了一种新的基于深度学习的异常检测算法,称为深度卷积自编码记忆网络(CAE-M)。我们首先构建了具有最大平均差异(MMD)惩罚的深度卷积自编码器,以表征多传感器时间序列信号,并降低由训练数据中的噪声和异常引起的过拟合风险。本文提出了一种卷积自编码记忆网络。特征网络使用深度卷积自编码器来学习低维特征,Z_f表示的自编码器的特征提取结果,Z_r表示原始数据与重构数据之间的均方误差。在未来的工作中,我们将专注于基于点的细粒度异常检测方法,并通过设计适当的稀疏操作进一步改进我们的多传感器数据检测方法。
2024-04-11 11:29:10 293
原创 基于GAN的多变量时间序列污染训练集异常检测
针对传统的基于AE和基于GAN的异常检测方法存在的过拟合问题,我们提出了Filter GAN,在训练鉴别器之前对可能的异常样本进行筛选,使模型能够准确地捕捉到正态数据的分布,并为生成器设计了一个特殊的目标Adaptive Weight Loss,在训练过程中根据不同点的重构误差动态分配权重。然而,现有的基于人工神经网络的方法缺乏针对异常检测任务设计的有效正则化方法,容易过拟合,而基于GAN的方法大多是在无污染的训练集假设下进行训练,这意味着训练集全部由正常样本组成,在实践中很难满足这一要求。
2024-04-11 11:26:04 582 1
原创 基于特征的多模态生物信号信息检索与自相似矩阵:专注于自动分割
最后,通过分析SSM来检索信息,包括使用新颖性搜索确定信号的变化点、周期性搜索识别重复模式,以及通过相似性分析比较不同子序列或段落之间的相似度。新颖性搜索:在SSM的对角线上应用一个特定的核(如棋盘格模式的核),通过滑动这个核并计算新颖性函数来识别变化点,即时间序列行为的显著变化。2. 构建自相似矩阵(SSM):利用提取的特征构建SSM,其中矩阵中的每个元素代表时间序列中两个子序列之间的相似度。相似性分析:分析SSM中的相似性轮廓,比较不同子序列之间的相似度,用于进一步的分析和处理。
2024-04-11 11:23:38 362
原创 网络流量中的准周期通信行为的分析和检测
它们之间的点是噪声。考虑到应用流可能有多于一个LTQP通信行为,所有非零周围的IPGT类应该被检测为准周期,并使用短路判断,只要有一个类是准周期的,就可以确定流具有准周期通信。选择了基于密度的空间聚类算法DBSCAN,其基本思想如下:聚类中的每个点在给定的半径内至少包含给定数量的点,密度足够高的区域将被划分为一个类。通过实验,实现了对LTQP通信行为的检测。步骤3:否则,形成一个新的IPT类C,将P添加到C中,并将P的附近点中未访问且在reps内有超过Ptsmin个附近点的所有点标记为已访问。
2024-04-11 11:19:23 431
原创 时序数据集---Server Machine Dataset(SMD)
文件名采用machine-x-y.txt的形式,其中x代表组,y是组里的index,每一个machine-x-y代表一个具体的机器。训练集与测试集的数据量是1:1的,训练集无label,测试集有label。interpretation_label:该数据集给出异常点的具体异常。数据集收集的是28个机器连续5周的数据,相邻两组数据间间隔一分钟。总共收集28个机器的数据,每个机器收集38个维度(变量)的信息。train:包含数据的前半部分,作为训练集,无标签。test:包含数据的后半部分,作为测试集,有标签。
2024-04-11 11:13:41 393 10
原创 在论文写作中issues、question和problems如何区别和使用
总结来说,"issues"更倾向于广泛讨论的主题,"questions"指向研究试图回答的具体询问,而"problems"则聚焦于需要解决的具体挑战。在学术论文写作中,"issues"、"questions"和"problems"这三个词虽然有时可互换使用,但它们各自侧重点略有不同,正确的使用可以帮助清晰地传达你的研究焦点和目的。- 在论文中使用"issues"时,往往强调的是研究领域中存在的争议、需要进一步探讨的复杂情况或需要被关注的趋势。
2024-02-29 14:53:05 642
原创 打开多个Texstudio窗口的办法,不是打开多个tex文件(in Windows)
打开Texstudio的快捷方式(注意是你经常点击的快捷方式,可执行文件exe只有一个,但是快捷方式可以有很多个),右键快捷方式,进入属性,会看到“目标”,在应用的可执行文件路径之后加上:--start-always "%1"由于texstudo只能打开一个窗口,每次只能编译一个,非常麻烦。以下给出同时打开多个窗口(session)的办法。
2024-01-02 14:05:13 898 1
原创 python使用订阅发布模式共享数据
请注意,对于这种方法,两个文件(模块)需要运行在同一个Python解释器实例中,因为 `PyPubSub` 在内存中传递消息。在这个示例中,`publisher.py` 发布一个名为 `new_data_event` 的事件,而 `subscriber.py` 订阅这个事件。当事件被发布时,订阅者的处理函数 `handle_event` 会被调用。首先,您需要安装 `PyPubSub` 库。`PyPubSub`,它可以处理不同实例之间的事件传递。### `subscriber.py` - 订阅者。
2023-12-21 15:59:34 725
原创 latex使用技巧:其中一行文字超出正文边界(设置自动换行,两端对齐)
【代码】latex使用技巧:其中一行文字超出正文边界(设置自动换行,两端对齐)
2023-12-08 15:52:31 3220
原创 AI工具合集
今天发现了一个AI工具集合站——futurepedia(未来ai百科网站),将全网897种AI工具分成了49个类别,而且每天都在更新。由于很多AI工具都很抢手,大多数都需要付费,网站中也有对它们进行筛选,分成了免费试用、免费增值、支付、开源、候补工具、移动应用等,大家可以根据自己的需求来选择。如今,AI技术涉及到了很多领域,比如去水印、一键抠图、图像处理、AI图像生成等等。网站:未来百科 | 为发现全球优质AI工具产品而生 (6aiq.com)包含了AI对话、AI绘画、文本AI等多个内容。
2023-11-19 15:10:07 287
原创 论文绘图-机器学习100张模型图
机器学习是一种使用统计技术使计算机系统能够从数据中学习和改进其任务执行的方法,而有效的视觉展示可以极大地帮助解释这些复杂的概念和模型。这不仅为初学者提供了一个学习和实践的平台,还为有经验的研究人员提供了一个快速、高效的工具,可以用来展示他们的研究成果或用于教学目的。使用这些模板,您可以轻松地插入自己的数据,调整颜色和样式以适应您的演示风格,甚至可以添加或删除元素以更好地反映您的特定项目或研究。链接:https://pan.baidu.com/s/1LpiNFx5dB66Nb7WS5OUdJA。
2023-11-15 22:28:31 572
原创 AI工具-PPT-SlidesAI
SlidesAI 提供了一个简便的方式,让用户无需设计技能即可快速创建专业、吸引人的演示文稿。SlidesAI 是一款快速创建演示文稿的AI工具,适用于无设计经验的用户。- 选择预设的颜色和字体,或创建自定义设计,以增加演示文稿的个性。- **导出为视频**(即将推出):将演示文稿快速转换为视频格式。- 预览生成的演示文稿。1. **搜索引文与图标**2. **使用高质量图片**1. **安装与设置**2. **自定义设计**3. **预览与调整**1. **文本输入**3. **改写句子**
2023-11-13 23:02:33 1598
原创 如何正确使用GPT工具
例如,ChatGPT提供的信息可能存在时效性问题,且在某些高度专业化的领域,其回答的深度和准确性可能受限。特别是像ChatGPT这样的AI聊天机器人,它通过高效的语言模型和深度学习算法,为科研工作者提供了前所未有的辅助。用户只需通过简单的文字输入,就可以得到关于科研问题的全面回答,包括但不限于学术文章的链接、数据分析的指导,甚至是实验设计的建议。随着技术的进一步发展,它将在科研领域扮演越来越重要的角色,帮助科研工作者在信息爆炸的时代中迅速找到所需的针对性信息,加速科学发现的步伐。
2023-11-12 00:46:44 1184 1
原创 pyqt---子线程进行gui操作导致界面崩溃
如果您使用 Python 的内置 `threading` 模块来创建线程,而不是使用 PyQt 的 `QThread`,您仍然必须确保 GUI 相关的操作(例如显示消息框)仅在主线程中执行。在 PyQt(或 Qt 通常)中,您不能直接在子线程中执行与 GUI 相关的操作。如果您需要在子线程完成某些操作后显示一个消息框,可以使用 PyQt 提供的信号和槽机制来在主线程中执行 GUI 更新。通过上述方法,您可以确保消息框的显示是在主线程中完成的,从而避免了由于直接在子线程中进行 GUI 操作而导致的崩溃。
2023-10-07 11:27:41 1169
原创 在word文档里面插入漂亮的伪代码
极为轻便,是Word的一个宏安装过程也是极为简单,复制解压后的文件到请根据实际情况自行修改) 找不到地址可以用everything搜文件夹下面之后重启 Word 即可。在word加载项中, 可以看到。
2023-10-05 18:19:12 2845 6
原创 Wrist PPG数据集
1. **光学信号数据:** 这是通过腕部光学心率传感器收集的数据,通常是包含时间序列的光脉搏波形。3. **运动/活动数据:** 一些数据集可能还包括与光学信号同时收集的运动或活动数据,例如加速度计或陀螺仪数据。5. **参与者信息:** 数据集通常会包括参与者的一些基本信息,如年龄、性别、健康状况等。4. **情绪/心理状态标签(可能):** 一些数据集可能还提供了与心理状态或情绪相关的标签,用于研究情绪与心率之间的联系。2. **心率标签:** 数据集可能还包含与光学信号对应的心率标签。
2023-09-04 17:05:32 1608 1
原创 ModuleNotFoundError: No module named ‘google‘
如果你的代码仍然报错,可能还需要检查其他问题,例如环境配置、依赖库版本等。如果问题仍然存在,建议提供更多关于你的环境、代码和依赖库版本的信息,这样我就可以提供更具体的帮助。根据报错信息,问题似乎出现在导入`google.protobuf`模块时,提示找不到`google`模块。解决这个问题的一种可能方法是确保你的环境中安装了`protobuf`库,因为`google.protobuf`实际上是`protobuf`库的一部分。4. 确保安装成功后,尝试重新运行你的代码。(如果`wly`是你的环境名称)
2023-08-30 17:19:52 4832
原创 机器学习基础
红色系---大 蓝色系---小。参数更新的次数和设置的batchsize大小有关。可以训练一个回归的函数,也可以训练一个分类的函数。每一天的误差都可以加起来生成的L就代表了损失。----本质就是寻找一个函数。除了关于当前的斜率外还和自己设置的学习率相关。这个例子的需要分类的类别是19*19的选项。利用已存在的数据,预测未来几天的数据。b和w是未知参数,x是输入,y是输出。这种问题是由于过拟合产生的问题。Loss计算方式保持不变。可以训练什么样的函数呢?这个函数的参数如何定义?
2023-08-09 13:18:48 359
原创 机器学习---自编码器
不可能在实现每一句话都找两个人同时发音记录,我们期望两个人记录一些对话之后就可以训练一个模型,任何语音都可以实现转化。可以实现摘要总结,但是这个摘要属于EN和DN之间的暗号,我们直接查看是看不懂的,所以我们应该怎么做呢?输入一个图片,经过encoder变成一个向量,再通过decoder将这个向量反向生成输入的图片。常见变形:试图还原加入噪声之前的图片---消除噪声的功能。FD技术希望可以在压缩完的数据中分析出对应的信息类型。自编码器不仅用在图像上,也可以用在音频、文本中。特点:不需要任何的标注资料。
2023-08-09 10:09:29 359
原创 论文阅读---《Unsupervised ECG Analysis: A Review》
电心图(ECG)是检测异常心脏状况的黄金标准技术。自动检测心电图异常有助于临床医生分析心脏监护仪每天产生的大量数据。由于用于训练监督式机器学习模型的带有心脏病专家标签的异常心电图样本数量有限,对于心电图分析,越来越需要无监督学习方法。无监督学习旨在将心电图样本分成不同的异常类别,而无需心脏病专家提供的标签,这个过程被称为心电图聚类。除了异常检测,心电图聚类还最近发现了反映有关整个身体和思维的互和内个体模式,例如情绪、心理障碍和代谢水平等有价值的信息。
2023-08-08 19:31:15 1017
原创 论文阅读---《Snippet Policy Network for Multi-classVaried-length ECG Early Classification》
心电图心律失常检测是心血管疾病预防和诊断中的重要研究课题。目前的研究将心电图心律失常检测定式为时间序列分类问题。与此同时,心律失常的早期检测在早期预防和诊断方面呈现出真实世界的需求。在本文中,我们解决了心血管疾病早期分类问题,该问题也是一个不定长和长时序的早期分类问题。为了解决这个问题,我们提出了一种基于深度强化学习的框架,即片段策略网络(SPN),由四个模块组成:片段生成器、主干网络、控制代理和鉴别器。与现有方法相比,所提出的框架具有灵活的输入长度,解决了早期性和准确性目标的双重优化问题。
2023-08-08 17:23:40 111
原创 论文阅读---《Graph Regularized Autoencoder and itsApplication in Unsupervised Anomaly Detection》
降维对于许多无监督学习任务,包括异常检测和聚类,是一个至关重要的第一步。自编码器是一种常用的机制,用于实现降维。为了使高维数据嵌入到非线性低维流形的降维变得有效,人们认识到应该使用某种测量测地线距离的方法来区分数据样本。受到ISOMAP等测地线距离近似算法的成功启发,我们提出使用最小生成树(MST)——一种基于图的算法,来近似局部邻域结构,并生成数据点之间保持结构的距离。
2023-08-08 12:48:43 186
原创 论文阅读---《Unsupervised Transformer-Based Anomaly Detection in ECG Signals》
异常检测是数据处理中的一个基本问题,它涉及到医疗感知数据中的不同问题。技术的进步使得收集大规模和高度变异的时间序列数据变得更加容易,然而,为了确保一致性和可靠性,需要复杂的预测分析模型。随着收集数据的规模和维度的增加,深度学习技术,例如自编码器(AE)、循环神经网络(RNN)和长短期记忆(LSTM),受到越来越多的关注,并被认为是最先进的异常检测技术。最近,基于Transformer架构的发展被提出作为改进的注意力机制的知识表示方案。
2023-08-07 19:22:43 1843 1
原创 机器学习---监督学习和非监督学习
根据训练期间接受的监督数量和监督类型,可以将机器学习分为以下四种类型:监督学习、非监督学习、半监督学习和强化学习。
2023-08-07 11:47:18 703 1
原创 服务器后台运行程序
要让代码在服务器后台运行,有多种方法。在 Linux 系统中,最常见的有以下几种方式:**1. 使用 `&` 符号:**在命令后面添加 `&` 符号可以让程序在后台运行。但是这种方式存在一个问题:当您退出 shell 时,程序会被杀掉。**2. 使用 `nohup` 命令:**`nohup` 命令可以让程序脱离终端运行。这样,即使您退出了 shell,程序也不会被杀掉。在这里,`> output.log` 是将程序的输出重定向到 `output.log` 文件,`&` 符号是将程序放到后台运行。
2023-07-26 10:49:15 1616
python实验报告7 smtp协议.zip
2019-12-21
python网络编程之http协议-数据提交
2019-12-21
python网络编程之http协议-数据请求
2019-12-21
python网络编程之服务器架构
2019-12-21
python网络编程之网络数据与网络错误
2019-12-21
UDP c/s结构通信 扫描主机端口状态
2019-12-21
Library.zip
2019-12-20
cp201x资源启动程序
2018-05-20
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人