打酱油的葫芦娃-CSDN博客

原创关于我，技术交流

关于我

2022-02-21 12:07:09 6057

原创【论文精读】TimeSiam-一个用于孪生时间序列建模的预训练框架

TimeSiam模型是一个针对时间序列数据的自监督预训练框架，它利用孪生网络（Siamese networks）来捕获时间序列中不同时间戳的子序列之间的内在时间相关性。该模型通过简单的数据增强方法（如掩码）来提高子序列的多样性和独特性，并通过过去到当前的重构任务来学习时间依赖表示。此外，TimeSiam引入了可学习lineage embedding，以增强模型捕获不同时间距离子序列间差异的能力，从而提升对多样化时间相关性的学习。

2024-09-12 15:46:01 569

原创【论文精读】PatchTST-基于分块及通道独立机制的Transformer模型

PatchTST模型是一种基于Transformer的时间序列预测方法，通过将时间序列分割成小块（patches）并应用通道独立性，有效降低了计算复杂度并提高了长期预测的准确性。该模型在自监督学习和迁移学习方面展现了出色的性能，能够学习到丰富的时间序列表示，适用于多种下游任务。

2024-09-11 17:30:18 1224

原创【论文精读】TimesNet-面向通用时间序列分析的时序二维变化建模

TimesNet是一个用于通用时间序列分析的深度学习模型。它通过将一维时间序列转换为二维张量，利用二维卷积核捕捉时间序列的内部周期性和跨周期性变化。TimesNet 采用了模块化的架构，能够适应性地发现时间序列的多周期性，并提取复杂的时间变化特征。该模型在五个主流的时间序列分析任务中实现了一致的最先进性能，包括短期和长期预测、数据填充、分类和异常检测。

2024-09-10 14:52:51 1122 2

原创【论文精读】SCINet-基于降采样和交互学习的时序卷积模型

本文介绍了SCINet，一种新颖的神经网络架构，专门针对时间序列数据的复杂时序动态进行建模和预测。SCINet采用递归下采样-卷积-交互架构，通过多分辨率卷积滤波器提取丰富的时间特征，并利用交互学习机制弥补下采样过程中的信息损失。实验结果表明，SCINet在多个真实世界的时间序列预测数据集上，相较于现有的卷积模型和基于Transformer的解决方案，显著提高了预测精度。

2024-09-05 16:59:59 985

原创【论文精读】AGCRN-自适应图卷积循环神经网络

该论文提出了一种新型的自适应图卷积循环网络（AGCRN），用于预测城市交通流量和速度。AGCRN通过节点自适应参数学习和数据自适应图生成模块，自动捕捉交通序列中的时空相关性，无需预定义的图结构。实验结果表明，AGCRN在两个真实世界的交通数据集上显著优于现有技术。

2024-06-12 11:49:25 1216

原创【论文精读】Graph WaveNet-深度时空图模型

Graph WaveNet构建了一个自适应邻接矩阵，它能保留隐藏的空间依赖关系，能够自动从数据中发现未见的图结构。提出了一个有效且高效的框架，可同时捕捉空间和时间依赖关系。其核心思想是将其提出的图卷积与扩张因果卷积相结合，使每个图卷积层都能处理空间依赖关系。在交通数据集上评估了提出的模型，并以较低的计算成本获得了最先进的结果。

2024-06-06 12:40:39 814

原创【论文精读】STGCN-一种用于交通预测的时空图卷积网络

STGCN旨在通过建模交通网络的空间和时间依赖性，来提高交通预测的准确性。STGCN利用图卷积网络来捕捉交通网络的空间特征，并结合门控时间卷积来处理时间序列数据，从而能够同时从空间和时间两个维度对交通流进行建模。

2024-06-06 12:37:09 4162

原创【论文精读】DCRNN-扩散图卷积循环神经网络

该论文提出了一种名为Diffusion Convolutional Recurrent Neural Network (DCRNN)的深度学习框架，用于交通流量预测。DCRNN通过将交通流视为有向图上的扩散过程，建立了双向扩散图卷积层来捕获交通流的空间依赖，利用编码器-解码器架构和策略采样技术捕捉时间依赖性。在两个大规模真实世界道路交通数据集上的评估显示，DCRNN在预测性能上比现有最先进的基线提高了12% - 15%。

2024-06-06 11:10:45 1167

原创【论文精读】STIDGCN-基于交互学习的时空动态图卷积网络

STIDGCN是一种先进的交通预测模型，利用 Spatial-Temporal Interactive Dynamic Graph Convolutional Networks 来捕获交通数据的复杂时空特征。通过动态图生成和卷积，模型能适应性学习节点间随时间变化的关联，强化对长期依赖的理解，从而在多个真实交通数据集中显著提升预测准确性，尤其擅长处理交通流量的未来趋势预测。其核心价值在于结合动态图结构与交互学习，实现高效时空特征提取，且代码开源，促进领域研究。

2024-05-30 11:40:12 1487

原创基于LSTM算法实现交通流量预测(Pytorch版)

本研究采用PyTorch框架，设计并实现了一种基于LSTM（Long Short-Term Memory）网络的交通流量预测模型。针对时序性显著的交通流量数据，模型首先将多节点、多通道的时空信息整合为一维特征输入至多层LSTM单元，利用其捕捉长期依赖及短期波动的能力进行深度学习。全连接层随后调整时间步长以适应预测周期需求。模型结构灵活，能适应不同节点数、输入输出长度及通道配置，实现在给定历史流量数据基础上对未来交通流量的精准预测，为交通管理与规划提供数据驱动支持。

2024-04-26 11:25:31 4291 9

原创基于MLP算法实现交通流量预测(Pytorch版)

机器学习技术，尤其是深度学习方法，凭借其强大的模型构建能力和对复杂非线性关系的出色捕捉能力，逐渐崭露头角，成为交通流量预测领域的研究热点。其中，多层感知器（MLP）作为一类基础而经典的前馈型人工神经网络，以其简洁的结构、灵活的适应性和良好的泛化性能，在处理高维、非线性问题上展现出独特优势。 MLP通过模拟人脑神经元的工作机制，通过多层非线性变换对输入数据进行深度抽象和特征学习，能够有效挖掘交通流量数据背后的复杂关联与潜在模式，从而实现对未来的流量状态进行精准预测。

2024-04-22 16:52:55 4619 2

原创突破百度地图Web API的配额限制，实现接口调用自由！

本文系统分析了百度地图开放平台的Web API调用方式，通过JS逆向的方式实现了关键参数的构建，从而突破百度地图Web API的配额限制，实现接口调用自由。

2024-02-20 11:18:26 2568

原创 MySQL的binlog和redolog

今天我们来聊一聊 MySQL 的 binlog 和 redo log。

2022-08-06 15:12:01 1129

原创基于源码搞懂LinkedHashMap并通过其实现LRU算法

LinkedHashMap 是通过哈希表和双向链表来实现的，其基于双向链表来保证对哈希表迭代时的有序性。LinkedHashMap 继承自 HashMap，从而可以直接复用 HashMap 对哈希表的操作逻辑，其只需要额外维护1套双向链表的操作逻辑即可。public class LinkedHashMap<K,V> extends HashMap<K,V> implements Map<K,V>{ ......}节点LinkedHashMa

2022-05-07 17:24:08 3729

原创彻底搞懂InnoDB存储引擎的索引模型

在 InnoDB 中，表都是根据主键的顺序以索引的形式来存放的，该种存放方式的表称为索引组织表。InnoDB 使用了 B+ 树索引模型，所以数据都是存储在 B+ 树中的。每一个索引在 InnoDB 里面均对应1棵 B+ 树。在讲解主键的 B+ 树之前，需要了解1个前置知识点:操作系统从磁盘读取数据到内存是以磁盘块(block)为基本单位的，位于同一个磁盘块的数据将被一次性读取出来，而不是需要什么取什么，该做法的理论依据就是计算机科学中著名的局部性原理–当一个数据被用到时，其附近的数据通常也会马上被使

2022-04-25 11:00:47 4645

原创 MySQL的InnoDB索引结构为啥选用B+树?

如果把数据库中的数据当做1个词典，那索引就是字典的目录，其目的是提升查找数据的速度。树的数据结构天然适合查找操作，最先被想到就是搜索二叉树。搜索二叉树二叉树(Binary Search Tree)是每个节点最多有2个子树(左子树和右子树)的树结构，而搜索二叉树是一类特殊的二叉树，其具有以下性质:若它的左子树不为空，则左子树上所有节点的值都小于根节点的值；若它的右子树不为空，则右子树上所有节点的值都大于根节点的值；它的左右子树也分别为搜索二叉树。搜索二叉树中序遍历的结果是有序的。搜索二

2022-04-20 14:51:12 6707

原创如何在CentOS7系统上离线安装MySQL数据库

本文主要讲解如何在 CentOS7 系统上离线安装 MySQL 数据库。下载安装包http://dev.mysql.com/downloads/mysql/上传到服务器，解压(base) [root@master ~]# cd /usr/lib/ruanshubin/(base) [root@master ruanshubin]# tar -zvxf ./mysql-8.0.28-el7-x86_64.tar.gz 创建 mysql 用户(base) [root@master

2022-04-15 15:47:56 5539

原创一文教会你HashMap为啥线程不安全(多图VIP版)

首先思考一下，为啥 HashMap 会存在线程安全性问题？有的人脱口而出，JDK7 的 HashMap 因为采用头插法，多线程环境下会造成死循环，JDK8 虽然改用了尾插法，但多线程环境下仍然存在丢失更新的问题，所以 HashMap 存在线程安全性问题。一听就是老八股人了，哈哈哈。但其实上面的答案并不全面，而且很容易误导编程的新手，让新手总以为 HashMap 只是因为死循环或者丢失更新的问题才导致的线程不安全。HashMap 之所以存在线程安全性问题，本质上是因为 HashMap 的"增删改"操作

2022-04-14 20:27:08 7468 2

原创 Flink进阶系列--类加载机制

本文的Flink源码版本为: 1.15-SNAPSHOT，读者可自行从Github clone.要讲解 Flink 的类加载机制，首先你得对 JDK 的类加载机制有所了解。推荐阅读我之前写的1篇博客: 基于源码深入了解Java的类加载机制(JDK8和JDK11双版本)接着看一下 FLink 的类加载器继承结构：FlinkUserCodeClassLoader 继承自 URLClassLoader 类，其 loadClass() 方法实现如下:@Overridepublic final Cl.

2022-04-10 16:38:47 7722 1

原创基于源码深入了解Java的类加载机制(JDK8和JDK11双版本)

Java 虚拟机设计团队有意将类加载阶段中的"通过一个类的全限定名来获取描述该类的二进制字节流"这个动作放到 Java 虚拟机外部来实现，以便让应用程序自己来决定如何去获取所需的类，实现这个动作的代码称之为"类加载器 (Class Loader) "。由于 JDK9 引入了模块化新特性，所以 JDK9 前后的类加载实现也略有区别，本文将分开讲解。首先基于 JDK8 来讲解类加载机制。JDK8双亲委派模型java.lang.ClassLoader 抽象类的 loaderClass() 方法定义了类加

2022-04-09 16:59:49 7479

原创 Flink源码解析系列--StreamExecutionEnvironment类

本文的Flink源码版本为: 1.15-SNAPSHOT，读者可自行从Github clone.Flink 程序看起来像一个转换 DataStream 的常规程序。每个程序由相同的基本部分组成：获取一个执行环境（execution environment）；加载/创建初始数据；指定数据相关的转换；指定计算结果的存储位置；触发程序执行。StreamExecutionEnvironment 是所有 Flink 程序的基础。创建你可以使用 StreamExecutionEnvironme.

2022-03-31 18:25:00 10945 1

原创 Flink源码解析系列--Timer定时器

Timer（定时器）是 Flink Streaming API 提供的用于感知并利用 Processing Time/Event Time 变化的机制。Ververica blog上给出的描述如下：Timers are what make Flink streaming applications reactive and adaptable to processing and event time changes.对于普通用户来说，最常见的显式利用 Timer 的地方就是 KeyedProcessF

2022-03-26 16:44:02 8478

原创 Flink源码解析系列--ProcessingTimeService定时器

本文的Flink源码版本为: 1.15-SNAPSHOT，读者可自行从Github clone.@PublicEvolvingpublic interface ProcessingTimeService { // 返回当前的 processing time long getCurrentProcessingTime(); /** * Registers a task to be executed when (processing) time is {@code .

2022-03-24 22:05:39 7334

原创 Flink源码解析系列-- WatermarkGenerator接口及其常用实现

本文的Flink源码版本为: 1.15-SNAPSHOT，读者可自行从Github clone.Flink 提供了 WatermarkGenerator 接口用来"制造"水印:/** * {@code WatermarkGenerator} 可以基于事件或者周期性的生成 watermark。 * * <p><b>注意：</b> WatermarkGenerator 将以前互相独立的 {@code AssignerWithPunctuatedWatermar.

2022-03-23 22:46:50 7287

原创 Flink入门系列--和Springboot框架结合(1.14.3版本)

本文 Flink 版本为 1.14.3。本文主要讲解如何将 Flink 和 Springboot 两大框架融合在一起，可以对接 SpringCloud 生态系统，比如分布式配置中心、服务注册和发现、负载均衡等；可以通过 Restful 接口的形式提交 Flink 任务。本地工程构建软件环境:Flink 1.14.3Springboot 2.0.3.RELEASEJDK 11<?xml version="1.0" encoding="UTF-8"?><proj.

2022-03-20 12:51:40 11178 4

原创 Flink进阶系列--FLIP-27新的Source架构

Source 旧架构在 Flink 1.12之前，开发一个新的 source connector 是通过实现 SourceFunction 接口来完成的。@Publicpublic interface SourceFunction<T> extends Function, Serializable { // 当 source 开始发送数据时，run 方法被调用，其参数 SourceContext 用于发送数据。run 方法是一个无限循环，通过一个标识 isRunning 来跳出循

2022-03-18 16:16:47 10262

原创 Flink源码解析系列--FutureCompletingBlockingQueue阻塞队列

本文的Flink源码版本为: 1.15-SNAPSHOT，读者可自行从Github clone.Flink 在实现 SourceReaderBase 类时，并没有直接使用 JDK 自带的BlockingQueue 阻塞队列来缓冲 fetcher 线程获取的元素，而是自定义1个阻塞队列，即 FutureCompletingBlockingQueue 类。FutureCompletingBlockingQueue 的入队实现基本和 ArrayBlockingQueue实现类似，当队列已满时，会通过 Co.

2022-03-17 19:25:02 6392

原创 Flink入门系列--架构、应用程序执行、分层API(1.14.3版本)

Flink 集群剖析Flink 运行时由两种类型的进程组成：一个 JobManager 和一个或者多个 TaskManager。Client 不是运行时和程序执行的一部分，而是用于准备数据流并将其发送给 JobManager。之后，客户端可以断开连接（分离模式），或保持连接来接收进程报告（附加模式）。客户端可以作为触发执行 Java/Scala 程序的一部分运行，也可以在命令行进程./bin/flink run …中运行。可以通过多种方式启动 JobManager 和 TaskManager：直接在

2022-03-16 19:08:04 6279

原创 Flink源码解析系列--StreamPartitioner(流分区器)

本文的Flink源码版本为: 1.15-SNAPSHOT，读者可自行从Github clone.StreamPartitioner抽象类@Internalpublic abstract class StreamPartitioner<T> implements ChannelSelector<SerializationDelegate<StreamRecord<T>>>, Serializable { private stat.

2022-03-15 22:16:37 6107

原创 Flink源码解析系列--SubtaskStateMapper枚举类

假如 Flink 任务某个算子的并行度为4，该算子的状态做了 checkpoint 后任务停止。该算子的并行度调整为2后重新启动任务，新 task 中的各个 subtask 需要从 checkpoint 中哪些旧的 subtask 中获取数据呢？Flink 提供了 SubtaskStateMapper 枚举类来定义上述行为。其核心方法为:public abstract int[] getOldSubtasks( int newSubtaskIndex, int oldNumberOfSubtask

2022-03-14 15:41:41 6346

原创 Flink入门系列--安装部署及任务提交(1.14.3版本)

部署模式Flink 的部署模式分为3种:Application 模式Per-Job 模式Session 模式Application 模式Application 模式即 Flink 为1个应用专门创建1个集群，Flink集群和应用同生命周期，Application 的main()方法将由 JobManager执行。在其他部署模式下，用户 Jar 文件是通过 RPC 来进行分发的，因为需要走网络IO，当用户 Jar 文件较大时，JobManager 加载用户 Jar 文件将是1个耗时的操作。为

2022-03-12 11:57:12 8226

原创数字的计算机表达--大小端和浮点数

大端和小端起源关于大端小端名词的由来，有一个有趣的故事，来自于Jonathan Swift的《格利佛游记》：Lilliput和Blefuscu这两个强国在过去的36个月中一直在苦战。战争的原因：大家都知道，吃鸡蛋的时候，原始的方法是打破鸡蛋较大的一端，可以那时的皇帝的祖父由于小时侯吃鸡蛋，按这种方法把手指弄破了，因此他的父亲，就下令，命令所有的子民吃鸡蛋的时候，必须先打破鸡蛋较小的一端，违令者重罚。然后老百姓对此法令极为反感，期间发生了多次叛乱，其中一个皇帝因此送命，另一个丢了王位，产生叛乱的原因就是另

2022-03-10 19:52:47 5671

快学Scala（完整版）

空空如也