自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Thomas_Cai的记忆殿堂

个人笔记,希望也帮到你~

  • 博客(167)
  • 收藏
  • 关注

原创 时序预测力作PatchMixer论文理解

本文提出PatchMixer模型,这是一种基于深度可分离卷积和补丁混合架构的时间序列预测方法。模型通过将时间序列划分为补丁进行处理,采用双头预测机制分别建模线性和非线性模式。训练流程包括数据准备、模型建立、损失定义、参数优化等步骤,关键超参数包括补丁大小、学习率、批量大小等。预测过程通过补丁划分、嵌入和深度可分离卷积处理实现。实验采用7:1:2的数据划分比例,输入序列长度为96时,模型可预测未来96个时间点。结果表明PatchMixer能有效捕捉时间序列特征,在预测任务中展现出优良性能。代码已在GitHub

2025-05-28 17:46:46 976

原创 deepseek开源资料汇总

deepseek开源技术回顾

2025-05-27 16:38:56 1274

原创 本地部署dify爬坑指南

本文介绍了Dify平台的本地部署流程及注意事项。主要内容包括:1)Docker Compose安装指南;2)解决Docker网络问题的详细步骤,包括镜像源配置和DNS设置;3)Dify本地部署命令;4)模型部署方法,建议在与Dify网络互通的环境中运行。文章提供了完整的操作流程和参考链接,帮助用户避免常见安装问题,实现Dify平台的顺利部署和使用。

2025-05-27 16:33:26 911

原创 LangChain理解

langchain的使用笔记

2025-05-26 16:27:45 276

原创 yolov8分割任务的推理和后处理解析

yolov8分割任务的后处理解析

2025-05-26 16:26:19 1382 2

原创 Encoder和Decoder的区别

编码器和解码器的区别

2025-05-04 17:09:01 1225 1

原创 FastApi快速实践

python+FastAPI 1分钟快速入手

2025-05-04 17:07:30 393

原创 Sentence-BERT论文解析

标准的三段式:目前的方法弊端——这篇文章的提出——这篇文章方法的效果目前的方法弊端目前的方法:BERT(Devlin等人,2018)和RoBERTA(Liu et al,2019)在语义文本相似性(STS)等双对回归任务上设置了最先进的性能。弊端:然而,它需要将两个句子都输入到网络中,这导致了巨大的计算开销:在10000个句子的集合中找到最相似的一对需要大约5000万次推理计算(约65小时)BERT的构造使其不适合语义相似性搜索以及聚类等无监督任务。句子的输入导致巨大的计算开销。

2025-04-06 16:49:15 874 1

原创 Bert论文解析

引入一种新的语言表示模型BERT,它源于Transformers的双向编码器表示。BEncoderRTBERT的原理简述——便捷性BERT旨在通过联合调节所有层中的左右上下文,从未标记文本中预训练深度双向表示。因此,只需一个额外的输出层即可对预训练的BERT模型进行微调,为各种任务(例如问答和语言推理)创建最先进的模型,而无需对特定任务的架构进行实质性修改。BERT的效果。

2025-04-06 16:47:36 1095

原创 Python的线程、进程与协程

进程:进程是操作系统分配资源的基本单位,每个进程都有独立的内存空间,包含代码、数据和系统资源。进程之间相互隔离,一个进程崩溃不会影响其他进程。线程:线程是进程内的执行单元,一个进程可以包含多个线程。线程共享进程的内存空间和资源,因此线程间的通信比进程间更高效,但也更容易出现数据竞争等问题。

2025-03-25 19:29:55 1140

原创 批归一化(Batch Normalization)与层归一化(Layer Normalization)的区别与联系

与 Batch Normalization(批归一化)的目标类似,都是为了加速训练并提高模型性能,但它们的归一化方式和应用场景有所不同。Layer Normalization 是对单个样本的所有特征进行归一化,而不是像 Batch Normalization 那样对整个 mini-batch 的每个特征进行归一化。Batch Normalization 还会对归一化后的数据进行缩放和平移,引入可学习的参数。Layer Normalization 还会对归一化后的数据进行缩放和平移,引入可学习的参数。

2025-03-25 19:27:11 948

原创 一文解读python的高阶功能:从闭包到装饰器的理解

一文解读python的高阶功能:从闭包到装饰器的理解

2025-03-14 19:39:59 924

原创 时序预测最新力作PatchMixer代码的数据集划分理解

时序预测最新力作

2025-03-14 19:39:44 646

原创 一文解读python高阶功能:匿名函数到魔法方法(__call__)

python的匿名函数到"__call__"方法

2025-03-14 18:05:22 725

原创 vscode(cursor)配置python环境,含远程调试

一文教你用AI编程工具Cursor的各种常用功能

2025-03-10 10:16:52 2478 1

原创 优化Langchain-Chatchat数据库对话功能

deepseek分析数据库数据,以后还需要后端吗?

2025-03-10 10:09:18 1686 3

原创 三步教你在linux上本地部署DeepSeek-R1

云端API太贵?想保护自己的数据?没问题,三步教你本地部署DeepSeek,敢不敢挑战?以linux系统为例,windows也是同样的流程。

2025-02-23 11:36:49 2763

原创 AWQ和GPTQ量化的区别

DeepSeek模型量化版能节约大量现存,所以要不要用呢?一文给你答案。

2025-02-23 11:33:50 2173

原创 想加速模型推理?试试用int8量化呢

int8量化详解

2024-12-31 09:36:44 1574 1

原创 一文彻底理解混淆矩阵

一文彻底理解混淆矩阵

2024-12-31 09:36:18 3973 1

原创 Go语言启动独立进程

Go语言进展中启动另一个进程,如何保持另一个进程独立?

2024-12-19 18:14:31 781

原创 FlashAttention理解

注意力机制优化方法FlashAttention

2024-12-19 18:14:25 1449

原创 自注意力机制的理解

自注意力机制的相关问答

2024-12-14 09:02:41 1352

原创 linux终端关闭,训练就停止怎么办?

挂起训练的三大方法

2024-12-14 09:02:12 814

原创 多标签分类SOTA | ADDS论文解读

《Open Vocabulary Multi-Label Classification with Dual-Modal Decoder on Aligned Visual-Textual Features》论文要点笔记

2024-12-11 18:54:25 1927

原创 softmax+交叉熵损失函数的数值举例

交叉熵数值举例

2024-12-11 18:54:18 726

原创 微调时冻结批处理正则化层(BN)的意义在哪

冻结bn的意义

2024-12-03 19:28:57 1416

原创 多卡分布式训练修改为单卡训练(为了本地调试)

分布式训练多卡修改单卡,本地调试

2024-12-03 19:06:45 512

原创 图像分类公开数据集信息汇总

对37个图像分类公开数据集的总结,分别图片数量,类别,以及包含图像内容的一些信息,帮助模型选型。

2024-12-01 11:24:23 2193

原创 pytorch框架的模型定义以及推理数据流向

深度学习网络搭建系列之模型定义

2024-12-01 11:13:56 809

原创 Python后端flask框架接收zip压缩包方法

Python后端flask框架速查

2024-11-22 19:11:37 1192

原创 sigmoid和softmax的异同以及对应的loss解析

激活函数和损失函数联合理解

2024-11-22 19:03:19 719

原创 用go语言后端开发速查

用go语言发送请求和接收请求的快速参考

2024-11-16 17:55:22 851

原创 pytorch模型转onnx的动态batch转换说明

将PyTorch模型(.pth)转换为ONNX格式时,通常需要指定一个batch size。这是因为ONNX模型需要一个固定的输入形状,而批处理大小是输入形状的一部分。

2024-11-08 18:34:50 764

原创 2024最新文字指导图像编辑模型 | Forgedit: Text Guided Image Editing via Learning and Forgetting

在真实或合成图像上进行文本引导的图像编辑,只给定原始图像本身和目标文本提示作为输入,是一项非常普遍和具有挑战性的任务。它需要一个编辑模型来自行估计图像的哪些部分需要编辑,然后。

2024-11-08 18:23:24 1595

原创 Nvidia驱动莫名其妙不好使了?nvidia-smi报错?如何解决?已解决!!

Nvidia驱动莫名其妙不好使了?nvidia-smi报错?如何解决?已解决!!

2024-08-26 19:42:18 1798 4

原创 经典骨干网络结构梳理(包括优缺点、适用场景)

在设计或修改网络时,往往要借鉴以往的经典网络结构,现把近几年经典的网络结构从优点、缺点和适用场景方面总结一下。

2024-08-26 19:36:13 1656

原创 如何选取网络中间的输出?并极简方法可视化

选取网络中间特征输出并可视化

2024-08-14 17:11:47 729

原创 一文理解多标签分类损失函数ASL(Asymmetric Loss)

一文理解asl,从ce到focal loss到asl

2024-08-14 17:11:04 17684

原创 深度学习中卷积算子和dropout算子的作用

卷积算子和dropout算子实战

2024-08-02 18:11:00 1298

异常检测模型快速训练窗口可视化插件

异常检测anomalib框架快速训练窗口可视化插件,框架已支持模型: 1. cfa 2. cflow 3. components 4. csflow 5. dfkde 6. dfm 7. dream 8. efficient_ad 9. fastflow 10. ganomaly 11. padim 12. patchcore 13. reverse_distillation 14. rkde 15. stfpm

2024-04-06

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除