自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(111)
  • 收藏
  • 关注

原创 Transformer架构详细解析:从自注意力机制Self-Attention、词嵌入Embedding、多层编码Encoder-解码Decoder结构、输出层Linear-Softmax等模块解析

Transformer的核心设计理念是“**注意力机制**”,通过注意力权重捕捉序列中任意两个元素的关联的关系,再结合**词嵌入**、**多层编码-解码结构**、**前馈网络**、**归一化等**模块,实现对序列信息的高效建模。本文将严格按照给定流程,详细拆解每一个模块的原理、作用和细节,同时给出直观的图片建议,帮助快速理解。

2026-02-11 17:17:21 898

原创 深度学习RNN详解:原理、变体、应用

在深度学习领域,卷积神经网络(CNN)凭借强大的空间特征提取能力,成为图像、视频等网格结构数据处理的首选;而针对**序列数据**——比如文本、语音、时间序列(股票价格、气象数据),循环神经网络(Recurrent Neural Network, RNN)则占据了核心地位。与CNN的“静态特征提取”不同,RNN最大的优势的是“**记忆性**”,它能利用历史序列信息,捕捉数据中的**时序依赖关系**,比如理解一句话中上下文的逻辑、预测下一个时间点的温度、生成连贯的文本。

2026-02-10 16:47:07 714

原创 神经网络的核心构建模块,理解CNN中卷积层、池化层和全连接层。

在深度学习的视觉任务(图像分类、目标检测、语义分割等)中,卷积神经网络(CNN)凭借其对空间特征的高效提取能力成为主流模型,而**卷积层(Convolution Layer)**、**池化层(Pooling Layer)**和**全连接层(Fully Connected Layer)**正是CNN的三大核心组件。这三层各司其职、层层配合,从原始图像的像素信息中逐步提取低级特征(边缘、纹理)、中级特征(形状、轮廓)和高级特征(物体、场景),最终实现对图像的理解和分类。

2026-02-09 12:50:31 1063

原创 深度学习必懂:BN与LN标准化详解,从原理到实战一文吃透

在深度学习的模型训练中,有两个“不起眼但缺一不可”的核心组件——Batch Normalization(批量归一化,简称BN)和Layer Normalization(层归一化,简称LN)。它们没有激活函数那样“注入非线性”的亮眼作用,也没有注意力机制那样“聚焦关键信息”的强大能力,却默默解决了深度网络训练中最棘手的“数值分布混乱”问题,让模型训练更稳定、收敛更快、效果更优。

2026-02-06 13:04:18 695

原创 深度学习优化器详解:指数加权平均EWA、动量梯度下降Momentum、均方根传递RMSprop、Adam 从原理到实操

在深度学习模型训练中,“优化器”是决定模型能否快速收敛、避免过拟合、达到最优性能的核心组件。而**指数加权平均(EWA)、动量梯度下降(Momentum)、RMSprop、Adam** 这四个算法,更是贯穿了优化器的发展历程——EWA是基础工具,Momentum解决梯度震荡,RMSprop解决学习率适配,Adam则融合三者优势成为工业界标配。

2026-02-05 18:05:03 969

原创 解码AI大模型:从神经网络到落地应用的全景探索

近年来,大语言模型(LLM)以前所未有的速度进入公众视野。从 ChatGPT 到 DeepSeek,从“能聊天”到“能干活”,模型的能力边界不断被刷新。但与此同时,**模型参数**、**Token**、**Embedding**、**自注意力**、**RAG**、**Agent** 等概念,也让不少人产生了一种“看不懂但很厉害”的距离感。

2026-02-03 18:41:35 926

原创 LLM与AI Agent赋能下,MCP与Agent Skill的核心逻辑与生态技术体系

摘要: 本文深度解析LLM、AI Agent、MCP与Agent Skill的协同生态。LLM作为智能核心负责推理与决策,AI Agent统筹任务调度,MCP标准化外部系统连接,Skill提供领域专业知识。四者形成闭环:用户需求经AI Agent分配,LLM拆解任务后调用MCP获取外部数据或Skill执行专业流程,最终输出结果。MCP通过Function Calling实现LLM与外部工具的交互,解决LLM无法直接操作系统的局限;Skill则弥补LLM在行业规范与一致性流程上的不足。该体系通过分层协作(LL

2026-01-28 13:44:08 659

原创 ollama本地化部署deepseek/大模型及其api流式调用

Ollama 是一个轻量级本地大模型运行环境,可以在 Windows / macOS / Linux 上运行主流开源模型。它支持:前往官网:🔗 https://ollama.com/download选择 Windows Installer (.exe) 下载。安装完成后,Ollama 会自动在系统中注册命令行工具 。打开 PowerShell 或 CMD,执行:如果输出版本号(例如 ),说明安装成功。Ollama 默认会把模型文件放在:如果系统盘空间有限,可以修改模型文件路径。关闭 Ollama 服务

2025-10-31 22:15:00 1252

原创 安装Anaconda

它集成了 Python 解释器、大量科学计算库(如 NumPy、Pandas、Matplotlib)、包管理工具(conda)、以及虚拟环境管理功能。如果你刚接触 Python,或者从事数据科学开发,Anaconda 能为你省下大量环境配置的时间。Anaconda 允许你创建多个独立的环境,每个环境可以有自己的 Python 版本和包依赖,互不干扰。简单来说,安装 Anaconda = 自动配置好一个完整的 Python 数据分析环境。只需几分钟安装,即可开始数据分析或建模。Anaconda 自带的。

2025-10-29 18:30:00 943

原创 高性能线程安全的时间有序 UUID 生成器 —— 基于 ThreadLocal 的实现

本文介绍了一个高性能、线程安全的时间有序UUID生成器Java实现方案。该方案采用ThreadLocal机制避免全局锁,通过128位结构设计(48位时间戳+4位版本号+12位序列号+8位线程ID等)实现UUID的时间有序性和唯一性。核心特性包括:毫秒级时间有序、无横杠紧凑格式、线程ID嵌入、时钟回拨保护等。关键实现使用ThreadLocal存储各线程的状态(时间戳和序列号),通过位运算组合时间、线程、机器和随机数信息,确保高并发环境下的性能与安全性。该方案适用于分布式系统日志追踪、数据库主键等需要全局唯一且

2025-07-22 18:30:00 1214

原创 MapStruct vs BeanUtils:对象转换工具性能对比与使用细节

在 Java 开发中,DTO 与实体类之间的属性转换频繁出现,常用工具包括 Spring 的 `BeanUtils` 和编译期生成代码的 `MapStruct`。本文基于实际项目对这两种转换方式进行了性能对比实验,通过连续多次测试,发现 `MapStruct` 在执行效率上显著优于 `BeanUtils`,主要得益于其无反射、纯编译期生成的实现机制。同时,文章还分析了初次调用耗时较高的原因及项目中遇到的 `MapperScan` 路径冲突问题与解决方案,为开发者在项目中选择更高效、可维护的对象转换工具提供参

2025-07-21 13:52:01 754

原创 机器学习基础知识【 激活函数、损失函数、优化器、 正则化、调度器、指标函数】

机器学习核心组件摘要 激活函数:神经网络引入非线性的关键组件,包括Sigmoid(0-1输出)、ReLU(简单高效)、Leaky ReLU(解决神经元死亡)、Tanh(-1-1输出)和Softmax(多分类概率输出)。 损失函数:衡量预测误差的核心指标,MSE/MAE用于回归,交叉熵系列(Binary/Categorical/Sparse)用于分类,Hinge Loss适用于SVM。不同函数对异常值敏感度和优化特性各异。 优化器:模型参数调整算法,梯度下降系列(Batch/SGD/Mini-batch)为基

2025-07-11 18:30:00 1750

原创 [特殊字符]防止 MyBatis-Plus 中模糊查询 `%` 查出全表:实现通配符转义拦截器

在使用 MyBatis-Plus 进行模糊查询时,如果用户传入的。查询,容易引发模糊查询误伤甚至查询全表。符号不加以限制或转义,可能导致严重的。问题,甚至带来数据泄露风险或性能灾难。而添加了本拦截器之后,系统会自动将。从而避免了无意的全表模糊匹配。接口,实现对 SQL 中。如果直接将用户输入的。

2025-06-24 18:30:00 1217 2

原创 线程池参数如何设定?如何动态调整线程池?生产级动态治理全方案

上述在实际生产环境中,根据经验值设定线程池参数的静态配置往往无法满足业务的动态变化需求,因此需要采用。:在 Spring Boot 微服务架构下,通过配置中心动态修改线程池参数。等问题,从而优化线程池的参数配置。策略,以提高系统的吞吐量和稳定性。:复杂业务,基于历史数据预测流量高峰,提前调整线程池大小。在实际生产环境中,监控线程池的运行状态可以帮助我们发现。在生产环境中,线程池的参数不宜固定,而应支持。,以适应不同的业务负载。采集和展示线程池监控数据。中创建仪表盘,查看线程池的。:高并发场景下,结合。

2025-03-25 16:14:07 4201

原创 GO语言的GC(垃圾回收)原理

本文围绕 Go 语言的垃圾回收(GC)机制展开,首先介绍了 GC 的基本概念,包括其自动内存管理的作用、查找可回收对象的可达性分析法,以及 GC Roots 的类型和作用,强调 GC 主要回收堆上对象。接着阐述了 Go GC 的发展历程:Go 1.0 - 1.3 采用标记清除法,标记阶段 STW 影响性能;Go 1.5 引入三色标记法,存在对象丢失问题,通过插入和删除屏障解决;Go 1.8 引入混合写屏障,减少 STW;Go 1.9 及以后从多方面优化,提升了性能和效率。

2025-03-13 17:17:48 1568

原创 垃圾回收GC

垃圾回收(Garbage Collection, GC)是一种自动管理内存的机制,主要用于回收不再使用的对象,防止内存泄漏,并提高程序的稳定性和可维护性。在程序运行过程中,会不断地分配内存来存储各种数据,当这些数据不再被程序使用时,其所占用的内存就变成了“垃圾”。如果不及时回收这些内存,会导致内存泄漏,最终使程序耗尽系统资源而崩溃。垃圾回收机制的主要目的就是自动检测并回收这些不再使用的内存,让开发者无需手动管理内存的分配和释放,从而降低了编程的复杂度,提高了程序的稳定性和可维护性。GC 由运行时系统。

2025-03-13 14:21:30 1161

原创 基于字段的依赖注入、基于 setter 方法的依赖注入以及基于构造函数的依赖注入介绍和用法

基于字段的依赖注入是指直接通过反射机制将依赖对象赋值给目标对象的字段。这种方式简洁直观,不过会降低代码的可测试性,因为无法在不使用反射的情况下为字段赋值。示例代码// 定义一个服务接口// 实现服务接口@Service@Override// 使用基于字段的依赖注入@Component@Autowired代码解释@Autowired注解会让 Spring 框架自动查找合适的实现类,并将其注入到的字段中。在类里,字段被直接注入,无需通过构造函数或者 setter 方法。

2025-03-12 11:24:22 1241

原创 机器学习周志华学习笔记-第16章<强化学习>

机器学习周志华学习笔记-第16章<强化学习>

2024-12-04 14:45:44 1028

原创 机器学习周志华学习笔记-第15章<规则学习>

机器学习周志华学习笔记-第15章<规则学习>

2024-12-03 17:09:35 1113

原创 机器学习周志华学习笔记-第14章<概率图模型>

选择一个参数化的概率分布。

2024-12-03 16:02:17 1557

原创 机器学习周志华学习笔记-第13章<半监督学习>

机器学习周志华学习笔记-第13章<半监督学习>

2024-12-03 13:50:59 1152

原创 机器学习周志华学习笔记-第12章<计算学习理论>

机器学习周志华学习笔记-第12章<计算学习理论>

2024-12-03 10:45:29 955

原创 机器学习周志华学习笔记-第11章<特征选择与稀疏学习>

机器学习周志华学习笔记-第11章<特征选择与稀疏学习>

2024-12-02 17:17:27 992

原创 机器学习周志华学习笔记-第10章<降维与度量学习>

机器学习周志华学习笔记-第10章

2024-12-02 16:21:22 802

原创 机器学习周志华学习笔记-第9章<聚类算法>

机器学习周志华学习笔记-第9章

2024-11-25 16:42:49 820

原创 机器学习周志华学习笔记-第8章<集成学习>

即其。

2024-11-24 14:39:04 887

原创 机器学习周志华学习笔记-第7章<贝叶斯分类器>

机器学习周志华学习笔记-第7章<贝叶斯分类器>

2024-11-24 12:02:58 1362

原创 机器学习周志华学习笔记-第6章<支持向量机>

机器学习周志华学习笔记-第6章

2024-11-23 17:07:34 950

原创 机器学习周志华学习笔记-第5章<神经网络>

机器学习周志华学习笔记-第5章<神经网络>

2024-11-22 10:14:47 1465

原创 机器学习周志华学习笔记-第4章<决策树>

机器学习周志华学习笔记-第4章<决策树>

2024-11-20 11:05:18 1277

原创 机器学习周志华学习笔记-第3章<线性模型>

机器学习周志华学习笔记-第3章<线性模型>

2024-11-19 14:48:36 1207

原创 机器学习周志华学习笔记-第2章<模型的评估与选择>

机器学习周志华学习笔记-第2章<模型的评估与选择>

2024-11-18 19:48:20 1334

原创 机器学习周志华学习笔记-第1章绪论

正如我们根据过去的经验来判断明天的天气,吃货们希望从购买经验中挑选一个好瓜,那能不能让计算机帮助人类来实现这个呢?机器学习正是这样的一门学科,人的“经验”对应计算机中的“数据”,让计算机来学习这些经验数据,生成一个算法模型,在面对新的情况中,计算机便能作出有效的判断,这便是机器学习。P:计算机程序在某任务类T上的性能。T:计算机程序希望实现的任务类。E:表示经验,即历史的数据集。若该计算机程序通过利用经验E在任务T上获得了性能P的改善,则称该程序对E进行了学习。

2024-11-18 16:20:47 1074

原创 机器学习中回归任务、分类任务常用的算法

回归任务:主要包括线性回归、决策树回归、支持向量回归、随机森林和梯度提升回归。适用于连续值预测问题,如房价预测、销售额预测等。特点:回归算法通常基于最小化误差,通过拟合一条最优曲线预测目标值。选择建议:数据量小时首选线性回归;数据量大且复杂时,随机森林和梯度提升是不错的选择。分类任务:包括逻辑回归、K近邻算法、支持向量机、决策树分类、随机森林分类、朴素贝叶斯分类。适用于离散值分类问题,如垃圾邮件识别、图像分类等。特点:分类算法通常通过最大化边界或使用集成方法来提高分类准确率。选择建议。

2024-10-30 10:56:27 2968

原创 无监督学习之聚类

聚类在机器学习中是一个非常重要的工具,能够帮助我们理解数据、改善数据质量、提供个性化服务以及识别潜在问题。无论是在商业、科学还是工程领域,聚类都有着广泛的应用。通过合理的聚类分析,可以为决策提供有力的支持。无监督学习:在没有标签数据的情况下,聚类算法可以自动发现数据中的模式。特征发现:聚类可以帮助识别数据中的重要特征,这些特征可能对后续的监督学习任务有帮助。数据压缩:通过聚类,可以用少量的聚类中心来表示大量的数据点,从而实现数据压缩。决策支持。

2024-10-30 09:51:07 2754

原创 回归、分类模型的评估指标

混淆矩阵是一种表格,用于展示分类模型在各个类别上的正确预测和误分类的数量情况。它能够详细描述分类器的表现,尤其在多分类任务中。

2024-10-24 16:12:53 1716

原创 监督学习之逻辑回归

Py1∣xσz11e−zPy1∣xσz1e−z1​Py1∣xP(y=1|xPy1∣x) ) 是给定特征 (xxx) 时,因变量 (yyy) 等于 1 的概率。zβ0zβ0​β1x1\beta_1x_1β1​x1​β2x2β2​x2​\ldotsβnxnβn​xn​) 是线性组合。σz\sigma(z)σz) 是 sigmoid 函数,将输出值映射到000。

2024-10-23 20:23:10 1480

原创 监督学习之线性回归

线性回归是机器学习中最基础且广泛使用的回归算法之一,用于预测因变量(目标变量)和一个或多个自变量(特征变量)之间的线性关系。它通过找到一条最佳拟合直线,最小化数据点与直线之间的误差来进行预测。yβ0β1x1β2x2⋯βnxnϵyβ0​β1​x1​β2​x2​⋯βn​xn​ϵ( y ) 是目标变量(因变量)。x1x_1x1​x2x_2x2​\dotsxnx_nxn​) 是自变量(特征变量)。

2024-10-22 10:52:12 1046

原创 机器学习和深度学习常用的工具库

一、机器学习常用库1. Scikit-learn简介:一个基于Python的机器学习库,专注于经典的机器学习算法。特点:提供了多种分类、回归、聚类和降维算法。具有统一的API,便于使用。集成了数据预处理、模型选择和评估等功能。应用:用于教育、数据分析和快速原型开发。2. NumPy简介:用于科学计算的Python库,支持大规模的多维数组和矩阵。特点:提供了许多数学函数来操作数组。高性能,适合进行数值计算。应用:数值计算和数据处理的基础库,常用于机器学习前的数据处理

2024-10-16 15:30:47 1072 2

原创 机器学习与深度学习的分类

机器学习和深度学习各有分类和算法,各自适用于不同的问题。机器学习在特定任务上相对简单、易于解释,但在处理复杂模式时可能表现不佳;而深度学习通过复杂的模型能够处理高维数据,但训练成本高且需要大量数据。选择适当的算法和方法,基于具体的应用场景和数据特点,可以更好地实现问题的解决。

2024-10-16 15:09:42 2931

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除