自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

郑恩赐,厦门工学院软件工程AI方向本科在读。专注AI全栈应用开发,熟练Vue3、Spring Boot、PyTorch等技术栈,正在探索多模态大模型应用。拥有多个全栈项目和AI应用开发经验,获国家级大创立项和发明专利,掘金优质作者榜第2名。

专注AI全栈开发技术分享,涵盖Vue3、Spring Boot、PyTorch等技术栈实践。深入探索多模态大模型应用,分享深度学习模型设计、目标检测、行为识别等AI技术。结合实战项目经验,提供从理论到落地的完整技术解决方案。

  • 博客(114)
  • 收藏
  • 关注

原创 06-多头注意力机制 [特殊字符]

本文档深入讲解多头注意力机制(Multi-Head Attention)的核心原理,涵盖多头注意力的概念定义与设计动机、数学公式的完整推导、手动代码实现及逐行解析、PyTorch 原生 nn.MultiheadAttention 的使用方法、多头注意力权重的可视化对比,以及一个完整可运行的综合示例。通过理论与实践相结合的方式,帮助读者彻底吃透多头注意力机制 🛠️

2026-05-07 12:29:45 226

原创 05-自注意力机制详解 [特殊字符]

本文档深入讲解自注意力机制(Self-Attention)的核心原理,涵盖自注意力的概念定义与产生背景、QKV三大角色的直观理解与线性变换的作用、自注意力与交叉注意力的本质区别、掩码自注意力(Padding Mask 与 Causal Mask)的完整解析、手动代码实现及逐行讲解,以及注意力权重可视化方法。通过理论与实践相结合的方式,帮助读者彻底吃透自注意力机制 🛠️

2026-05-06 20:15:22 229

原创 01d-前馈神经网络代码实现 [特殊字符]

本文档基于 PyTorch 从零实现前馈神经网络,涵盖感知机的代码实现与局限性验证、前馈神经网络解决异或(XOR)问题的完整代码及逐行解析、激活函数的可视化对比、训练循环的逐步拆解,以及一个完整可运行的综合示例。通过理论与实践相结合的方式,帮助读者深入理解前馈神经网络的代码实现细节 🛠️

2026-05-06 00:38:38 210

原创 04-缩放点积注意力代码实现 [特殊字符]

本文档基于 PyTorch 从零实现缩放点积注意力机制,涵盖环境准备、手动实现完整代码及逐行解析、PyTorch 原生优化函数的使用、注意力权重可视化方法,以及一个完整可运行的综合示例。通过理论与实践相结合的方式,帮助读者深入理解注意力机制的代码实现细节 🛠️

2026-05-04 23:33:13 221

原创 03ab-PyTorch安装教程 [特殊字符]

PyTorch是一个由Facebook开发的开源深度学习框架,从2016年发布至今已经成为学术界和工业界最受欢迎的深度学习工具之一。相比TensorFlow,PyTorch的最大特点是动态计算图,这意味着你可以在代码运行时随时改变网络结构,调试起来非常方便。

2026-05-03 23:12:19 460 1

原创 03aa-PyTorch迅雷加速下载小妙招 [特殊字符]

pip 下载 PyTorch 大文件慢?本小妙招提供迅雷加速下载方案,通过手动下载 + 本地安装,轻松突破网络限制,快速完成 PyTorch 环境搭建。

2026-05-03 17:50:24 401

原创 03-注意力机制基础 [特殊字符]

这一节我们要学习Transformer的核心——注意力机制,它是Transformer如此强大的关键所在 🎯

2026-05-03 16:22:07 433

原创 02a-什么是矩阵

本文介绍矩阵的基本概念、运算规则(加减乘除、转置、求逆),以及在机器学习中的应用,包括数据表示、线性回归、神经网络和PCA降维。

2026-05-02 22:20:59 459

原创 M5-markconv自定义CSS样式指南 [特殊字符]

本文档介绍 markconv 支持的自定义 CSS 样式功能,用于美化 HTML 和 PDF 输出。

2026-05-01 19:09:31 141

原创 M4-更新日志v0.1.3-Mermaid图表支持 [特殊字符]

今天来聊聊 0.1.3 版本的新变化,这次我们带来了一个超棒的特性——Mermaid 图表支持!🎉

2026-05-01 19:03:10 44

原创 02-序列到序列模型

本文档系统讲解了序列到序列(Seq2Seq)模型的核心概念、技术演进和关键机制。从最早基于RNN的Seq2Seq架构,到注意力机制的引入,再到Transformer的横空出世,我们深入剖析了每一步技术突破背后的原理和动机。通过机器翻译、文本摘要、对话系统等实际案例,帮助读者理解Seq2Seq如何在各种NLP任务中发挥作用。注意力机制作为连接传统Seq2Seq和现代Transformer的桥梁,是我们重点探讨的内容。

2026-05-01 11:37:22 341

原创 O04-马斯克起诉OpenAI世纪诉讼全解析 [特殊字符]

2026年4月,全球最受关注的AI法律大战——马斯克起诉OpenAI案正式开庭,这场诉讼不仅关乎一家公司的命运,更将重塑整个AI行业的未来走向。

2026-05-01 11:22:38 412

原创 O03-Git入门

本文是 Git 入门教程,面向零基础用户。内容涵盖 Git 概念、安装配置、日常操作命令(add/commit/status/diff/log)、版本回退等核心知识,并提供完整的实战练习。适合作为 Git 学习的第一篇文档。

2026-04-27 17:43:40 509

原创 O02-Git命令大全

Git 是目前最流行的分布式版本控制系统,掌握 Git 命令是每个开发者的必备技能。本文档将系统整理 Git 的所有命令,按功能分类,方便查阅和学习。

2026-04-27 17:34:41 386

原创 S10-蓝桥杯 17822 乐乐的积木塔

本文详细解析蓝桥杯17822题"乐乐的积木塔",重点剖析题目中"连续递减积木塔"等绕口表述的真实含义,分享个人从困惑到理解的解题历程,并提供简洁的Python题解。

2026-04-25 23:53:23 455

原创 01d-前馈神经网络

前馈神经网络(Feedforward Neural Network,FNN)是最基础的神经网络架构,信息从输入层单向流动到输出层,中间经过隐藏层的处理和变换。因为数据像水流一样"往前"流动,不会倒流回去,所以叫"前馈"。它是深度学习的基石,几乎所有复杂网络(CNN、RNN、Transformer)都是由它发展而来。

2026-04-25 13:23:38 345

原创 01c-循环神经网络RNN详解

本文档将带你深入理解循环神经网络(RNN),从基本原理到实际应用,掌握处理序列数据的核心技术。我们将学习RNN的结构、训练方法、常见变体及其局限性,为后续学习LSTM和Transformer打下坚实基础。

2026-04-24 20:25:39 436

原创 01b-上下文向量与信息瓶颈

上下文向量(Context Vector)是 Seq2Seq 模型的核心组件,它是编码器对输入序列的"语义总结",作为编码器和解码器之间的唯一信息桥梁。然而,固定长度的上下文向量存在严重的信息瓶颈问题:无论输入序列多长,所有信息都被压缩到一个固定维度的向量中,导致长序列的关键信息容易丢失。本文档将深入探讨上下文向量的生成机制、信息瓶颈的本质,以及注意力机制如何从根本上解决这一问题。

2026-04-22 22:47:02 431

原创 01c-LSTM与GRU门控机制详解

本文深入讲解 LSTM(长短期记忆网络)和 GRU(门控循环单元)的门控机制原理。😊 我们将从传统 RNN 的梯度消失问题出发,详细剖析 LSTM 的三个门(遗忘门、输入门、输出门)和 GRU 的两个门(更新门、重置门)的工作机制,并通过数学公式和直观类比帮助你理解这些"门"如何控制信息流。掌握门控机制是理解现代序列模型的关键一步!

2026-04-22 19:25:31 614 2

原创 01a-编码器解码器架构详解

本文系统讲解编码器-解码器(Encoder-Decoder)架构的核心原理与演化历程。😊 我们将从自编码器(Autoencoder)的基础结构出发,深入探讨变分自编码器(VAE)的概率生成机制,再到 Seq2Seq 模型的序列转换能力,最后延伸至现代大语言模型(BERT、GPT、T5)中的三种架构变体。通过本文的学习,你将掌握编码器-解码器架构的设计思想,理解不同架构的适用场景,为学习 Transformer 和深度学习奠定坚实基础。🚀

2026-04-21 20:23:32 443

原创 P2H-Python字符串格式化完全指南-format和f-string的Python编程利器

本文全面讲解 Python 三种字符串格式化方式:% 格式化(旧式)、format 方法(新式)和 f-string(现代)。通过对比分析,帮助读者掌握从基础到高级的字符串处理技能,特别推荐 Python 3.6+ 的 f-string 作为首选方案,享受简洁语法和极致性能。

2026-04-13 13:47:07 585

原创 P2G-Python字符串方法完全指南-split、join、strip、replace的Python编程利器

字符串是 Python 中最常用的数据类型,本文详细介绍四个最实用的字符串方法:split 分割、join 拼接、strip 去除空白、replace 替换。掌握这些方法,让你处理文本效率翻倍 💪

2026-04-12 22:36:11 642

原创 P2B-Python可迭代对象完全指南-从列表到生成器的Python编程利器

可迭代对象是 Python 中非常重要的概念,列表、元组、字符串、字典、集合等都是可迭代对象。本文详细介绍了可迭代对象和迭代器的区别,以及如何创建它们,包括用 iter()、实现 __iter__ + __next__、用 yield 生成器等多种方式。掌握这些知识,你就能更好地理解 Python 的迭代机制,写出更高效的代码 💪

2026-04-12 21:34:24 558

原创 M3-markconv库找不到wkhtmltopdf问题

在使用 markconv 进行 PDF 转换时,你可能会遇到 OSError: No wkhtmltopdf executable found 错误。这表示系统没有安装 wkhtmltopdf 工具,只需要安装它就能解决 💪

2026-04-12 01:52:37 222

原创 P2F-Python集合完全指南-从创建到去重集合运算的Python编程利器

集合(Set)是 Python 中一种非常实用的数据结构,核心特点是无序且唯一。它最大的用途就是去重,另外还有高效的成员检测和丰富的集合运算(并集、交集、差集等)。本文我们将从零开始,系统学习集合的创建、基本操作、运算方法、去重应用,以及不可变的 frozenset。通过大量代码示例和图表,帮助我们快速掌握集合的各种用法 💪

2026-04-10 13:45:02 372

原创 P2E-Python字典操作完全指南-从增删改查到遍历嵌套的Python编程利器

面向零基础,系统讲解 Python 字典(Dictionary)核心操作:增删改查、遍历、嵌套。通过生活化比喻与实战对比,掌握字典的高效操作方法,快速提升编程能力。

2026-04-10 11:19:47 215

原创 01-Transformer基础概念

Transformer是2017年Google提出的深度学习架构,通过纯注意力机制实现了序列数据的并行处理和长距离依赖建模。它是BERT、GPT等所有大语言模型的基础架构,已成为当代人工智能的核心技术。

2026-04-04 11:56:53 333

原创 00-Transformer技术专栏链接目录

Transformer是2017年Google提出的深度学习架构,是GPT、BERT等大语言模型的基石。本专栏涵盖核心概念、注意力机制、模型架构及实战应用,帮助开发者从入门到精通掌握Transformer技术。

2026-04-04 10:56:56 353

原创 M2-如何转换为PDF

这篇文章介绍了markconv工具如何将Markdown文档转换为PDF格式,内容包括环境准备(安装wkhtmltopdf引擎和Python依赖)、基本使用方法(通过MDConverter类实现转换)、自定义CSS样式美化支持,以及提供完整示例代码。相比传统方式,该工具简化了配置流程,仅需几行代码即可生成高质量PDF,并附有相关技术文档链接供深入学习。

2026-03-29 13:56:06 380

原创 M1-如何转换为HTML

通过上篇文档的学习,我们了解了 mdtool 这个简单、高效、免费的 Markdown 转换工具库,以及为什么我们需要这样的工具。现在让我们深入探讨如何使用 mdtool 将 Markdown 文档转换为 HTML 格式吧!🚀

2026-03-28 17:16:18 299

原创 M0-markconv 背景及链接目录

mdtool 是一个 Python 库,旨在提供简单易用的 Markdown 转换功能。该库支持将 Markdown 文档转换为多种格式,方便用户在不同场景下使用。

2026-03-27 09:24:12 313

原创 L1D-Linux系统Node.js部署Claude Code完全指南 [特殊字符]

本文档将介绍如何使用 Node.js 在 Linux 系统中安装和部署 Claude Code!我们会一步步完成整个安装过程,从环境准备到内网部署,让你轻松上手!💪

2026-03-25 15:48:47 461 2

原创 J7A-已有数据表如何安全添加新字段 [特殊字符]️

本文介绍了JPA环境下安全添加数据库字段的方法与注意事项。直接添加字段需谨慎处理生产环境的ddl-auto配置(推荐validate或none),通过手动SQL脚本执行变更,并强调版本控制与测试验证。新建关联表方案适合频繁扩展场景,通过解耦主表提升灵活性,但需处理JOIN查询复杂度。两种方法对比显示:少量字段用直接添加(简单高效),复杂需求选关联表(扩展性强)。关键建议包括:生产环境避免自动DDL、变更需备份、低峰期操作及严格监控。

2026-03-21 12:11:41 435

原创 个人简历ovo

个人简历

2026-03-20 13:59:42 1174

原创 8d-布隆过滤器是什么?

通过上篇文档08c. 检索算法与策略-混合检索的学习,我们掌握了多种检索技术的组合应用。现在让我们来了解一个在数据处理中非常实用的数据结构——布隆过滤器(Bloom Filter),它就像是一个"快速检查员",能帮我们高效判断元素是否存在。

2026-03-18 15:05:23 381

原创 J0A-JPA持久化技术专栏链接目录

Java持久化API(JPA)是Java EE规范中用于对象关系映射(ORM)的标准接口,现已成为Jakarta Persistence API。本专栏基于最新技术趋势,涵盖JPA核心概念、实体建模、Repository设计、事务管理、性能优化以及SpringBoot集成等关键技术,帮助开发者从入门到精通掌握企业级JPA持久化技术。

2026-03-18 10:57:57 359

原创 J6D-ACID到底是什么?

ACID(原子性、一致性、隔离性、持久性)是数据库事务的四个核心特性,也是保证数据完整性和可靠性的基石。本文档将深入解析ACID每个特性的本质含义、工作原理和实际意义,帮助开发者真正理解事务的核心机制。

2026-03-18 10:49:41 469

原创 P1B-Python环境配置基础完全指南-Windows系统安装与验证

Python是一种高级、解释型、通用的编程语言。在Windows系统上开始Python开发之前,需要正确配置开发环境。本指南专门针对Windows系统,帮助您从零开始配置基础的Python开发环境。

2026-03-17 21:46:10 433

原创 L1C-VMware创建CentOS虚拟机完全指南 [特殊字符]

本指南将带你从零开始,一步步在Windows系统上使用VMware创建CentOS虚拟机,让你轻松搭建Linux学习环境,开启Linux世界的大门! 🐧

2026-03-14 15:21:42 580

原创 Linux基础技术专栏

本专栏专注于Linux系统基础技术,从入门到进阶,系统学习Linux操作系统的核心知识和实用技能。适合后端开发者、系统管理员、运维工程师以及所有对Linux感兴趣的学习者。

2026-03-14 13:26:00 389

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除