- 博客(51)
- 收藏
- 关注
原创 (9)批量生成文章并同步存入 MySQL 和 Redis
本文介绍了如何利用Java业务逻辑与大模型(LLM)自动生成能力编写集成测试类。技术选型包括LangChain4j调用本地Ollama(Gemma 3)模型、Spring Boot Test框架和现有业务Service。最终效果在前端和Redis Stack中均有展示,验证了该方案的可行性。
2026-04-17 16:11:31
382
原创 (7)为 RAG 系统接入 Redis Stack 实现向量持久化
摘要:本文介绍了如何将Redis Stack引入Spring Boot项目,替代内存向量存储实现持久化。通过Docker部署Redis Stack,解决了Windows环境插件安装问题。项目改造包括添加LangChain4j依赖、配置RedisEmbeddingStore,并验证了重启后数据持久化的效果。
2026-04-14 20:39:17
345
原创 多用户跨学科交流系统(6):RAG(检索增强生成)架构
本文介绍了如何基于RAG(检索增强生成)架构改造传统MySQL模糊搜索系统,实现语义化智能搜索。系统采用Spring Boot 3+本地大模型Ollama(Gemma 3)+向量数据库的技术栈,通过LangChain4j实现文档切片、向量化和检索功能。改造分为三个核心环节:1)文章发布时同步存入MySQL和向量数据库;2)用户提问时通过向量相似度检索相关文本片段;3)将检索结果输入大模型生成回答。文章详细记录了架构设计、实现步骤和典型问题解决方案。
2026-04-14 16:11:46
359
原创 深度学习核心架构全解析
本文解构了智能计算系统中的核心模型架构,从卷积神经网络(CNN)的算子本质到目标检测(YOLO/Faster R-CNN)的工程实现,再到序列模型(RNN/LSTM)与生成对抗网络(GAN)的演进逻辑。涵盖了感受野计算、IoU/NMS 算法、门控机制等核心理论。
2026-04-14 09:25:33
370
原创 基于CNN的图像检测算法
目标检测通过图像分类和定位实现物体识别与定位,输出带类别标签和置信度的边界框。经典架构包括Backbone(特征提取)、Neck(多尺度特征融合)和Head(预测框位置和类别)。算法分为Two-Stage(如Faster R-CNN,精度高但慢)和One-Stage(如YOLO,实时性强)两大派系。核心组件包括:Anchor Box(预设参考框)、IoU(评估预测框与真实框重合度)和NMS(去除冗余框,优化检测结果)。NMS因涉及大量计算,常需加速优化。
2026-04-14 09:21:15
253
原创 从零构建四则运算编译器——基于 Flex & Bison
本文介绍如何利用Flex和Bison工具构建一个支持优先级的四则运算解析器。系统采用分层架构:Flex负责词法分析,通过正则表达式识别数字和运算符并生成Token;Bison负责语法分析,通过三层上下文无关文法(表达式、项、因子)实现运算优先级。
2026-04-12 19:28:36
420
原创 矩阵乘加速@CPU
本文通过优化访存延迟和计算效率来提升CPU矩阵乘法性能。实验使用4096×4096矩阵,对比了五种优化方法:1) 基础三层循环;2) 1x4循环展开;3) 1x4展开+寄存器优化;4) 4x4展开;5) 4x4展开+寄存器优化。关键优化手段包括减少循环次数、利用寄存器暂存中间结果、复用数据提升缓存命中率。代码实现考虑了跨平台兼容性,使用gettimeofday精确计时,并通过动态内存分配处理大矩阵。这些方法逐步提升了计算效率,为高性能矩阵运算提供了优化思路。
2026-04-12 19:26:21
383
原创 将Ubuntu从C盘移动到D盘
这两个就是就是 WSL2(Linux)的“虚拟硬盘”,也是让我的C盘爆红的罪魁祸首。你备份的ubuntu_backup.tar导入后页可以删除了。注意:如果要移动多个实例的虚拟硬盘,必须各自创建一个文件夹。结果可以作为你等下对实例或者存放的文件夹进行命名的依据。这是后就移动完毕,再看一眼c盘空间已被释放。
2026-04-08 19:28:54
107
原创 从零搭建 Spring Boot 3 + 本地大模型 (Ollama) 的 AI 开发环境
🚀 实验环境准备操作系统: Windows 11开发语言: Java 21+ (Spring Boot 3.x)AI 引擎: Ollama本地模型: Gemma3:4b (Google 开源轻量化模型)集成框架: LangChain4j (Java 界的 LangChain)
2026-04-04 18:20:59
605
原创 深度解构栈内存的物理逻辑与系统保护
本文深入探讨了计算机系统中栈的本质与工作机制。揭示了栈在物理上仅是内存中的连续地址段,分析了现代计算机采用栈向下生长的设计哲学,解释了局部变量分配通过SUB SP指令一次性完成的机制。特别指出了栈溢出在无保护系统中的隐蔽危害,以及Linux通过虚拟内存和Guard Page提供的防护机制。最后对比了进程主栈、线程栈和裸机系统中栈布局的差异,强调了不同环境下内存安全面临的挑战。
2026-04-03 21:06:15
425
原创 实现一个“微型多任务调度器” (Mini Task Scheduler)
本文摘要: 实验通过ARM架构实现多任务切换的裸机程序,主要包含以下内容: 上下文切换原理、关键实现、实验效果、技术细节等。深入展示了操作系统任务调度的底层机制。
2026-04-03 21:02:43
395
原创 ARM 汇编核心语法速查
本文介绍了ARM汇编的核心概念,重点讲解了寄存器与加载-存储架构的工作原理。主要内容包括:1)LDR和STR指令用于内存与寄存器间的数据传输;2)PUSH和POP指令管理栈操作;3)ARM寄存器的功能分工,如R0-R3用于参数传递,SP指向栈顶等。最后推荐了ARM官方文档和Compiler Explorer等学习资源。通过阅读汇编代码,可以更深入地认识计算机系统的工作原理。
2026-04-02 20:02:21
457
原创 在 QEMU 上实现 ARM 裸机程序与底层原理解析
Zero-Copy(零拷贝)技术(如 Kafka 或高性能推理框架)理解了 MMIO,就能理解为什么 DMA 搬运数据不需要 CPU 参与。本质上就是:我不移动数据,我只把存放数据的“物理地址”告诉网卡或显卡,让它们直接去读。资源开销的颗粒度当我们在高级语言里申请一个 buffer 时,通过本实验可知,底层经历了符号重定位、栈增长和 Cache 映射。
2026-04-02 09:35:04
430
原创 正则表达式(Regular Expression) 简明指南
正则表达式简明指南。本文介绍了正则表达式的基本语法和使用方法: 字符匹配、重复匹配、组合与选择。推荐了regex101.com这个在线工具,可实时测试和调试正则表达式。
2026-04-01 20:27:20
256
原创 基于 CNN 的图像分类算法变迁史(概述)
视觉算法的发展历程展现了从基础卷积到高效架构的演变。LeNet(1998)开创了卷积网络范式,AlexNet(2012)通过ReLU和GPU并行实现突破。VGG(2014)采用规整的3x3卷积提升效率,GoogLeNet(2014)通过Inception模块实现结构创新。ResNet(2015)利用残差连接解决了深层网络退化问题。最后,MobileNet/ShuffleNet(2017+)针对移动端需求,采用深度可分离卷积大幅降低计算量。
2026-03-31 10:26:37
243
原创 CNN卷积输出尺寸计算(公式+实例)
注意: 如果结果不是整数,通常采用“向下取整”(Floor),但在某些框架的特定 Padding 模式下会有不同,建议以整数对齐为准。输出尺寸为 3x3。可以看到,步长 S=2 成功让图像面积缩小了 4 倍以上。假设输入 7x7,卷积核 3x3,填充 0,步长 2。此时卷积核的有效尺寸F会发生变化。
2026-03-31 09:05:31
155
原创 (二)神经网络基础
本文系统介绍了神经网络的核心原理与设计方法。对比了机器学习与神经网络的区别。详细解析了神经网络的训练流程。重点阐述了神经网络设计的三大原则。最后讨论了过拟合问题及正则化解决方案,并介绍了交叉验证方法。
2026-03-28 20:12:48
388
原创 MSE、MAE、Binary/Categorical Cross-Entropy、HingeLoss五种损失函数的典型应用场景
损失函数选择指南:没有万能的损失函数,需根据业务需求选择。回归任务中,MSE对离群点敏感,适合严格误差控制的场景(如自动驾驶);MAE则更抗干扰,适用于含噪声的数据(如金融分析)。分类任务中,交叉熵系列(二分类/多分类)强调概率准确性,适合需要高置信度的场景(如医疗诊断);而Hinge Loss注重分类边界,计算高效(如SVM文本分类)。选择时需权衡误差容忍度、计算效率与业务目标。
2026-03-28 19:50:42
329
原创 高性能计算入门实战:我的第一个性能测试
摘要 本文记录了作者从零开始学习高性能计算的实验过程。通过编写一个计算1亿次平方根求和的C程序,作者逐步探索了程序性能分析方法:使用time命令测量运行时间、调整问题规模观察时间变化、尝试编译器优化选项-O2。实验结果显示,-O2优化能带来27%的性能提升。作者总结了这些实践与高性能计算核心概念的对应关系,包括基准测试、性能测量、算法复杂度和编译器优化等。最后,作者提出下一步将学习OpenMP并行编程以进一步提高性能。这种先动手实践,再理解理论的学习方式为初学者提供了有益的参考。
2026-03-23 16:46:00
376
原创 Linux命令总结
命令一句话描述ls列出目录内容cd切换当前工作目录pwd显示当前所在目录的绝对路径mkdir创建新目录rmdir删除空目录rm删除文件或目录cp复制文件或目录mv移动文件或目录,或重命名ln创建硬链接或符号链接touch创建空文件或更新文件时间戳。
2026-03-23 14:51:05
371
原创 AI-DSL实践:指令驱动型并行算子执行器
本文介绍了一个基于Java多线程的AI算子并行执行框架。系统通过定义OpNode类构建AST节点,接收前端指令字符串并解析为可执行任务。核心实现采用ThreadPoolExecutor线程池,将ReLU激活函数等计算任务分割为子任务并行处理,利用HPC思想提升性能。代码展示了从指令解析、任务调度到并行计算的完整流程,重点包括:1)编译原理中的AST构造;2)线程池并发执行机制;3)神经网络ReLU算子的分片计算。
2026-03-22 10:18:56
204
原创 为什么我的 16 核 CPU 跑并行计算反而慢了?—— Java 并行性能陷阱全解析
AI后端开发的核心技术:编译原理与并行计算 本文探讨了AI后端开发中两个关键技术:编译原理和并行计算。在编译原理部分,文章分析了不同文法类型在数据处理中的应用,并展示了从字符串到可执行代码的完整编译链路,重点说明了AST在AI安全中的作用。在并行计算部分,通过Java代码实例演示了矩阵并行处理的技术实现,包括ForkJoinPool的使用、任务粒度控制以及并行代价验证。文章还对比了ThreadPoolExecutor和ForkJoinPool的适用场景,强调在AI推理任务调度中合理使用线程池的重要性。这些底
2026-03-21 10:19:26
357
原创 AI计算系统实战:从算子实现到GPU性能调优
(入门级)本文记录基于 RTX 4060 硬件环境的深度学习底层优化实践。内容涵盖算子开发,性能诊断,显存优化。
2026-03-19 10:24:15
359
原创 Spring 源码探秘:当 XML 撞上 JavaConfig,谁才是真正的赢家?
本文通过一个简单的 Maven 实验,实证了 Spring 内部的“图纸置换理论”:当冲突发生时,Spring 是如何通过覆盖 BeanDefinition 来抹除旧配置痕迹的。
2026-02-13 22:08:58
304
1
原创 多用户跨学科交流系统(5):点赞功能的后端完整处理链路
本文介绍了基于Redis的点赞系统设计,通过Redis的Set数据结构实现高频点赞操作的高效处理。系统采用双存储方案:Redis处理实时点赞状态(防止重复点赞、快速查询),MySQL仅存储最终点赞数。关键实现包括:1)Redis配置与模板类;2)JWT过滤器改造以携带用户ID;3)ThreadLocal维护用户上下文;4)数据库仅新增点赞数字段。该方案有效解决了传统点赞系统在高并发场景下的性能瓶颈问题。
2025-11-22 19:25:58
924
原创 多用户跨学科交流系统(4)参数校验+分页搜索全流程的实现
摘要:本文介绍了Spring Boot项目中参数校验与JWT登录保护的实现方案。参数校验通过在实体类和DTO上添加注解(如@NotBlank、@NotNull),配合@Valid注解和全局异常处理实现统一校验。针对JWT登录保护,优化了Security配置和Filter实现。
2025-11-16 21:15:44
690
原创 多用户跨学科交流系统(3):评论模块与 Spring Boot 全局异常处理
本篇在完成评论模块基础功能后,引入统一异常处理体系,包含全局异常捕获、业务异常 BusinessException 与 ResponseEntity 封装。通过对服务层与控制层的改造,使接口返回更加规范,也为后续的权限、安全和更复杂的业务逻辑奠定基础。
2025-11-15 10:54:29
818
原创 多用户跨学科交流系统(2):文章模块(Topic、Post)
该系统基于原有博客系统进行改造,新增学科分类和主题讨论字段。在上一篇“表设计+登录注册接口实现”的基础上详细说明了Topic和Post模块的实现。
2025-11-13 10:06:14
666
原创 多用户博客系统搭建(1):表设计+登录注册接口
本文介绍了一个基于Spring Boot的多用户博客系统的开发过程,主要包括表结构设计、用户注册登录功能实现。系统采用MySQL数据库,,使用bcrypt加密存储密码。后端通过MyBatis实现数据访问,Spring Security进行密码加密和验证,提供RESTful API接口。文章详细展示了用户模块的开发流程,包括实体类定义、Mapper接口编写、业务逻辑处理以及控制器实现,并建议使用Apifox进行接口测试。该系统适合初学者学习Spring Boot项目开发。
2025-11-08 10:47:28
776
原创 Spring Boot 注册登录接口进阶(bcrypt密码加密 + Apifox 测试)
本部分使用 Spring Boot 实现用户注册与登录接口,通过 BCrypt 加密密码保障安全,并用 Apifox 进行接口测试,适合初学者快速上手。
2025-11-07 22:07:16
756
1
原创 Spring Boot——最简单的方式写一个接口:项目构建 + 分层实战
文章重点通过分层架构示例,演示了Controller层如何接收请求并调用Service层以及接入数据库的业务逻辑。其次,演示Spring Boot项目构建的两种方法,同时讲解了Spring的核心概念IOC容器和依赖注入机制,适合刚接触Spring Boot的Java开发者快速上手。
2025-11-03 20:27:43
1049
5
原创 Java 多线程编程入门:从创建到并发控制
本文系统讲解 Java 多线程编程的核心知识,涵盖三种线程创建方式、线程安全与 synchronized/volatile 的使用、常见并发问题的分析与避免。接着介绍 java.util.concurrent 包中的核心工具类,最后深入线程池(ExecutorService)。
2025-10-26 16:21:46
1063
原创 Java 文件与 IO 操作全景图:四层架构 + 实用指南
本文将 IO 操作分为四层:文件管理(File/Path)、数据流动(Stream/Reader)、效率提升(Buffered Streams)和现代方式(NIO.2),并结合实际场景说明每层的作用与使用时机,帮助你彻底理清 Java IO 的脉络。
2025-10-24 23:05:32
555
原创 无硬件学习物联网。用 Python + ThingSpeak 打造实时温湿度监控系统
跳过硬件环节,直接用 Python 脚本模拟传感器数据,并通过 ThingSpeak 平台构建一个监控系统。
2025-09-19 10:45:30
529
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅