AI应用开发工程师-CSDN博客

原创 Java Web 技术架构升级路径总结-十年WEB路

本文总结了Java Web技术架构的演进路径和升级策略，主要分为三个阶段：SSH（Struts+Spring+Hibernate）、SSM（Spring MVC+Spring+MyBatis）和Spring Boot生态。重点分析了各阶段升级的复杂度，指出SSH→SSM迁移最为复杂，涉及Web层和持久层的全面重构，而SSM→Spring Boot则相对平滑，主要改动集中在配置方式。文章对比了不同升级路径的优缺点，推荐根据团队技术储备选择分步或一步到位策略，并提供了风险提示和应对措施。核心结论是：SSH→Sp

2026-06-23 14:40:24 342

原创数据净化大师：从复杂格式到干净文本的工业级解析实战

在大模型微调训练中，数据质量直接决定模型性能天花板。一个在1000个样本上训练的模型，如果数据干净，效果可能超过用10000个脏数据训练的模型。特别是对于强调"手写LoRA"的深度技术岗位，解析（Parsing）能力是构建高质量训练数据的基石。PDF的全策略解析（文本型、扫描件、表格混合）OCR的精度提升与后处理修复文档结构的语义保留与噪声清除解析质量的自动化评估体系原则说明实践要点策略路由不同文档用不同工具先检测类型，再选择最优方案分层清洗编码 → 页眉页脚 → 噪声 → 空白。

2026-06-19 18:57:15 75

原创数据炼金术士的必备技能：MySQL与Crawler在LLM数据工程中的实战

在LLM训练和微调的工作流中，数据质量直接决定模型效果的上限。而MySQL与爬虫（Crawler）这对组合，往往是获取"私有数据"和"新鲜数据"的关键手段。对于强调"手写LoRA"的深度技术岗位，MySQL和Crawler虽然不像模型架构那样处于核心位置，但它们共同构成了高质量训练数据的供应链。本文将从LLM数据工程的角度，深度讲解如何利用MySQL存储、管理和查询训练数据，以及如何设计稳健的爬虫系统从Web获取训练语料。技能核心价值在LoRA训练中的作用MySQL存储、管理、抽取业务数据。

2026-06-19 18:40:40 88

原创深入LangChain与RAG：从基础管道到生产级优化

在"手写LoRA"的思想指导下，我们同样需要深入理解RAG（检索增强生成）的原理，而不是仅仅调用现成API。LangChain作为构建LLM应用的事实标准框架，提供了从文档加载到检索生成的完整工具链。文档分块策略对检索质量的根本影响向量检索的数学原理与性能权衡检索-生成之间的信息瓶颈如何突破生产环境下的优化手段与评估体系本文将构建一个完整的RAG系统，并深入剖析每一层的设计决策。层次优化手段关键组件L1：基础架构文档加载、分块、向量存储、检索生成L2：检索增强混合检索、查询改写、结果重排。

2026-06-19 18:34:15 192

原创 LoRA 底层原理与手写实现：从矩阵分解到梯度传播

在 LLM 微调领域，LoRA（Low-Rank Adaptation）已然成为事实标准。然而，绝大多数开发者接触的都是封装好的高层 API——调用一行就能完成适配，却很少有人真正理解背后发生了什么。手写 LoRA 的完整实现，彻底揭开其数学原理与工程细节。我们将从零开始，不依赖 PEFT 或任何高级库，仅用 PyTorch 的基础组件构建一个可训练的 LoRA 线性层。为什么 LoRA 能实现参数高效微调？rank和alpha分别控制什么？为什么alpha通常设为2×rank？为什么lora_A。

2026-06-19 18:28:44 298

原创 Hugging Face + Transformer 从入门到精通：架构理解、模型加载与微调实战

在当今大模型时代，Transformer 架构是所有前沿模型（GPT、LLaMA、Qwen、Gemma 等）的共同底座。而 Hugging Face 平台则提供了通往这些模型的"高速公路"——无论是加载预训练权重、进行推理，还是执行 LoRA/QLoRA 微调，Hugging Face 生态都是开发者绕不开的利器。Transformer 架构：从注意力机制到编码器-解码器结构Hugging Face 核心工具链：AutoModel、Pipeline、Tokenizer、Datasets 的使用。

2026-06-19 17:55:03 170

原创数据炼金术：从原始数据到模型/ RAG 系统可用格式

在 AI 项目中，数据准备往往占据 80% 的时间，却只被 20% 的教程认真对待。无论是要微调一个大模型，还是搭建一个 RAG 智能问答系统，你首先面对的都是同一批“原始材料”——散落在 PDF、网页、Word 文档中的非结构化文本。这篇文章将带你走完从原始数据到模型可用格式PDF：从扫描件到可解析文本网页：从 HTML 到干净正文统一清洗：去除噪声、统一编码格式转换：生成 JSONL 训练数据向量化分块：为 RAG 系统准备高质量的 chunk读完本文，你将拥有一套可复用的数据处理工具箱。

2026-06-19 17:45:38 213

原创 LLM训练实战手册：Loss解读、学习率调优与梯度问题排查

在大模型训练中，看懂训练日志比写训练代码更重要。当你启动一个千亿参数的训练任务，看着满屏滚动的loss数值，你是否能准确判断：本文将从Loss动力学、学习率策略、梯度异常诊断三个维度，结合真实训练日志和代码示例，帮你建立一套完整的训练监控与故障排查体系。Loss是模型训练的"体温计"，不同任务有不同的Loss函数和解读方式：一份典型的LLM训练日志长这样：我们需要从四个层次解读：1.3 Loss曲线的五大经典模式二、学习率调度：训练的"油门与刹车"2.1 主流学习率调度策略对比2.2 实战：

2026-06-19 17:39:50 178

原创【无标题】

在当今大模型和AI应用爆发的时代，Python早已不只是“胶水语言”，而是连接数据、算法与产品的核心纽带。无论是准备训练数据集、调用开源大模型，还是将模型能力封装成稳定的API服务，Python都扮演着不可替代的角色。本文将围绕数据处理、模型调用、API开发三大板块，结合大模型应用的真实场景，带你构建一套完整的技术实战体系。无论你是想微调自己的LoRA模型，还是搭建基于RAG的智能问答系统，这套技能链都是你的必经之路。技能维度核心能力典型工具/技术数据处理清洗、分块、格式化、向量化模型调用。

2026-06-19 17:26:43 181

原创 AI应用开发框架深度对比：LangChain、Dify、Coze怎么选？

选择AI应用开发框架，本质上是在开发效率和控制力追求极致控制、复杂逻辑→LangChain，前提是接受陡峭的学习曲线追求开发效率、企业级落地→Dify，可视化编排+RAG能力是杀手锏追求快速验证、零代码上手→Coze，插件生态和低门槛是最大优势一句话建议：如果你是开发者且项目复杂，选LangChain；如果你是团队负责人且需要快速交付，选Dify；如果你是非技术背景想做AI应用验证，选Coze。

2026-06-17 23:47:35 290

原创【无标题】

指标基础Prompt结构化Prompt提升输出准确率45%92%⬆️104%格式一致性不稳定稳定⬆️显著人工复核率80%15%⬇️81%核心要点总结System Prompt定义“人设”：角色具体、规则清晰、格式明确Few-shot提供“范例”：2-5个高质量示例，覆盖典型场景调参控制“自由度”：代码生成用低温，创意任务用高温框架选择看场景：LangChain适合复杂编排，Dify/Coze适合可视化工作流Prompt Engineering的本质不是让模型变强，而是。

2026-06-17 23:32:05 227

原创 Java交互打印的问题

本文提供了两个使用Java多线程实现顺序打印的代码版本，均基于Windows平台的互斥量机制：版本A（JDK21通用写法）：使用Project Panama API调用Windows内核函数（CreateEventA/SetEvent等）创建两个自动重置事件对象实现线程同步线程A打印"A"后激活线程B，线程B打印"B"后激活线程A 包含完整的错误处理和资源释放逻辑版本B（JDK22+最新写法）：利用JDK22简化后的Foreign Function API 采用更简洁的函数调用方式保持相同的线

2026-06-09 10:53:49 219

原创本博客写了啥

如果你需要针对某个具体技能（比如“Kubernetes部署细节”或“分布式事务方案”）的实操讲解，可以随时告诉我，我会为你展开详解。

2026-06-09 06:52:22 207

原创 python 环境知多少

命令依赖失败原因python需要 PATH 环境变量指向正确的 python.exePATH 里没有 →'python' 不是内部或外部命令py需要 Windows 注册表里有 Python 安装记录没装 Python →所以你的总结非常准确：py就像一个智能调度员，它不直接执行代码，而是找到真正的 Python 解释器来干活。完全正确！你的理解非常准确。这是py它不依赖环境变量（PATH），而是依赖 Windows 注册表。

2026-04-25 14:53:08 441

原创智能客服的agent 的架构和作用以及源码分析

│ 客户端层 ││▼│ 接入层 ││ │ handle_connect() - 处理客户端连接 │ ││ │ handle_disconnect() - 处理客户端断开 │ ││ │ handle_message() - 处理普通消息 │ ││ │ handle_stream_message() - 处理流式消息 │ ││▼│ 核心引擎层 ││ │ process_message() - 普通消息处理流程 │ ││ │ stream_message() - 流式消息处理流程 │ │。

2026-04-25 12:35:51 477

原创一点一文了解python

Python的核心实现CPython采用C语言编写，其内存管理基于引用计数和垃圾回收机制，所有数据均被视为对象。Python官方规范通过语言参考手册定义语法和语义，并由PEP提案机制管理语言演进。CPython与其他实现（如PyPy、Jython）共同遵循同一套语言规范，但在底层技术侧重不同。

2026-04-23 13:57:24 418

原创 python 常见的框架

Python 的框架生态非常丰富，覆盖了 Web 开发、数据科学、机器学习和人工智能等多个领域。为了方便你了解，我按照应用场景将它们分为几大类，并整理了核心特点。

2026-04-23 13:16:12 292

原创《技术人的学历突围：从专精到卓越的学历战略规划》

《技术人学历突围指南》摘要：本文为技术从业者提供了一套系统的学历提升战略框架。首先破除学历终结论，指出学历应作为职业发展的战略跳板。针对不同职业阶段的技术人员，详细分析了四大提升路径：国内在职硕士、海外在线硕士、行业认证硕士及全日制/MBA项目，并给出具体院校推荐和投入产出分析。文章独创性地提出"时间-精力-收益"三维管理模型，包括在职硕士的分阶段时间规划法和在线硕士的弹性学习策略。同时揭示了学历提升的复合收益，除薪资增长外，更强调人脉网络、知识体系重构等长期价值。最后提供个性化规

2026-04-20 20:58:00 43

原创《构筑技术领导力：体系化认证与学习路径图》

本文提供了一份体系化的技术领导力发展路径图，重点阐述了如何通过战略性地选择和使用技术认证来构建职业竞争力。文章分为六个部分：首先重新定义认证的价值定位；然后按技术专家、技术管理、高价值领域三条路径提供认证体系树；第三部分强调超越证书的能力构建；第四部分给出个性化规划指南；第五部分指出常见误区；最后总结技术领导力公式。全文强调认证应服务于长期职业规划，建议将证书作为能力建设的里程碑而非终点，并提供了具体的学习系统设计和价值放大策略。文章配有职业路径图、学习模板等实用工具，旨在帮助技术人员实现从碎片化学习到体系

2026-04-20 20:37:13 62

原创开发者职业加速服务专栏总结

《职业加速四步闭环系统》是一套深度教练方案，包含：1）战略定位：通过经历审计和市场扫描制定差异化竞争策略；2）价值包装：重构个人叙事，优化简历和社交媒体等专业触点；3）面试通关：聚焦高阶技术面试、领导力对话及薪资谈判；4）持续成长：提供精准学习路径和长期顾问支持。系统强调从经验沉淀到价值呈现的完整闭环，帮助职场人实现可持续竞争力提升。

2026-04-20 20:10:23 64

原创国内常见培训机构比较

综合来看，选择IT培训机构时，您可以基于以下维度进行权衡：1.教学模式与规模：追求个性化辅导和深度实战，可优先考虑汉码未来这类强调小班真实实训的机构；适应标准化、体系化学习，则可考虑传智播客达内等全国性品牌。2.课程方向与前沿性：关注AI、鸿蒙等前沿技术，可考察云和数据的课程体系；深耕云计算、运维领域，马哥教育是专注选择。3.就业资源与数据云和数据公布了较高的量化就业数据，而传智播客的高口碑推荐率也间接证明了其就业效果。选择时务必核实这些数据的真实性和具体构成（如就业城市、企业类型）。4.

2026-04-20 03:00:32 97

原创 S4-2026年IT培训全地图：从入门到专精，这份硬核清单帮你做对选择

的IT技能培训清单，并附上资源平台分析，帮助你像架构师选型一样，为自己的职业发展做出最理性的技术投资。：用1-2周，通过招聘网站（如拉勾、BOSS直聘）分析你的目标岗位（如“Java高级工程师”、“云原生架构师”）的。：自动化测试（UI/接口/移动端）、性能测试、测试框架开发、质量效能平台建设。这份清单不是让你焦虑，而是为你扫除迷雾。：⭐️⭐️⭐️⭐️⭐️ （企业上云和稳定性需求的核心岗位）：⭐️⭐️⭐️⭐️⭐️ （需求基本盘最大，但竞争也最激烈）：⭐️⭐️⭐️⭐️ （合规与安全事件驱动，需求持续增长）

2026-04-20 02:32:57 76

原创简历优化与面试准备的终极指南

《简历优化与面试准备实战指南》摘要：本文提供了一套完整的求职方法论，涵盖简历制作和面试准备两大核心环节。在简历优化部分，强调结构化设计、数据化表达和岗位匹配性，建议采用STAR法则描述项目经历。面试准备部分则从技术面试（算法题、系统设计）和行为面试双维度切入，推荐建立个人知识库和模拟面试机制。文章还提供了实用的资源推荐，包括LeetCode、System Design Interview系列等学习平台，以及Notion、Obsidian等工具。最后指出求职本质是价值呈现与双向匹配的过程，鼓励读者通过体系化

2026-04-20 01:59:30 62

原创实战案例_4个年薪百万的面试

摘要：四个真实案例揭示"年薪百万"成长路径：1）Java架构师需量化技术价值（如优化系统提升QPS）；2）敏捷教练通过"技术+咨询"跨界实现逆袭；3）高并发专家展示分层削峰架构设计能力；4）AI工程师掌握Prompt/RAG等核心技术。共性在于：深度专业化与跨界稀缺性、价值量化能力、结构化思维及持续进化。不同赛道均需将技术能力转化为可量化的商业价值，同时保持对新趋势的敏锐度。

2026-04-20 01:51:40 48

原创《地基搭建——用VP 17.1创建你的第一个参考架构库》

在上一篇文章中，我们聊了“为什么需要架构库”——从重复造轮的痛点，到TOGAF的理论框架，再到架构师的“睡后价值”。架构资产不是画完就扔的图纸，而是需要被系统化管理的核心资产。从哪里开始？你不需要一开始就建一个像TOGAF描述的那样“大而全”的架构库。就像你不会第一天就给代码仓库配上完整的CI/CD流水线一样，架构库的建设也应该从MVP（最小可行产品）开始，逐步演进。用VP 17.1创建你的第一个参考架构库。搭建地基：创建一个规范的架构库项目设计目录：按TOGAF的分层结构组织资产沉淀第一批资产。

2026-04-04 10:51:19 392

原创 1.1_超越绘图：为什么你的架构设计需要一个“图书馆”？

想象一下这个场景：你的团队接手了一个新项目，需要设计用户认证模块。架构师小李兴冲冲地打开 Visual Paradigm，开始从零画用例图、类图、序列图……画完一版，发给团队评审。评审会上，前端同学说“这个接口设计不符合我们之前的标准”，后端同学说“这个状态机我们A项目已经画过了”。小李懵了——“我咋不知道？每次都在重复造轮子，每次都在重新发明架构。更扎心的是，你可能已经在 VP 里画过类似的图了，只是散落在各个项目文件中，没人知道，没人能找到。

2026-04-03 17:08:16 435

原创ＩＥＤＡ工具总结笔记

本文总结了IDEA工具的主要功能模块：包括任务环境(taskContexts)、JavaDoc文档生成、模板管理、IDE控制台(JShell Console)和部署工具(Webservices/httpclient)等。重点介绍了产品指导(Productivity Guide)、诊断工具(Diagnostic)、日志管理(Show Log in Explorer)以及VM选项配置(Edit Custom VM Options)等实用功能。文章通过分类列举的方式，系统梳理了IDEA的各项核心工具和设置选项，为

2026-02-13 08:20:03 308

原创 P71: 《模拟面试面试准备清单：如何高效覆盖90%的模拟面试工具*背篇》

本文为高级Java开发工程师面试必备知识点速查手册，涵盖六大核心模块：1）JVM内存模型、类加载机制及GC算法；2）Spring框架IOC/AOP原理及自动配置；3）MySQL索引优化、事务隔离级别及分布式事务方案；4）微服务架构下Dubbo核心机制与高并发设计要点；5）HTTP/TCP网络协议关键点；6）单例/工厂等常用设计模式。手册采用"知识点+标准答案"形式，并附项目经验表述模板，帮助候选人快速掌握面试高频考点，建议结合理解进行记忆。

2026-01-10 18:17:25 67

原创 P7: 《面试准备清单：如何高效覆盖90%的面试考点》

摘要：本文为IT从业者提供了一份系统化面试备战指南，从"听、说、读、写、看、背、练"7个维度展开。内容包括：如何理解面试问题意图、结构化表达技巧、高效吸收技术信息的方法、代码与文档呈现要点、实战观察技巧、核心知识记忆策略，以及算法刷题和系统设计练习建议。同时强调面试节奏管理和心态调整，推荐实用工具如Notion、LeetCode等，帮助求职者全面准备技术面试，展现专业能力与职业素养。

2025-12-16 14:08:30 116

原创 p6: 万能简历编写与优化工具箱

万能简历优化工具箱（150字摘要）掌握ATS系统与HR筛选双通关技巧：1）格式标准化（.docx优先），关键词自然植入；2）采用STAR-L公式量化经历（情境-任务-行动-量化结果-岗位关联）。技术岗突出性能指标，运营岗强调转化率，应届生包装课程项目。推荐Jobscan分析匹配度，ResumeWorded提供优化建议。核心布局：10%头部信息+50%量化经历+15%分层技能展示。避免职责清单，坚持"动词+成果+数据"结构，每段经历2-4个bullet points。定期更新成就库，针对

2025-12-11 11:15:46 95

原创 P73:《面试应对：从“怕面试”到“赢面试”》

摘要：面试成功的关键在于将随机发挥转化为有准备的对话。首先拆解岗位需求（硬技能、软技能、隐性需求），用STAR法则匹配自身经历，确保回答精准。准备高频问题剧本，如30秒自我介绍（背景+优势+动机）、离职原因（强调成长而非抱怨）、改进型缺点回答。最后通过反向提问（团队风格、晋升路径等）掌握主动权，体现双向选择意识。核心逻辑是将面试转化为销售自己的过程，从被动应对到主动掌控。

2025-12-05 21:06:22 84

原创 P72：面试制胜策略：将简历转化为你的专属剧本

摘要：面试中应对简历随机提问的关键在于深度准备和结构化回答。提前以面试官视角审视简历，针对每段经历准备好STAR原则（情境、任务、行动、结果）的详细案例，量化成果并突出与岗位的关联。面试时保持冷静，用结构化回答展示逻辑，诚实面对知识盲区，同时自然引导话题至自身优势。长期策略包括简历撰写时预设问题、持续积累经验库，并提升核心能力。最终，充分的准备能将随机提问转化为展示专业性的机会。

2025-11-28 19:38:36 123

原创 P71: 《模拟面试面试准备清单：如何高效覆盖90%的模拟面试工具*练篇》

本文推荐了多款模拟面试工具，涵盖AI/科技专项、通用型、AI大模型和国内平台四大类。重点推荐Pramp、Interviewing.io等专业平台进行技术面试练习，Yoodli、Big Interview等通用工具提升软技能，以及ChatGPT等AI大模型实现高度定制化训练。国内用户可使用牛客网获取大厂真题。建议组合使用这些工具，先通过AI构建回答框架，再用真人平台打磨技巧，最后针对目标公司查漏补缺，全面提升面试表现。

2025-11-27 14:48:24 164

原创 P3《制定你的90天求职作战计划》工具篇

摘要：本文提供了一套高效定制技术简历的完整流程与工具组合方案。核心环节包括：1) 使用AI简历工具(如Resumaker.ai)或通用AI写作助手，依据岗位描述定制化改写技术栈内容；2) 通过Jobscan分析关键词匹配度；3) 采用Grammarly进行语法检查，结合文本朗读功能全面校对。建议工作流为：原始简历准备→Jobscan关键词分析→AI工具内容优化→Grammarly校对→人工复核。该方案通过智能工具组合可完成95%的简历优化工作，最后5%需要人工把关确保专业性。

2025-11-10 15:25:07 80

原创 P13: 《职业路径规划：技术专家 vs 技术管理，我的下一个五年该如何选择？》

P13: 《职业路径规划：技术专家 vs 技术管理，我的下一个五年该如何选择？》

2025-11-10 14:27:31 110

原创 P12: 《构建个人技术品牌：让你的名字成为机会的“磁石”》

P12: 《构建个人技术品牌：让你的名字成为机会的“磁石”》

2025-11-10 14:23:17 72

原创 P11: 《入职不是结束：如何利用前90天站稳脚跟，建立“能见度”》

摘要：入职前90天是站稳脚跟的黄金窗口期，需分三阶段行动：1）0-30天快速融入团队，熟悉技术环境和工具，建立基本信任；2）30-60天主动争取并高质量完成首个关键任务，展现业务价值；3）60-90天通过技术分享、流程优化扩大影响力，成为团队价值节点。贯穿始终的核心是保持专业靠谱、谦逊好学的态度，并注重跨部门协作。成功度过这90天能为后续晋升奠定基础，需制定清晰计划并严格执行。（149字）

2025-11-10 14:19:45 71

原创 P10: 《薪资谈判的5个关键步骤：如何让你最终报价提高10%-30%》

摘要：本文详细拆解了程序员薪资谈判的5个关键步骤：情报搜集（确定合理区间）、延迟报价（让对方先亮牌）、应对压价（强调个人价值）、制造竞争（善用其他offer）和争取打包（争取额外福利）。文章指出，合理谈判可使薪资提高10%-30%，关键在于掌握市场信息、突出自身价值并保持专业态度。同时提醒避免情绪化、轻信口头承诺等常见错误，建议将谈判视为双赢的商业合作而非对抗。文末提供实用工具包，帮助求职者系统化准备谈判。

2025-11-10 13:39:20 155

原创 P9: 《项目深挖与行为面试：如何主导对话，将面试官引向你的优势领域》

文章摘要：本文介绍如何通过“引导式回答”技巧在技术面试中掌控主动权。提出“PREP+A”模型（观点-原因-例子-重申-转向），通过结构化叙事将面试官引导至准备好的优势领域。重点包括：1）用精彩开场白吸引注意；2）为每个项目准备3-5个扩展“钩子”；3）将行为问题巧妙转向技术案例。文末提供资源包和行动清单，帮助求职者将面试转化为自我展示的“技术分享会”，而非被动问答。核心在于通过精心准备和话术设计，成为面试对话的主导者。

2025-11-10 13:34:27 74

原创 P8: 《系统设计面试的“套路”与“反套路”：从需求澄清到架构绘制的全流程》

文章摘要：系统设计面试考察核心是思考能力而非记忆，关键在于运用4S框架（场景、存储、服务、扩展）进行系统性分析。首先要明确需求与量化指标，接着设计数据存储方案，然后构建服务架构，最后考虑扩展与优化。面试中需警惕反套路问题，如数据激增、缓存一致性等，展现技术深度与权衡能力。准备阶段需掌握核心组件原理，面试中要主动沟通、清晰绘图，将追问转化为展示机会。通过框架化思维和深度技术讨论，实现从程序员到架构师的思维跃迁。

2025-11-09 12:43:46 94