刘工・大模型技术研习社-CSDN博客

原创传统机器学习 vs 深度学习轻量方案：RandomForest与FastText全方位对比

《新闻文本分类实战：从TF-IDF到子词嵌入的技术演进》对比分析了传统机器学习（RandomForest+TF-IDF）与深度学习（FastText）两种文本分类方案。实验显示，FastText在准确率（92% vs 73%）、训练速度（60秒 vs 30秒）和模型大小（80MB vs 150MB）方面全面占优，特别适合生产环境部署。文章深入剖析了两者的技术原理，包括TF-IDF的高维稀疏特性与FastText的子词嵌入机制，并通过错误案例揭示了语义理解能力的差异。最后提出混合架构建议：FastText处理

2026-04-15 16:51:30 347 1

原创多分类模型评估指南：Macro、Micro、Weighted 详解与选择

【摘要】在多分类任务中，准确率（Accuracy）容易因类别不平衡产生误导。本文解析三种关键评估指标：Macro平均（平等对待每个类别，适合关注小类别的场景）、Micro平均（平等对待每个样本，反映整体准确率）和Weighted平均（按样本数加权，折中方案）。通过混淆矩阵分析单类别指标（精确率、召回率、F1）后，演示如何聚合为全局指标。提供Python代码示例和决策树，指导根据业务场景选择指标：医学诊断推荐Macro，搜索引擎适用Micro，电商分类建议Weighted。强调应结合业务目标，同时分析混淆矩阵

2026-04-15 16:46:10 309

原创我用一张笔记，理清了 NLP 迁移学习的底层逻辑

摘要：迁移学习是NLP领域的核心技术，通过预训练模型（如BERT、GPT）和少量标注数据微调，可快速完成特定任务。主要分为直接使用预训练模型和基于微调两种方式，其中Transformer架构的三大类模型（Encoder-only、Decoder-only、Encoder-Decoder）适用于不同场景。HuggingFace的Transformers库提供了便捷工具，而中文情感分析案例展示了迁移学习的实际应用价值：用最小成本实现高效文本分类。选型建议：理解类任务选BERT等Encoder模型，生成类任务选G

2026-04-03 20:39:09 315

原创从神经网络视角看：长期高强度训练为何会导致系统崩溃 —— 由张雪峰猝死引发的技术思考

摘要：教育博主张雪峰的猝死事件揭示了长期过度自律与追逐宏大目标对人体神经网络的危害。人体作为生物神经网络系统，在模糊目标驱动下会形成"被迫梯度下降"，导致惯性失控和系统崩溃。电子产品更是持续激活训练模式的催化剂。解决方案是回归正常梯度：通过完成基础生活事务、减少信息输入、强制休息等方式冻结参数，停止无效训练。生命系统需要平衡而非无限迭代，立足当下小事才是神经网络稳定运行的关键。

2026-03-25 10:10:03 390

原创一文读懂注意力机制：从原理到 Transformer 核心实现

本文系统梳理了注意力机制在NLP领域的发展与应用。首先阐释了注意力机制的核心思想：通过动态聚焦输入中的关键信息，解决传统Encoder-Decoder模型处理长文本的局限。详细解析了注意力计算的三步范式（打分、归一化、加权求和），并以机器翻译为例演示计算流程。重点对比了加法注意力和乘法注意力的差异，指出后者是Transformer的基础。深入分析了Transformer采用的缩放点积注意力，解释除以√dₖ的数学意义在于维持数值稳定性。最后总结了注意力机制从基础实现到现代模型的演进逻辑，建议学习路径从基础计算

2026-03-18 11:58:39 775

原创从 RNN 到 LSTM：循环神经网络核心原理与演进

本文系统梳理了循环神经网络(RNN)及其改进模型LSTM和GRU的核心原理与演进脉络。基础RNN通过隐藏状态传递时序信息，但存在梯度消失问题；LSTM创新性地引入门控机制和细胞状态，有效解决了长期依赖问题；GRU作为轻量版LSTM，合并门控减少参数，在保持性能的同时提升效率。文章详细分析了各模型的结构特点、数学公式及适用场景，并给出多层RNN构建方法和实践应用建议。模型选择应综合考虑数据规模、任务复杂度与计算资源，GRU适合轻量级应用，LSTM则更胜任复杂长序列任务。

2026-03-18 11:57:05 638

原创从数据到特征：NLP 文本预处理与特征工程

本文介绍了NLP入门中的文本数据分析和特征工程核心环节。首先强调文本数据分析的重要性，包括检查标签分布、句子长度和词频统计，通过可视化工具快速发现问题。其次详细讲解n-gram特征的应用，它能保留语序信息，提升语义理解能力，并通过实例展示2-gram相似度计算方法。最后说明文本长度规范的必要性，包括截断和填充操作，使数据符合模型输入要求。文章总结了一套从原始文本到模型输入的标准流程，为NLP初学者提供了实用指导。

2026-03-18 11:54:47 557

原创从文本到向量：NLP 入门核心技术

本文介绍了NLP文本处理的完整流程。首先通过分词、词性标注、命名实体识别和文本清洗对原始文本进行预处理；然后重点讲解了三种词向量表示方法：基础的One-hot编码、Word2Vec静态词向量（包括CBOW和Skip-gram模型）以及动态Embedding方案。文章还提供了词向量选择的场景建议：小数据用CBOW/FastText，大数据用Skip-gram，复杂任务用预训练模型的动态Embedding。整个流程从文本标准化到语义向量化，是NLP理解和处理文本的核心技术路径。

2026-03-18 11:50:03 318

原创 mysql WITH的多种用法与示例

在一个查询中可以定义多个 CTE，并在查询的其他部分引用它们。这些 CTE 可以相互引用，按顺序处理。WITH非递归 CTE用于分解复杂查询。递归 CTE用于层级数据查询。嵌套 CTE可以组合多个步骤的查询。简化查询逻辑：分解复杂的 SQL 逻辑，使查询更清晰易懂。CTE 是复杂查询中不可或缺的工具，有助于使代码简洁且易于维护。WITH RECURSIVE 举例说明，表结构是id和pid的指向大概有五层。

2026-03-17 03:19:40 215

原创 DBeaver连接本地MySQL、创建数据库表的基础操作

此篇已完善！

2026-03-17 00:40:53 208

原创深入浅出文本预处理：NLP 模型训练的基石

本文系统介绍了自然语言处理中的文本预处理技术，包括三大核心环节：分词（使用jieba工具实现精确/全模式/搜索引擎模式分词）、命名实体识别和词性标注；三种文本向量化方法（One-Hot编码、Word2Vec词向量和动态词嵌入）；以及文本数据分析方法（标签分布、句子长度分析和词频统计）。此外还介绍了N-gram特征添加、文本长度规范化和回译数据增强等特征处理技术。文章强调文本预处理是NLP模型训练的基础，其质量直接影响模型效果，需要根据业务场景灵活运用各项技术。

2026-03-13 20:33:07 357

原创深度学习核心面试题（PyTorch + 算法原理）全解析

本文总结了深度学习面试高频考点，涵盖张量运算、PyTorch API、神经网络原理、CNN/RNN等核心知识。重点包括：1）张量维度匹配与矩阵运算规则；2）PyTorch梯度计算与设备迁移；3）激活函数特性与参数初始化方法；4）损失函数选择与优化器改进；5）CNN特征图计算与RNN循环结构；6）模型训练流程与正则化技巧。内容采用问答形式呈现关键公式和实现要点，适合快速掌握面试必备知识点。

2026-03-09 20:24:42 374

原创深度学习学习率衰减策略全解析

深度学习模型训练中，学习率衰减策略是关键超参数优化技术。本文系统分析了主流学习率衰减方法：等间隔衰减(StepLR)适合简单任务，指定间隔衰减(MultiStepLR)提供灵活调整，指数衰减(ExponentialLR)确保训练平稳性，而周期重启的余弦退火(CosineAnnealingWarmRestarts)最适用于复杂非凸优化任务。文章详细阐述了各策略的数学原理、PyTorch实现方法及适用场景，并提供了优化器搭配、初始学习率设置等实用技巧。通过动态调整学习率，这些策略能有效平衡"快速探索&

2026-03-07 21:15:23 472

原创梯度下降算法优化指南

摘要：梯度下降是深度学习模型优化的核心算法，但基础SGD存在收敛慢、易陷局部最优等问题。本文系统介绍了梯度下降优化方法的发展历程，包括动量法、AdaGrad、RMSProp、Adam等主流算法，重点分析了Adam和AdamW的优化原理及优势。文章还探讨了学习率衰减策略等配套优化技巧，并给出不同场景下的优化器选择建议。实践表明，Adam/AdamW因其自适应学习率和动量特性，已成为大多数深度学习任务的首选优化方法。通过合理选择优化器和配套策略，可显著提升模型训练的收敛速度和稳定性。

2026-03-07 21:07:44 406

原创深度学习入门：从概念到应用

摘要：深度学习作为人工智能的核心分支，通过多层神经网络实现自动特征提取，在计算机视觉、自然语言处理等领域广泛应用。与传统机器学习相比，深度学习能自动处理高维非结构化数据，但依赖大量计算资源且可解释性较差。主要模型包括CNN、RNN、Transformer等，分别适用于图像、序列数据等不同场景。深度学习经历了从理论探索到爆发式发展的历程，当前以生成式AI为代表进入快速发展阶段。掌握线性代数和微积分是理解深度学习原理的基础。随着技术进步，深度学习将持续拓展更多智能应用场景。

2026-03-04 20:14:44 390

原创 PyTorch 基础使用全解析：从张量操作到线性回归

本文系统介绍了PyTorch深度学习框架的核心使用方法。首先讲解PyTorch的安装配置和核心特点，重点阐述张量的创建、类型转换和数值运算等基础操作。随后深入解析自动微分机制，包括梯度计算规则和梯度下降实现。最后通过线性回归实战案例，完整演示了PyTorch模型构建的四大步骤：数据准备、模型定义、损失函数/优化器配置和训练过程。文章强调张量操作、自动微分和训练流程是PyTorch的三大核心要素，并详细说明了数据类型匹配、批量训练、梯度清零等关键细节，为深度学习入门者提供了全面的PyTorch使用指南。

2026-02-26 20:20:08 498

原创【特征工程必看】One-Hot 与 LabelEncoder 核心区别：选对编码方式，模型效果提升 50%

本文系统解析了机器学习中类别特征编码的核心方法——One-Hot与LabelEncoder的本质区别。首先明确类别特征分为有序（会员等级）和无序（城市）两类，这是选择编码方式的基础。LabelEncoder将类别映射为有序数字，适用于有序特征；One-Hot为每个类别创建独立二进制列，保持无序特征的无序性。文章通过代码案例展示了正确与错误用法，强调线性模型处理无序特征必须用One-Hot以避免虚假顺序干扰，同时指出高基数类别需采用Embedding降维。核心口诀：有序用Label，无序用OneHot，高基数

2026-02-10 10:09:35 369

原创一文吃透聚类算法：从基础到 KMeans 实战

本文深入解析了无监督学习中的聚类算法，重点介绍了KMeans算法及其应用。主要内容包括：1）聚类算法基础概念，强调其无监督特性及通过相似度自动分组的能力；2）KMeans算法详解，涵盖API使用、5步实现流程及示例演示；3）4种评估指标（SSE、肘方法、轮廓系数、CH指数）的科学使用方法；4）顾客数据聚类实战案例，展示如何识别黄金客户群体；5）常见问题解答与避坑指南。文章强调KMeans算法简单高效的特点，指出科学确定K值和多指标交叉验证是确保聚类效果的关键。

2026-02-03 20:25:06 579

原创集成学习核心之Bagging和Boosting

本文系统介绍了集成学习的核心概念与主流算法。首先阐述了集成学习的定义和"弱学习器组合成强学习器"的基本思想，将其分为Bagging和Boosting两大类。重点讲解了随机森林(Bagging代表)和Adaboost(Boosting代表)的原理、构建步骤及实战应用，对比了两类方法的差异。进阶部分详细解析了梯度提升树(GBDT)及其优化版本XGBoost，包括数学原理、工程优化和实际案例。最后通过对比表格总结了四大算法的特点，指出Bagging侧重降低方差，Boosting侧重降低偏差，而

2026-02-03 20:17:20 614

原创机器学习之决策树:分类与回归核心算法

决策树是一种基于树形结构的机器学习模型，通过递归分裂数据实现分类或回归。核心概念包括特征选择（信息增益、基尼指数等）、节点分裂和剪枝优化。经典算法有ID3（信息增益）、C4.5（信息增益率）和CART（基尼指数/均方误差），分别适用于不同场景。决策树优势在于直观可解释、支持多种数据类型，但容易过拟合。应用包括金融风控、医疗诊断等领域，常需通过剪枝技术提升泛化能力。泰坦尼克号生存预测案例展示了数据预处理、模型训练和评估的完整流程。

2026-01-31 21:02:21 725

原创机器学习之逻辑回归:二分类核心算法

本文系统介绍了逻辑回归的核心原理与应用。逻辑回归是一种二分类算法，通过Sigmoid函数将线性回归输出映射为概率值，广泛应用于医疗诊断、金融风控等领域。文章详细解析了Sigmoid函数、概率基础、极大似然估计和对数函数等数学工具，阐述了交叉熵损失函数与似然函数的关系。通过癌症分类和电信客户流失两个实战案例，演示了数据预处理、特征工程和模型评估的全流程，重点介绍了精确率、召回率、F1-score和ROC/AUC等评估指标。案例中特别强调了缺失值处理、特征标准化和类别特征编码等关键技术要点，为逻辑回归的实际应用

2026-01-31 20:58:21 633

原创机器学习之线性回归:全面解析原理、API 与工程实践

本文系统介绍了线性回归的核心知识体系，包括基本概念、数学原理、求解方法和实战应用。主要内容涵盖：线性回归的定义、分类及典型应用场景；基于sklearn的API快速实现方法；损失函数与评估指标（MAE/MSE/RMSE）的计算原理；正规方程法和梯度下降法的对比分析；波士顿房价预测的完整实战案例；欠拟合/过拟合的识别与解决方法，重点讲解L1/L2正则化技术。文章通过理论推导与代码实践相结合的方式，帮助读者全面掌握这一基础机器学习算法，为后续学习更复杂模型奠定基础。

2026-01-31 20:53:25 674

原创机器学习调参指南：用网格搜索与交叉验证找到最佳K值

摘要：K值选择直接影响KNN算法性能，网格搜索和交叉验证是确定最优参数的主要方法。网格搜索通过穷举参数组合寻找最优解，但计算成本高；交叉验证通过数据划分减少评估偏差。二者结合既能系统探索参数空间，又能可靠评估性能。实际应用中建议配合数据预处理、学习曲线分析和随机网格搜索等技巧，同时注意避免过拟合和计算资源管理问题。这种参数调优方法具有系统性、可重复性和科学性，是机器学习模型优化的核心工具。

2026-01-27 20:39:26 961

原创机器学习之KNN 算法核心知识点总结

K近邻(KNN)是一种基于邻域投票的监督学习算法，适用于分类和回归任务。其核心思想是通过计算样本间的距离（欧氏、曼哈顿等）找出k个最近邻，进行分类投票或均值回归。关键点包括：K值选择需平衡过拟合与欠拟合，推荐使用交叉验证和网格搜索；特征预处理（标准化/归一化）对模型效果至关重要；算法实现需注意输入格式和API使用规范。KNN适合中小规模数据，但预测速度随样本量增加而下降。典型应用场景包括图像识别和数据挖掘。

2026-01-27 19:58:12 800

原创浅谈机器学习概念

机器学习是一门 “数据驱动” 的科学，核心是让机器从数据中自主学习规律。从人工智能、机器学习、深度学习的概念层级，到数据、算法、算力的三要素支撑，再到 “数据处理 - 特征工程 - 模型训练 - 评估优化” 的完整流程，每个环节都不可或缺。

2026-01-24 20:48:45 976

原创 Pandas 数据分析核心技能总结：缺失值处理、apply 函数与分组聚合

本文基于黑马程序员课程，系统介绍了Pandas数据分析四大核心技能：缺失值处理（识别、检测与填充策略）、apply自定义函数应用（Series/DataFrame处理与向量化）、分组聚合（基础分组、聚合转换与多字段分析）以及透视表（多维度交叉分析）。通过实际案例演示了数据清洗、转换和分析的关键技术，帮助读者掌握高效处理数据分析全流程的方法。这些技能组合使用可解决90%以上的结构化数据处理需求。

2026-01-23 18:15:09 946

原创 Pandas 数据分析实战：从数据加载到业务落地全流程

本文系统介绍了使用Pandas进行数据分析的完整流程。从数据加载、初步探索（head/info/describe），到核心操作（筛选/排序），再到进阶技能（分组聚合）和数据可视化。重点讲解了groupby分组统计、多条件筛选、排序等实用技巧，并提供了电影评分分析、租房数据统计等实战案例。同时总结了新手常见错误及解决方法，如多列筛选格式、条件组合语法等。通过这套"加载→探索→处理→分析→可视化"的工作流，读者可快速掌握Pandas核心功能，应对80%以上的数据分析需求。

2026-01-19 21:21:32 537

原创 Pandas 核心数据结构全解析：Series 与 DataFrame 实战指南

本文系统介绍了Pandas库中Series和DataFrame两大核心数据结构。Series作为一维带标签数组，支持多种创建方式和高效操作；DataFrame作为二维表格，提供更复杂的数据处理能力。文章详细讲解了两种结构的创建、属性方法、布尔索引、数据筛选及增删改查操作，并总结了数据导入导出方法。重点强调了索引对齐机制、数据类型规则等核心概念，为数据分析工作提供实用指导。掌握这些基础知识能显著提升数据处理效率，是使用Pandas进行数据分析的重要前提。

2026-01-17 20:56:33 989

原创 Python 核心应用实战：数据库交互与数据分析

本文介绍了Python在数据处理领域的两个核心应用：数据库交互与数据分析。首先详细讲解了使用PyMySQL库实现Python与MySQL数据库的连接、查询、增删改操作，重点说明了事务管理和防范SQL注入的方法。其次阐述了数据分析环境的搭建，推荐使用Anaconda平台管理Python环境和依赖包，并介绍了Jupyter Notebook交互式开发工具。最后概述了数据分析的核心库：NumPy用于数值计算，Pandas处理结构化数据，Matplotlib和Seaborn实现数据可视化，Sklearn支持机器学习

2026-01-16 20:28:24 627 2

原创 MySQL 查询核心知识点总结

MySQL查询全攻略：从单表到多表的核心语法与优化技巧本文全面解析MySQL查询的核心知识点，涵盖单表查询基础、多表关联查询及性能优化策略。单表查询部分详细讲解条件筛选、排序、聚合函数、分组和分页等核心语法；多表查询重点剖析表关系、外键约束及四种关联方式（内连接、左连接、右连接、全连接）的应用场景。文章还提供SQL执行顺序、常见错误规避和性能优化技巧，包括避免SELECT*、合理使用索引等实用建议。无论是新手入门还是开发者进阶，都能从中掌握MySQL查询的精髓，提升数据库操作效率。

2026-01-15 20:58:58 923

原创一文吃透数据结构与算法：从概念到链表实战

数据结构与算法是编程的核心基础，决定了程序的效率和性能。数据结构是存储数据的方式（如列表、链表），算法是解决问题的步骤（如查找、排序）。二者关系密切：数据结构是算法的载体，算法是数据结构的应用。评估算法优劣主要看时间复杂度和空间复杂度。线性结构分为顺序表（连续存储，访问快）和链表（非连续存储，插入删除快），各有优缺点。通过Python实现单向链表的核心功能（增删改查），可以直观理解链表的工作原理。掌握这些基础知识，能帮助开发者编写更高效的程序。

2026-01-10 19:37:36 853

原创 Python 正则表达式

本文系统介绍了Python中正则表达式的核心应用与re模块的使用技巧。主要内容包括：1. 正则表达式基础概念及其在数据验证、文本处理等场景的应用价值；2. Python re模块三大核心方法（match/search/findall）的使用场景与示例；3. 正则语法规则详解，包括字符匹配、量词使用、分组引用等核心功能；4. 高级特性如贪婪/非贪婪模式的对比使用；5. 标志修饰符的应用场景。通过多个实战案例（如敏感词过滤、邮箱验证、HTML标签匹配等），帮助开发者快速掌握正则表达式在Python中的高效应用。

2026-01-09 20:05:55 811

空空如也

空空如也