五味子1314-CSDN博客

原创 02-机器学习基础：监督学习——线性回归

这篇文章介绍了线性回归的基本原理和应用。主要内容包括：问题场景：通过房屋面积预测价格的示例，说明线性回归要解决的问题是找到最佳拟合直线来描述数据趋势。核心原理：使用最小二乘法寻找最优直线，通过最小化均方误差(MSE)来评估拟合效果数学推导展示了如何通过求导和正规方程直接计算最优参数实现方法：提供了使用正规方程实现线性回归的代码框架解释了单特征和多特征情况下的参数计算方法文章通过可视化图表展示了不同拟合直线的效果比较，并详细讲解了损失函数的概念和最小二乘法的数学原理，帮助读者理解线性回归的核心

2026-04-17 00:27:21 139

原创 01-编程基础与数学基石：优化理论

本文深入探讨了优化理论在AI模型训练中的核心作用。主要内容包括：优化理论的基础地位：作为AI模型训练的驱动力，优化算法直接影响模型性能。文章通过Python代码示例展示了梯度下降、Adam优化器等常见方法的应用场景。凸优化与非凸优化的对比：通过可视化演示了凸函数（如x²）和非凸函数（如x⁴-3x²+x+2）的本质区别，解释了神经网络面临的非凸优化挑战。局部最优问题：展示了复杂损失函数中的多个局部极小值陷阱，分析了不同初始点对优化结果的影响，并提出了随机初始化、动量方法等应对策略。优化算法实现：提供了

2026-04-17 00:25:23 75

原创 01-编程基础与数学基石：信息论

信息论：AI中的不确定性度量工具本文探讨了信息论在人工智能中的核心应用。熵作为不确定性的度量，在决策树中用于计算信息增益，指导特征选择；交叉熵则成为分类任务的标准损失函数，通过比较真实分布与预测分布的差异来优化模型。文章通过可视化展示了二分类熵曲线和交叉熵损失曲面，揭示了信息论如何量化预测的不确定性——确定性事件熵为0，均匀分布熵最大；完美预测时交叉熵接近0，预测越差损失值越高。这些数学工具为AI模型提供了衡量和优化信息处理能力的基础框架，贯穿于特征选择、模型训练和评估等关键环节。

2026-04-17 00:23:32 15

原创 01-编程基础与数学基石：概率与统计

本文探讨了概率与统计在AI中的关键作用。主要内容包括：1）概率分布的应用（均匀分布用于权重初始化、正态分布用于误差建模、伯努利分布处理二分类问题）；2）贝叶斯定理的实际案例（如疾病检测中阳性预测值的计算）；3）统计方法如何量化AI模型的不确定性。文章通过Python代码示例展示了这些数学工具如何帮助AI系统处理现实世界的不确定性，强调概率统计是AI理解随机性和做出可靠决策的基础。

2026-04-17 00:22:01 88

原创 01-编程基础与数学基石：微积分

微积分：AI训练的核心数学工具微积分在AI模型训练中扮演着至关重要的角色，主要体现在三个方面：导数驱动优化：通过计算损失函数的导数确定参数更新方向，实现梯度下降算法。学习率的选择直接影响收敛速度，过大导致震荡，过小则收敛缓慢。多变量处理：偏导数允许同时优化多个参数，形成梯度向量指导参数更新。如二元函数f(x,y)=x²+y²中，可分别计算∂f/∂x和∂f/∂y。反向传播基础：链式法则成为神经网络训练的核心，通过逐层计算导数实现误差的反向传播。所有激活函数必须可导才能支持这一过程。可视化示例展示了导

2026-04-17 00:19:56 182

原创 01-编程基础与数学基石:线性代数

摘要本文介绍了线性代数在AI开发中的核心作用。第一部分阐述了线性代数在神经网络、词向量、图像处理等AI场景中的普遍应用。第二部分讲解了向量的基本概念和运算，包括特征表示、相似度计算及推荐系统应用。第三部分探讨了矩阵作为数据批处理工具的重要性，重点解析了矩阵乘法在神经网络全连接层中的关键作用。文章通过Python代码示例直观展示了线性代数运算的实际AI应用场景，如词向量关系计算、用户相似度评估和基于向量相似度的推荐系统实现。这些数学工具为AI开发者提供了处理高维数据和构建复杂模型的基础能力。

2026-04-16 00:12:53 205

原创 01-编程基础与数学基石:Matplotlib & Seaborn

本文介绍了Matplotlib和Seaborn这两个Python可视化库在AI开发中的关键作用。通过安斯库姆四重奏案例展示了可视化如何揭示数据背后的真实模式（统计指标相同但分布完全不同）。文章详细讲解了Matplotlib的核心概念Figure和Axes的关系，并演示了如何创建折线图来追踪模型训练过程中的损失和准确率变化。可视化不仅能帮助开发者理解数据分布、发现异常值，还能有效监控模型性能，是AI开发过程中不可或缺的工具。文中包含完整的代码示例，展示了从基础绘图到实战应用的完整流程，特别适合AI开发者学习数

2026-04-16 00:11:01 308

原创 01-编程基础与数学基石:Pandas数据处理

Pandas是AI开发者必备的数据处理工具，相比NumPy更适合处理表格数据。它提供Series（带标签的一维数组）和DataFrame（二维表格）两大核心数据结构，支持数据清洗、转换、聚合等操作。本文介绍了从NumPy到Pandas的演进、Pandas在AI流程中的核心地位，以及Series和DataFrame的创建、索引、运算等基础操作。同时讲解了如何读取CSV文件并进行初步数据查看，包括指定索引列、分块读取等实用技巧，帮助开发者高效处理80%的数据准备工作。

2026-04-16 00:09:37 383

原创 01-编程基础与数学基石: NumPy数值计算库

NumPy是Python科学计算的核心库，为AI开发提供高效的数值计算能力。本文从三个维度介绍NumPy：首先对比Python原生列表，展示NumPy在向量化运算、多维数据处理和计算速度上的优势；其次详细讲解ndarray的创建方式（从列表、内置函数、随机生成等）和核心属性（shape、dtype等）；最后深入解析索引切片机制（基础索引、布尔索引）和广播原理。NumPy作为AI数据处理的基础工具，能大幅提升矩阵运算效率，是深度学习框架的底层支撑。通过合理使用NumPy，开发者可以优化数据预处理流程，为模型训

2026-04-16 00:07:04 396

原创 01-编程基础与数学基石: 常用内置库

Python有"自带电池"(Batteries Included)的美誉，标准库提供了丰富的功能模块。掌握内置库，意味着无需安装第三方包就能解决80%的常见问题。二、最常用的10个内置库速查表库名一句话说明AI开发场景重要程度操作系统接口文件路径、环境变量⭐⭐⭐⭐⭐Python运行时命令行参数、退出程序⭐⭐⭐⭐⭐数学函数基础数学运算⭐⭐⭐⭐随机数生成数据采样、初始化⭐⭐⭐⭐日期时间日志记录、时间戳⭐⭐⭐⭐JSON处理

2026-04-16 00:03:54 294

原创 01-编程基础与数学基石：Python面向对象编程

本文介绍了Python面向对象编程(OOP)的核心概念。首先对比了面向过程与面向对象编程的区别，指出OOP的三大优势：封装、继承和多态。重点讲解了类与对象的关系，类作为蓝图定义属性和方法，对象是类的具体实例。详细说明了__init__()构造函数和self参数的作用，并演示了如何定义类、创建对象及访问属性方法。最后介绍了封装概念，包括公有、受保护和私有属性的命名约定，以及如何通过方法控制对私有数据的访问。通过银行账户示例展示了封装的实际应用。

2026-04-15 09:04:26 480

原创 01-编程基础与数学基石：Python错误与异常处理

Python错误与异常处理：AI开发实战指南本文针对AI开发场景，系统讲解Python错误处理机制。主要内容包括： AI开发中常见的异常类型：FileNotFoundError（模型文件缺失）、RuntimeError（显存不足）等基础异常处理：try/except结构、多异常捕获、else/finally用法高级处理模式：优雅降级：主方案失败时自动切换备用方案重试机制：通过装饰器实现自动重试逻辑实战技巧：数据加载安全处理、模型推理异常捕获文中提供了大量AI场景示例代码，如模型加载失败处理、A

2026-04-15 09:01:38 291

原创 01-编程基础与数学基石：Python文件操作

Python文件操作教程：AI开发必备技能本文系统讲解Python文件操作在AI开发中的应用，主要内容包括：文件基础知识文件类型（文本/二进制/结构化）文件在AI开发中的数据流角色核心操作文件操作三步曲（打开-操作-关闭） 7种常用打开模式详解读写方法对比（read/readline/readlines） AI常用文件格式 TXT：日志/说明文档处理 CSV：表格数据集操作（标准库和pandas两种方式） JSON：配置文件和API数据处理格式对比（CSV vs JSON）实用技巧大文件

2026-04-15 08:58:48 313

原创 01-编程基础与数学基石： Python核心数据结构完全指南

《Python核心数据结构完全指南》系统讲解了Python四大基础数据结构：列表、元组、字典和集合。文章首先通过生活类比阐明不同数据结构的适用场景，随后深入解析每种结构的底层原理和操作方法。列表作为可变序列，支持丰富的增删改查操作；元组作为不可变序列，适合存储固定数据；字典通过哈希表实现高效的键值查询；集合则用于去重和集合运算。指南详细介绍了各种数据结构的基本操作、性能特点和实用技巧，如列表的栈/队列实现、元组的解包特性、字典的安全访问方法等，帮助开发者根据实际需求选择最合适的数据结构，编写更高效、更健壮的

2026-04-15 08:56:04 392

原创 01-编程基础与数学基石：Python 基础语法

Python核心基础：AI开发入门摘要 Python是AI开发的首选语言，因其简洁语法、丰富生态和强大社区支持。本文涵盖Python基础核心内容：环境配置：介绍三种运行Python的方式（交互式、脚本、Jupyter Notebook）变量与数据类型：变量命名规则与规范主要数据类型：整数、浮点数、布尔值、字符串数据结构：列表（可变有序）、元组（不可变有序）、字典（键值对）流程控制：条件判断（if-elif-else结构）比较运算和逻辑运算实战BMI计算器案例循环结构： for循环遍历各种

2026-04-15 08:54:14 339

原创阶段零：评估指标

本文揭示了准确率在不平衡数据中的严重误导性。以一个罕见病毒检测为例，总是返回阴性的测试准确率高达99.99%，却完全漏掉了关键的阳性病例。文章详细解析了四大核心评估指标：准确率（易被多数类主导）、精确率（关注预测可靠性）、召回率（关注正类识别能力）和F1分数（平衡精召）。通过癌症筛查案例对比，展示了不同指标的应用场景，并推荐马修斯相关系数（MCC）作为最诚实的评估标准。最后提供指标选择决策树，强调在类别不平衡时，准确率不仅无用而且会产生误导，应根据业务需求选择合适指标。

2026-04-14 10:36:20 324

原创阶段零：过拟合与欠拟合

文章摘要：本文通过生动的相亲案例，形象解释了机器学习中的过拟合与欠拟合现象。欠拟合如同信息不足导致无法识别，过拟合则类似死记硬背而缺乏泛化能力。文章对比了两者的定义、表现特征及解决方法，并介绍了偏差-方差权衡理论。通过房价预测案例和正则化技术说明如何寻找最佳平衡点，帮助读者理解模型优化的核心问题。全文1500字，涵盖理论解释、实践案例和解决方案，适合机器学习初学者快速掌握这一基础概念。

2026-04-14 10:34:48 403

原创阶段零：模型即映射

AI模型本质上是数学函数，通过学习输入到输出的映射关系实现智能功能。本文从数学视角解析了AI作为映射函数的本质，介绍了万能逼近定理的理论支撑，阐述了模型通过损失函数和梯度下降优化映射的过程，并分析了数据质量对映射效果的决定性影响。文章还探讨了构建AI模型所需的五大数学基础（线性代数、微积分、概率论、信息论和图论），以及语言模型中映射的具体实现方式。最后指出了当前AI映射面临的主要挑战，包括维度灾难、过拟合和可解释性问题。全文揭示了AI"黑盒"背后的数学本质，帮助读者理解人工智能如何通过数

2026-04-14 10:32:13 430

原创阶段零：数据即燃料

摘要：高质量数据是AI模型的核心驱动力，决定项目成败。数据显示，95%的AI试点失败源于数据问题而非技术本身。典型数据问题包括：质量差（格式混乱）、标签错误（误导模型）、关键信息缺失（"暗数据"）。企业解决方案包括国家能源集团的"数据炼油"流程（业务与技术专家协同优化数据）和创智学院的创新工艺（降低数据成本万倍）。数据治理正向智能化发展，如Data Agent可大幅提升效率。高质量数据需具备准确性、完整性、一致性等特征。从业者应优先培养数据工程能力，警惕"

2026-04-14 10:29:28 393

原创阶段零：开发流程鸟瞰

在写任何代码之前，最关键的是明确业务目标。AI项目失败的首要原因不是技术不行，而是问题定义错了。核心任务明确业务问题：AI到底要解决什么？（分类、推荐、生成、预测？设定成功标准：如何判断项目成功？评估可行性：技术成熟度、数据可得性、资源预算问题先行：先定义清楚业务目标，再谈技术方案数据为王：80%的时间花在数据上，这很正常小步快跑：先做MVP基线，验证可行性后再优化评估不止：通用基准 + 企业私有评测 + 业务指标闭环迭代：部署不是终点，反馈驱动持续进化一句话记住整个流程。

2026-04-14 10:27:07 336

原创阶段零：AI四大核心应用场景

AI四大核心应用场景完全指南从计算机视觉到推荐系统，一篇看懂AI如何落地。

2026-04-13 11:26:15 378

原创阶段零：监督学习、无监督学习、强化学习

监督学习= 有标准答案的考试（分类：是猫是狗 / 回归：房价多少）无监督学习= 自己整理归纳（聚类：把水果分堆 / 降维：简化数据）强化学习= 下棋打游戏练级（试错 + 奖励，逐步变强）监督学习使用有标签的数据集进行训练。算法学习从输入特征到输出标签的映射关系，然后对新的输入数据进行预测。核心公式Y = f(X)，其中X是输入特征，Y是输出标签，f就是我们要学的模型。无监督学习处理没有标签的数据，目标是发现数据中潜在的结构、模式或分组。模型不知道"正确答案"，只能依靠数据本身的统计特性来学习。

2026-04-13 11:09:41 295

原创阶段零：AI、机器学习、深度学习之间的关系

人工智能是研究如何使计算机去做过去只有人才能做的智能工作的一门技术科学。

2026-04-13 11:04:05 399

原创阶段零：AI 开发必备命令行基础教程

AI开发必备命令行基础教程摘要本教程系统介绍了AI开发所需的命令行技能，涵盖终端基础、文件操作、文本处理、进程管理、权限控制等核心内容。重点内容包括： Shell基础概念和常用快捷键文件系统导航与操作命令(ls/cd/cp/mv/rm等) 文本查看与搜索工具(cat/less/grep) 进程监控与管理命令(ps/top/nvidia-smi) 环境配置与包管理(conda/pip) AI开发实战场景命令应用教程采用"命令+示例"形式，突出AI开发实际需求，如数据处理、模型训练监控

2026-04-13 00:19:30 376

原创阶段零：Git 完全指南

《Git 完全指南》摘要：本文全面介绍Git分布式版本控制系统，涵盖基础到高级内容。从Git核心概念（工作区/暂存区/仓库）、数据模型（Blob/Tree/Commit对象）到安装配置指南。详细讲解基础操作（clone/add/commit/push）及原理，如git add会生成Blob对象，git commit创建Tree和Commit对象。包含分支管理、远程协作、撤销回退等实用技巧，并通过对象关系图直观展示Git内部工作机制。适合开发者系统学习Git版本控制与团队协作。

2026-04-13 00:18:04 390

原创阶段零：IDE选择与 Jupyter Notebook / Lab 使用

本文是一份全面的Python开发环境配置指南，详细介绍了VS Code、PyCharm和Jupyter三种工具的适用场景与配置方法。主要内容包括：工具选择：VS Code适合轻量脚本和多语言项目，PyCharm适合大型项目开发，Jupyter则专注于数据分析和交互式编程。配置详解： VS Code：推荐安装Python扩展包（含Pylance、调试器等核心功能），配置虚拟环境管理项目依赖 PyCharm：区分社区版和专业版，提供项目创建和调试的专业解决方案 Jupyter：介绍多种安装方式及Jupyte

2026-04-12 11:21:43 436

原创阶段零：Python 安装与虚拟环境（venv / Conda）

Python 是一种，由 Guido van Rossum 于 1991 年首次发布。它的设计哲学强调代码可读性和简洁语法（使用空格缩进来划分代码块），被称为"可执行的伪代码"。

2026-04-12 11:00:18 346

原创 AI开发系统学习大纲（从零到实战）

搭建环境，理解AI能做什么，建立“数据驱动”的思维方式。：在Jupyter里打印“Hello AI”，跑通第一个sklearn自带数据集的训练（如鸢尾花分类）。

2026-04-12 09:56:25 725

原创 Vite 完全学习指南

《Vite完全学习指南》是一套包含21章的系统教程，涵盖Vite从基础到高级的全方位知识体系。基础篇介绍核心概念、工作原理和TypeScript集成；进阶篇深入插件开发、SSR/SSG、Monorepo支持等高级特性；实战篇提供5个完整项目案例和企业级部署方案；参考篇包含API手册、故障排查和Vite5新特性等内容。学习后可掌握Vite项目搭建、插件开发、性能优化、测试策略等核心技能，并能处理企业级部署和项目迁移等复杂场景。本指南适合前端开发者系统学习现代构建工具Vite。

2026-04-12 09:54:52 372

原创 CSS中的Grid 布局

Grid布局基础与项目放置 Grid布局是一种强大的二维CSS布局系统，主要包含以下核心概念：基本结构：通过display: grid创建网格容器使用grid-template-columns和grid-template-rows定义列和行 gap属性控制网格间距关键特性： fr单位按比例分配剩余空间 repeat()函数简化重复定义 minmax()设置尺寸范围 auto-fill/auto-fit实现响应式布局项目放置：通过网格线编号精确定位项目支持跨行跨列布局可定义命名网格区域响应式

2026-04-12 09:41:54 466

原创第二十一章：CI/CD 最佳实践

本文介绍了现代CI/CD最佳实践，重点讲解了GitHub Actions和GitLab CI的配置方法。主要内容包括：1) CI/CD核心流程和主流平台；2) GitHub Actions基础工作流配置，包含测试、构建和部署到GitHub Pages/Vercel的示例；3) GitLab CI配置文件示例，展示多阶段流水线实现；4) 缓存策略优化技巧，如依赖缓存和并行构建；5) 环境变量管理方法，包括Secrets配置和多环境支持。文章提供了可直接使用的代码片段，帮助开发者快速实现高效的持续集成和部署流程

2026-04-11 00:24:26 220

原创第二十章：特殊场景与扩展

摘要本章介绍了Vite中的特殊场景处理与扩展功能，主要包括： Web Worker：详细展示了基础配置、使用方法、Shared Worker实现及模块导入，适用于耗时计算场景。 WebAssembly：提供WASM模块加载的两种方式（直接导入和fetch），并演示了与Rust集成的完整流程，包括wasm-pack工具使用。 PWA配置：通过vite-plugin-pwa实现渐进式Web应用，包含manifest配置、缓存策略和更新提示机制。多页应用(MPA)：讲解多入口配置方案和项目结构组织，包括共享资

2026-04-11 00:23:20 426

原创第十九章：性能监控与分析

性能监控与分析摘要本文介绍了前端性能监控与分析的全套工具链和方法。主要内容包括：构建分析工具：推荐使用rollup-plugin-visualizer、vite-plugin-inspect等工具进行构建产物可视化分析，提供安装和配置示例。体积优化策略：通过手动分块、Tree Shaking检查和按需加载等技术优化构建体积，给出具体配置代码。开发环境监控：介绍插件调试和启动时间分析方法，包括依赖预构建配置。运行时性能监控：集成Web Vitals指标监控，提供自定义性能测量和资源加载监控的实现方案

2026-04-11 00:21:47 208

原创第十八章：微前端与 Module Federation

摘要： Module Federation是Webpack 5的核心微前端特性，Vite通过插件（如@module-federation/vite）实现类似能力。架构分为宿主（主应用）和远程（子应用），支持模块共享与动态加载。配置需分别设置远程应用的暴露模块（exposes）和宿主应用的远程引用（remotes），并管理共享依赖（shared）。高级功能包括动态远程加载、版本冲突处理和与Webpack互操作。生产环境需注意跨域、CDN部署和性能优化（预加载、懒加载）。常见问题涉及样式丢失、状态同步和类型提示

2026-04-11 00:20:58 364

原创第十七章：Vite 5.0 新特性与升级指南

Vite 5.0 新特性与升级指南摘要 Vite 5.0 带来显著性能提升（构建速度提高20-30%）和多项新特性，包括Node.js 18+支持、全面ESM化、改进的HMR和依赖预构建优化。主要破坏性变更包括：最低Node版本要求提升至18+、CJS支持弃用、环境变量强制VITE_前缀。升级步骤包括检查Node版本、更新依赖、修改配置文件（转为ESM导出）和测试验证。性能测试显示冷启动提升26%，HMR响应加快37%。需注意插件兼容性问题，建议更新相关插件至最新版本。Vite 5为开发者提供更快的开发体验

2026-04-11 00:19:23 180

css盒子模型知识点：1.什么是盒子模型2.标准盒子模型与 IE 盒子模型的不同点3.可以通过 box-sizing 设置盒子模型的种类

矩阵的十字计算

空空如也