博.闻广见-CSDN博客

原创第1篇：Agent开发全景图 —— 从零构建完整的技术认知框架

在纯粹的LLM应用时代，我们与模型的交互模式是“输入——输出”的单次问答。模型像一个无所不知但被困在瓶子里的精灵，你问它答，但它无法主动采取行动、无法查阅最新资料、也无法记住你上周说过什么。AI Agent（智能体）则打破了这层屏障。它不再是简单的“文本生成器”，而是一个能够自主规划、调用工具、记忆上下文并与环境交互的智能实体。Agent = LLM（大脑） + 规划（Planning） + 记忆（Memory） + 工具（Tools）给它一个身份（Role）

2026-06-25 13:56:07 286

原创 AI_深度学习-4.大模型（LLM）入门

加载模型 → 推理 → 微调，pipeline一行代码实现推理，Trainer低代码微调。常用任务：情感分析、文本生成、问答、NER、文本摘要、翻译。微调流程：加载模型 → 数据分词 → 设置训练参数 → Trainer 训练 → 保存与推理。LangChain：快速构建 LLM 应用，支持提示模板、链式调用、文档检索（RAG）。RAG（检索增强生成）：将外部文档向量化后存入数据库，LLM 根据检索结果回答问题，减少幻觉。大模型落地 = 加载 + 推理 + 微调 + 应用链。

2026-06-25 13:53:46 146

原创 AI_深度学习-3.经典模型入门

CNN：卷积提取特征 → 池化降维 → 全连接分类。ResNet + 迁移学习：图像分类任务的工业界首选，大幅提升小数据集性能。

2026-06-22 16:12:15 205

原创 AI_深度学习-2.深度学习基础概念

激活函数：隐藏层用 ReLU（默认首选），多分类输出层用 Softmax。训练流程：前向传播 → 计算 loss → 反向传播 → 更新参数（梯度下降）。关键超参数：学习率（步长）、Epoch（轮数）、Batch（批量大小）。过拟合应对：Dropout、Batch Normalization、早停、数据增强、正则化。所有深度学习模型都遵循这套原理，理解本章是看懂一切模型的基础。

2026-06-17 14:07:27 215

原创 AI_深度学习-1.PyTorch基础

Tensor= 支持 GPU 的数组，类似 NumPy。自动微分：设置，调用backward()自动计算梯度。构建网络：继承nn.Module，实现forward()，使用nn.Linearnn.Conv2d等层。损失函数：回归用MSELoss，多分类用，二分类用。优化器optim.SGDoptim.Adam，训练时→backward()→step()。训练循环：前向传播 → 计算 loss → 反向传播 → 更新参数。模型保存：推荐保存state_dict，加载后调用。一套模板走天下。

2026-06-16 08:50:32 164

原创 AI_机器学习-5.机器学习概述

有大量标注数据→ 监督学习（或深度学习做监督）只有无标注数据→ 无监督学习（聚类/降维）或半监督学习（如果少量标注可行）标注成本高，但有无标注数据→ 半监督学习任务需要序列决策，有环境交互→ 强化学习（可结合深度学习成为深度强化学习）数据量大、问题复杂（图像、语音、文本）→ 深度学习（可能结合监督/无监督/强化）

2026-06-12 09:07:35 389

原创 AI_机器学习-4.核函数扩展

方法核心任务核函数角色典型样本规模输出形式核岭回归 (KRR)非线性回归定义特征空间内积n<10^4点预测核逻辑回归 (KLR)非线性概率分类同上n<10^4类别概率核主成分分析 (KPCA)非线性降维捕捉数据流形n<10^4低维嵌入核 K‑Means非线性聚类使簇线性可分n<10^4簇标签高斯过程 (GP)贝叶斯回归/分类定义先验协方差n<2000均值+方差多核学习 (MKL)自动核组合融合异构相似度中等（取决于基核数）模型及权重。

2026-06-11 08:58:09 181

原创 AI_机器学习-2.Scikit-learn实战

标准化（Standardization）：是一种数据预处理方法，将原始数据按特征列转换为均值为0、标准差为1的分布。其计算公式为：x 是原始特征值\mu 是该特征列的均值\sigma 是该特征列的标准差标准化后的数据服从标准正态分布（但不要求原始数据为正态分布）。问题答案标准化做了什么？将每个特征的均值变为0，标准差变为1为什么需要？消除量纲影响，加速收敛，公平正则化，满足算法假设数据性质变化？均值、标准差改变，但相关性、顺序、分布形态不变标准差如何计算？

2026-06-10 10:23:18 211

原创 AI_机器学习-3.核函数基础

核函数核心公式关键参数最佳场景线性x_i^Tx_jC高维稀疏、线性可分多项式已知阶数、小样本RBF\gamma, C非线性问题默认首选拉普拉斯\gamma, C含噪声数据卡方\gamma, C直方图、非负特征直方图交无图像分类、直方图匹配Matern复杂（含贝塞尔函数）\nu,\rho高斯过程、空间统计掌握核函数的原理、数学形式和选择策略，是解决复杂非线性问题的关键。在实践中，建议从 RBF 核开始，结合交叉验证调优，并根据数据特性尝试更专门的核函数。

2026-06-09 09:14:26 344

原创 AI_机器学习-1.机器学习基础概念

特征（Feature）：输入变量，用于预测的属性（X）标签（Label）：输出变量，需要预测的目标（y）训练集（Train Set）：用于模型学习规律的数据测试集（Test Set）：用于评估模型泛化能力的数据（从未见过的新数据）针对分类任务，评估指标主要用来衡量模型预测的准确程度。选择哪个指标，取决于具体问题（例如是否类别不平衡，更关注哪类错误）。所有指标都建立在混淆矩阵的基础上。业务目标首选指标类别均衡，看整体正确率准确率不能漏掉正例（如癌症筛查）召回率。

2026-06-08 10:02:03 343

原创 AI_Python基础-11.Matplotlib & Seaborn（可视化）

Matplotlib：底层绘图库，灵活性高，适合精细控制图表。Seaborn：高级封装，语法简洁，内置漂亮样式和统计功能。常用图形折线图：趋势散点图：相关性柱状图：比较直方图：分布箱线图：统计摘要热力图：矩阵数据pairplot：多变量关系美化要素：标题、标签、图例、颜色映射、网格、样式主题、去除多余边框。子图布局创建多子图，自动调整间距。实战流程：数据加载 → 数据处理 → 计算指标 → 绘制图表 → 美化 → 结论分析。

2026-06-05 09:18:23 184

原创 AI_Python基础-10.Pandas

Series：一维带标签数组；DataFrame：二维表格，类似 Excel。数据读取read_csvread_excelread_json，注意编码和参数。数据清洗dropnafillna处理缺失值；去重；条件过滤处理异常值。筛选loc（标签/条件）、iloc（位置）、布尔索引（df[条件]分组聚合groupby()agg()或，可自定义函数。合并concat拼接（行/列）；merge按键连接（内/左/右/外）。透视表实现数据透视，支持多级索引和边际统计。

2026-06-04 08:56:36 198

原创 AI_Python基础-9.NumPy

ndarray：同质多维数组，核心属性shapedtypendimsize。创建方式np.array()np.zeros()np.ones()等。索引与切片：基本索引、切片（返回视图）、布尔索引（返回副本）、花式索引（返回副本）。广播机制：形状兼容的数组可直接运算，自动扩展维度，规则清晰。通用函数（ufunc）np.sqrt()np.exp()np.sin()等，逐元素高效计算。数组运算：元素级算术运算；矩阵乘法用或np.dot()；统计方法可指定axis。线性代数np.linalg。

2026-06-03 10:09:05 335

原创 AI_Python基础-8.并发编程基础

GIL：CPython 的全局解释器锁，导致多线程无法利用多核 CPU。多线程：适合 IO 密集型任务，注意线程安全（使用锁），可用。多进程：适合 CPU 密集型任务，绕过 GIL，进程间通信使用Queue或Pipe，可用。异步 IO：单线程高并发，使用asyncio+ 异步库（如aiohttp），代码复杂但效率极高。选择原则：CPU 密集型 → 多进程；IO 密集型 → 多线程或 asyncio（高并发选 asyncio）。实战技巧：生成器处理大文件，装饰器计时，多进程可进一步优化日志分析效率。

2026-05-28 10:51:01 381

原创 AI_Python基础-7.装饰器

装饰器本质：高阶函数，接收函数返回新函数，使用语法糖。：必须使用，以保留原函数的元信息（__name____doc__带参数的装饰器：三层嵌套函数，最外层接收装饰器参数，内层接收函数，最内层接收函数参数。类装饰器：通过__init__接收被装饰函数（或参数），通过__call__实现包装逻辑，适合保存状态。执行顺序：多个装饰器从下往上执行（靠近函数的最先被包装）。应用场景：日志、计时、缓存、权限校验、重试、单例模式等。

2026-05-27 10:39:00 603

原创 AI_Python基础-6.迭代器与生成器

再次遍历（迭代器已耗尽，无输出）print(num)可迭代对象：实现了__iter__()，返回迭代器。常见的有liststrdict等。迭代器：实现了__iter__()和__next__()，只能遍历一次。for循环依赖迭代协议。生成器函数：使用yield的函数，调用时返回生成器对象（属于迭代器），支持延迟计算和状态保持。生成器表达式：类似列表推导式但使用()，返回生成器对象，适合大数据量处理。内存优势：生成器和生成器表达式不一次性存储所有元素，处理大数据集时能显著降低内存占用。

2026-05-26 09:28:56 642

原创 AI_Python基础-4.标准库与IO

标准库常用模块os：跨平台路径拼接、文件/目录操作sys：命令行参数、模块搜索路径、程序退出datetime：日期时间创建、格式化、计算json：序列化/反序列化（字符串，dump/load文件）：数学函数、随机数生成re：正则匹配、搜索、替换IO 操作文本文件：使用with上下文管理器，指定'rb''wb'模式csv.readercsv.writer及字典读写写入文件，读取文件。

2026-05-21 09:29:42 364

原创 AI_Python基础-3.异常处理与模块

通过继承Exception类创建自定义异常，便于模块化错误处理。# 定义自定义异常"""当输入负数时抛出的异常"""passdef __init__(self, age, message="年龄不能超过150岁"):# 使用自定义异常raise NegativeNumberError("年龄不能为负数")

2026-05-20 09:15:09 380

原创 AI_Python基础-2.数据结构与函数

基本定义"""这是一个文档字符串（docstring）"""# 基本定义 def greet(name) : """这是一个文档字符串（docstring）""" return f"Hello, {name }!" # 无返回值（默认返回 None） def say_hello() : print("Hello") # 多个返回值（实际返回一个元组） def get_info() : return "张三" , 20 name , age = get_info() # 解包!

2026-05-19 09:12:13 366

原创 AI_Python基础-1.基础语法与控制流

Python 靠缩进划分代码块，动态类型无需声明变量。input()默认返回字符串，print()优先使用f-string格式化。条件判断必须加冒号，循环支持breakcontinueelse。in是 Python 高频使用的成员运算符，适用于字符串、列表等可迭代对象。range()配合for循环非常灵活，支持起始、结束和步长参数。

2026-05-18 11:05:40 371

原创 AI_数学基础-信息论与数值计算-2.数值方法

在深层神经网络中，反向传播时梯度通过链式法则连乘传播：梯度消失：连乘后梯度趋近于 0 → 浅层权重几乎不更新 → 模型无法学习底层特征。梯度爆炸：连乘后梯度趋近于无穷大 → 权重更新剧烈 → 模型不稳定，损失变为 NaN。

2026-05-17 11:35:57 374

原创 AI_数学基础-信息论与数值计算-1.信息论基础

对于随机事件 x，其发生概率为 p(x)，则信息量定义为：b=2 → 比特（bit），通信领域常用b=e → 奈特（nat），AI/机器学习默认b=10 → 哈特莱（Hartley），极少用对于离散随机变量 X，其概率分布为 p(x)，熵定义为：对于真实分布 p 和预测分布 q，交叉熵定义为：与熵的关系：交叉熵 = 熵 + KL 散度当 q = p 时取等号，此时 H(p, p) = H(p)。对于离散概率分布 p 和 q：对于连续概率分布：概念公式物理含义AI 应用。

2026-05-13 11:58:52 153

原创 AI_数学基础-最优化方法-3.过拟合与正则化

过拟合指模型在训练集上表现极好（误差极小），但在测试集上表现极差（误差极大），即模型“死记硬背”训练数据，无法泛化到新数据。本质是模型复杂度过高，拟合了训练数据中的噪声。

2026-05-12 10:03:29 376

原创 AI_数学基础-最优化方法-2.梯度下降家族

优化器梯度来源学习率收敛速度适用场景BGD全量样本固定慢（大数据集）小数据集、凸问题SGD单样本固定/衰减快但震荡在线学习、非凸小批量固定/衰减快且较稳通用首选Momentum小批量固定/衰减更快有峡谷、平原问题RMSprop小批量自适应快RNN、非平稳目标Adam小批量自适应最快且稳几乎所有任务。

2026-05-09 08:04:38 405

原创 AI_数学基础-最优化方法-1.凸优化基础

设函数 f 定义在凸集 D 上。取 x_1=1,\;x_2=3,\;左侧：f(0.5×1+0.5×3)=f(2)=4右侧：0.5×f(1)+0.5×f(3)=0.5×1+0.5×9=5由于 4 \le 5，满足定义，因此 f(x)=x^2 是凸函数。局部最优：存在邻域 N，使得 f(x^*) \le f(x)（最小化问题）对所有 x\in N 成立。全局最优：对所有 x\in \text{dom}f，f(x^*) \le f(x) 成立。其中 f 通常为凸函数（AI 中为损失函数）。

2026-05-07 09:49:23 347

原创 AI_概率统计-5.最大似然估计

简单说，概率描述的是：在已知某个模型或规则的情况下，某个结果出现的可能性。举个例子：你有一枚“公平的”硬币，抛出去正面朝上的概率是0.5。这是已知模型（硬币公平），预测结果（正面）的可能性。随机变量就是把随机事件的结果用一个数字表示。抛硬币：正面=1，反面=0掷骰子：点数1,2,3,4,5,6概率分布告诉我们：一个随机变量取每个可能值的概率。离散分布：结果可列举（如硬币）。用“概率质量函数”描述。连续分布：结果在一个区间内（如身高）。用“概率密度函数”描述。本文主要用伯努利分布。

2026-05-05 09:12:09 219

原创 AI_概率统计-4.机器学习必备

衡量随机变量取值的不确定性。熵越大，不确定性越高；熵越小，不确定性越低（当随机变量只有一个确定取值时，熵为0）。

2026-05-01 21:58:54 381

原创 AI_概率统计-3.统计量

随机变量取值的加权平均（离散型）或积分（连续型），反映数据的“中心位置”。AI 中更常用。

2026-04-30 08:45:27 397

原创 AI_概率统计-2.常见分布

以下涵盖均匀分布、正态分布（高斯分布）、伯努利分布、二项分布、多项分布，以及 Softmax 背后的分布思想。

2026-04-28 08:31:02 425

原创 AI_高等数学-4.必备公式

公式：ddxxn=nxn−1\frac{d}{dx} x^n = n x^{n-1}dxdxn=nxn−1核心知识点：手工计算示例（贴合AI线性变换场景）：公式：ddxex=ex\frac{d}{dx} e^x = e^xdxdex=ex核心知识点：手工计算示例（贴合AI激活函数场景）：公式：ddxln⁡(x)=1x,x>0\frac{d}{dx} \ln(x) = \frac{1}{x}, \quad x > 0dxdln(x)=x1,x>0核心知识点：手工计算示例（贴合AI交叉

2026-04-27 09:11:02 375

原创 AI_高等数学-3.积分

定义：不定积分是导数的逆运算，即已知一个函数的导数FxF(x)Fx，求原来的函数fxf(x)fx。若f′xFxf′xFx，则∫FxdxfxC∫FxdxfxC其中CCC为任意常数，称为积分常数。记法∫Fxdx∫Fxdx读作“积分FxdxF(x) \, dxFxdxFxF(x)Fx称为被积函数dxdxdx称为积分变量。通俗理解：已知“函数的变化率（导数）”，求“原函数”。

2026-04-26 16:12:33 536

原创 AI_高等数学-2.导数与微分

直观理解：函数fxf(x)fx在点x0x_0x0处的导数f′x0f'(x_0)f′x0描述了fxf(x)fx在x0x_0x0附近的瞬时变化率，即当xxx发生微小变化时fxf(x)fx变化的快慢。数学定义f′xlim⁡Δx→0fxΔx−fxΔxf′xΔx→0limΔxfxΔx−fx几何意义：导数等于函数曲线在点x0fx0x0fx0))

2026-04-24 10:56:45 415

原创 AI_高等数学-1. 函数与极限

当自变量xxx无限趋近于某个值x0x_0x0（或趋于无穷大）时，函数值fxf(x)fx无限趋近于一个确定的常数AAA，则称AAA为极限，记作lim⁡x→x0fxA或lim⁡x→∞fxA\lim_{x \to x_0} f(x) = A \quad \text{或} \quad \lim_{x \to \infty} f(x) = A.x→x0limfxA或x→∞limfxA核心思想。

2026-04-23 09:19:55 440

原创 AI_概率统计-1.概率基础

随机变量：将随机试验的结果映射为实数的变量。通俗说，就是“取值随机会而定的变量”。离散型随机变量：取值有限或可数无限（如掷骰子的点数、分类任务的类别标签）。概率描述用概率质量函数（PMF）PXxP(X=x)PXx。连续型随机变量：取值充满一个区间（如身高、模型预测的概率值）。概率描述用概率密度函数（PDF）fxf(x)fx，满足∫−∞∞fxdx1∫−∞∞fxdx1，且Pa≤X≤b∫abfxdxPa≤X≤b∫。

2026-04-23 09:18:27 406

原创 AI_线性代数-6.PCA降维详解

数据中心化：每个样本减去对应变量的均值，移到原点，消除整体偏移；计算协方差矩阵：整合方差和协方差，反映数据的波动和变量关联；求特征值与特征向量：特征值决定方向的信息多少，特征向量是数据变化最大的方向；按特征值排序：保留前 k 个最大特征值对应的特征向量（k 是降维后的维度）；投影降维：将中心化后的样本，投影到保留的特征向量方向上，得到低维数据。

2026-04-21 08:55:33 454

原创 AI_线性代数-5.SVD（奇异值分解）

SVD 是连接线性代数理论与数据科学应用的桥梁。建议先手工计算小矩阵建立直觉，再用 Python 实践，最后结合几何可视化深入理解。如有特定应用（如图像压缩）需要代码示例，欢迎进一步探讨。

2026-04-20 08:34:40 407

原创 AI_Python基础-5.Python 面向对象编程（OOP）

"ml[1] = 3del ml[0]类与对象__init__构造方法，self代表实例本身。类属性 vs 实例属性：类属性所有实例共享，实例属性各自独立。类方法（）操作类属性，静态方法（）是普通函数。封装_name约定私有（外部仍可访问），__name名称修饰防止意外覆盖。@property提供 Pythonic 的 getter/setter。继承：单继承用super()调用父类；多继承注意 MRO 顺序（类名.__mro__查看）。多态。

2026-04-17 08:25:44 369

原创 AI_线性代数-4.常见应用

线性变换：矩阵乘法实现了旋转、缩放、投影等几何操作，是图形学和神经网络的基础。最小二乘法：线性回归的闭式解θXTX−1XTyθXTX−1XTy，要求XTXXTX可逆。矩阵求导：核心公式∂Wx∂WxT∂W∂WxxT必须熟记，其余公式可查表。代码实践：掌握（矩阵乘法）、（解线性方程组）、（特征分解）三个核心函数。所有公式、代码均可直接复制到 Obsidian 中，支持 LaTeX 实时渲染。

2026-04-16 08:21:13 409

原创 AI_线性代数-3.特征值与特征向量

对于方阵A∈Rn×nA∈Rn×n，若存在非零向量x∈Rnx∈Rn和标量λ\lambdaλAxλxAxλxxx为AA的特征向量（方向不变）λ\lambdaλ为对应的特征值（拉伸/缩放倍数）若方阵AA有nnnAQΛQ−1AQΛQ−1QQ：特征向量按列组成的矩阵（可逆）Λdiag⁡λ1λ2λnΛdiagλ1λ2λn核心公式AxλxAxλx。

2026-04-15 08:21:51 421

原创 AI_线性代数-2.向量

一个向量就是一个有顺序的数字列表。123[1, 2, 3]123123123在 AI 中，向量可以表示：样本特征、词嵌入、模型参数、梯度等。几何直觉：在二维平面上，向量23[2, 3]23可以看作从原点00(0,0)00指向23(2,3)23的箭头。

2026-04-14 09:28:18 361

空空如也

空空如也