- 博客(86)
- 收藏
- 关注
原创 第1篇:Agent开发全景图 —— 从零构建完整的技术认知框架
在纯粹的LLM应用时代,我们与模型的交互模式是“输入——输出”的单次问答。模型像一个无所不知但被困在瓶子里的精灵,你问它答,但它无法主动采取行动、无法查阅最新资料、也无法记住你上周说过什么。AI Agent(智能体)则打破了这层屏障。它不再是简单的“文本生成器”,而是一个能够自主规划、调用工具、记忆上下文并与环境交互的智能实体。Agent = LLM(大脑) + 规划(Planning) + 记忆(Memory) + 工具(Tools)给它一个身份(Role)
2026-06-25 13:56:07
286
原创 AI_深度学习-4.大模型(LLM)入门
加载模型 → 推理 → 微调,pipeline一行代码实现推理,Trainer低代码微调。常用任务:情感分析、文本生成、问答、NER、文本摘要、翻译。微调流程:加载模型 → 数据分词 → 设置训练参数 → Trainer 训练 → 保存与推理。LangChain:快速构建 LLM 应用,支持提示模板、链式调用、文档检索(RAG)。RAG(检索增强生成):将外部文档向量化后存入数据库,LLM 根据检索结果回答问题,减少幻觉。大模型落地 = 加载 + 推理 + 微调 + 应用链。
2026-06-25 13:53:46
146
原创 AI_深度学习-3.经典模型入门
CNN:卷积提取特征 → 池化降维 → 全连接分类。ResNet + 迁移学习:图像分类任务的工业界首选,大幅提升小数据集性能。
2026-06-22 16:12:15
205
原创 AI_深度学习-2.深度学习基础概念
激活函数:隐藏层用 ReLU(默认首选),多分类输出层用 Softmax。训练流程:前向传播 → 计算 loss → 反向传播 → 更新参数(梯度下降)。关键超参数:学习率(步长)、Epoch(轮数)、Batch(批量大小)。过拟合应对:Dropout、Batch Normalization、早停、数据增强、正则化。所有深度学习模型都遵循这套原理,理解本章是看懂一切模型的基础。
2026-06-17 14:07:27
215
原创 AI_深度学习-1.PyTorch基础
Tensor= 支持 GPU 的数组,类似 NumPy。自动微分:设置,调用backward()自动计算梯度。构建网络:继承nn.Module,实现forward(),使用nn.Linearnn.Conv2d等层。损失函数:回归用MSELoss,多分类用,二分类用。优化器optim.SGDoptim.Adam,训练时→backward()→step()。训练循环:前向传播 → 计算 loss → 反向传播 → 更新参数。模型保存:推荐保存state_dict,加载后调用。一套模板走天下。
2026-06-16 08:50:32
164
原创 AI_机器学习-5.机器学习概述
有大量标注数据→ 监督学习(或深度学习做监督)只有无标注数据→ 无监督学习(聚类/降维)或半监督学习(如果少量标注可行)标注成本高,但有无标注数据→ 半监督学习任务需要序列决策,有环境交互→ 强化学习(可结合深度学习成为深度强化学习)数据量大、问题复杂(图像、语音、文本)→ 深度学习(可能结合监督/无监督/强化)
2026-06-12 09:07:35
389
原创 AI_机器学习-4.核函数扩展
方法核心任务核函数角色典型样本规模输出形式核岭回归 (KRR)非线性回归定义特征空间内积n<10^4点预测核逻辑回归 (KLR)非线性概率分类同上n<10^4类别概率核主成分分析 (KPCA)非线性降维捕捉数据流形n<10^4低维嵌入核 K‑Means非线性聚类使簇线性可分n<10^4簇标签高斯过程 (GP)贝叶斯回归/分类定义先验协方差n<2000均值+方差多核学习 (MKL)自动核组合融合异构相似度中等(取决于基核数)模型及权重。
2026-06-11 08:58:09
181
原创 AI_机器学习-2.Scikit-learn实战
标准化(Standardization):是一种数据预处理方法,将原始数据按特征列转换为均值为0、标准差为1的分布。其计算公式为:x 是原始特征值\mu 是该特征列的均值\sigma 是该特征列的标准差标准化后的数据服从标准正态分布(但不要求原始数据为正态分布)。问题答案标准化做了什么?将每个特征的均值变为0,标准差变为1为什么需要?消除量纲影响,加速收敛,公平正则化,满足算法假设数据性质变化?均值、标准差改变,但相关性、顺序、分布形态不变标准差如何计算?
2026-06-10 10:23:18
211
原创 AI_机器学习-3.核函数基础
核函数核心公式关键参数最佳场景线性x_i^Tx_jC高维稀疏、线性可分多项式已知阶数、小样本RBF\gamma, C非线性问题默认首选拉普拉斯\gamma, C含噪声数据卡方\gamma, C直方图、非负特征直方图交无图像分类、直方图匹配Matern复杂(含贝塞尔函数)\nu,\rho高斯过程、空间统计掌握核函数的原理、数学形式和选择策略,是解决复杂非线性问题的关键。在实践中,建议从 RBF 核开始,结合交叉验证调优,并根据数据特性尝试更专门的核函数。
2026-06-09 09:14:26
344
原创 AI_机器学习-1.机器学习基础概念
特征(Feature):输入变量,用于预测的属性(X)标签(Label):输出变量,需要预测的目标(y)训练集(Train Set):用于模型学习规律的数据测试集(Test Set):用于评估模型泛化能力的数据(从未见过的新数据)针对分类任务,评估指标主要用来衡量模型预测的准确程度。选择哪个指标,取决于具体问题(例如是否类别不平衡,更关注哪类错误)。所有指标都建立在混淆矩阵的基础上。业务目标首选指标类别均衡,看整体正确率准确率不能漏掉正例(如癌症筛查)召回率。
2026-06-08 10:02:03
343
原创 AI_Python基础-11.Matplotlib & Seaborn(可视化)
Matplotlib:底层绘图库,灵活性高,适合精细控制图表。Seaborn:高级封装,语法简洁,内置漂亮样式和统计功能。常用图形折线图:趋势散点图:相关性柱状图:比较直方图:分布箱线图:统计摘要热力图:矩阵数据pairplot:多变量关系美化要素:标题、标签、图例、颜色映射、网格、样式主题、去除多余边框。子图布局创建多子图,自动调整间距。实战流程:数据加载 → 数据处理 → 计算指标 → 绘制图表 → 美化 → 结论分析。
2026-06-05 09:18:23
184
原创 AI_Python基础-10.Pandas
Series:一维带标签数组;DataFrame:二维表格,类似 Excel。数据读取read_csvread_excelread_json,注意编码和参数。数据清洗dropnafillna处理缺失值;去重;条件过滤处理异常值。筛选loc(标签/条件)、iloc(位置)、布尔索引(df[条件]分组聚合groupby()agg()或,可自定义函数。合并concat拼接(行/列);merge按键连接(内/左/右/外)。透视表实现数据透视,支持多级索引和边际统计。
2026-06-04 08:56:36
198
原创 AI_Python基础-9.NumPy
ndarray:同质多维数组,核心属性shapedtypendimsize。创建方式np.array()np.zeros()np.ones()等。索引与切片:基本索引、切片(返回视图)、布尔索引(返回副本)、花式索引(返回副本)。广播机制:形状兼容的数组可直接运算,自动扩展维度,规则清晰。通用函数(ufunc)np.sqrt()np.exp()np.sin()等,逐元素高效计算。数组运算:元素级算术运算;矩阵乘法用或np.dot();统计方法可指定axis。线性代数np.linalg。
2026-06-03 10:09:05
335
原创 AI_Python基础-8.并发编程基础
GIL:CPython 的全局解释器锁,导致多线程无法利用多核 CPU。多线程:适合 IO 密集型任务,注意线程安全(使用锁),可用。多进程:适合 CPU 密集型任务,绕过 GIL,进程间通信使用Queue或Pipe,可用。异步 IO:单线程高并发,使用asyncio+ 异步库(如aiohttp),代码复杂但效率极高。选择原则:CPU 密集型 → 多进程;IO 密集型 → 多线程或 asyncio(高并发选 asyncio)。实战技巧:生成器处理大文件,装饰器计时,多进程可进一步优化日志分析效率。
2026-05-28 10:51:01
381
原创 AI_Python基础-7.装饰器
装饰器本质:高阶函数,接收函数返回新函数,使用语法糖。:必须使用,以保留原函数的元信息(__name____doc__带参数的装饰器:三层嵌套函数,最外层接收装饰器参数,内层接收函数,最内层接收函数参数。类装饰器:通过__init__接收被装饰函数(或参数),通过__call__实现包装逻辑,适合保存状态。执行顺序:多个装饰器从下往上执行(靠近函数的最先被包装)。应用场景:日志、计时、缓存、权限校验、重试、单例模式等。
2026-05-27 10:39:00
603
原创 AI_Python基础-6.迭代器与生成器
再次遍历(迭代器已耗尽,无输出)print(num)可迭代对象:实现了__iter__(),返回迭代器。常见的有liststrdict等。迭代器:实现了__iter__()和__next__(),只能遍历一次。for循环依赖迭代协议。生成器函数:使用yield的函数,调用时返回生成器对象(属于迭代器),支持延迟计算和状态保持。生成器表达式:类似列表推导式但使用(),返回生成器对象,适合大数据量处理。内存优势:生成器和生成器表达式不一次性存储所有元素,处理大数据集时能显著降低内存占用。
2026-05-26 09:28:56
642
原创 AI_Python基础-4.标准库与IO
标准库常用模块os:跨平台路径拼接、文件/目录操作sys:命令行参数、模块搜索路径、程序退出datetime:日期时间创建、格式化、计算json:序列化/反序列化(字符串,dump/load文件):数学函数、随机数生成re:正则匹配、搜索、替换IO 操作文本文件:使用with上下文管理器,指定'rb''wb'模式csv.readercsv.writer及字典读写写入文件,读取文件。
2026-05-21 09:29:42
364
原创 AI_Python基础-3.异常处理与模块
通过继承Exception类创建自定义异常,便于模块化错误处理。# 定义自定义异常"""当输入负数时抛出的异常"""passdef __init__(self, age, message="年龄不能超过150岁"):# 使用自定义异常raise NegativeNumberError("年龄不能为负数")
2026-05-20 09:15:09
380
原创 AI_Python基础-2.数据结构与函数
基本定义"""这是一个文档字符串(docstring)"""# 基本定义 def greet(name) : """这是一个文档字符串(docstring)""" return f"Hello, {name }!" # 无返回值(默认返回 None) def say_hello() : print("Hello") # 多个返回值(实际返回一个元组) def get_info() : return "张三" , 20 name , age = get_info() # 解包!
2026-05-19 09:12:13
366
原创 AI_Python基础-1.基础语法与控制流
Python 靠缩进划分代码块,动态类型无需声明变量。input()默认返回字符串,print()优先使用f-string格式化。条件判断必须加冒号,循环支持breakcontinueelse。in是 Python 高频使用的成员运算符,适用于字符串、列表等可迭代对象。range()配合for循环非常灵活,支持起始、结束和步长参数。
2026-05-18 11:05:40
371
原创 AI_数学基础-信息论与数值计算-2.数值方法
在深层神经网络中,反向传播时梯度通过链式法则连乘传播:梯度消失:连乘后梯度趋近于 0 → 浅层权重几乎不更新 → 模型无法学习底层特征。梯度爆炸:连乘后梯度趋近于无穷大 → 权重更新剧烈 → 模型不稳定,损失变为 NaN。
2026-05-17 11:35:57
374
原创 AI_数学基础-信息论与数值计算-1.信息论基础
对于随机事件 x,其发生概率为 p(x),则信息量定义为:b=2 → 比特(bit),通信领域常用b=e → 奈特(nat),AI/机器学习默认b=10 → 哈特莱(Hartley),极少用对于离散随机变量 X,其概率分布为 p(x),熵定义为:对于真实分布 p 和预测分布 q,交叉熵定义为:与熵的关系:交叉熵 = 熵 + KL 散度当 q = p 时取等号,此时 H(p, p) = H(p)。对于离散概率分布 p 和 q:对于连续概率分布:概念公式物理含义AI 应用。
2026-05-13 11:58:52
153
原创 AI_数学基础-最优化方法-3.过拟合与正则化
过拟合指模型在训练集上表现极好(误差极小),但在测试集上表现极差(误差极大),即模型“死记硬背”训练数据,无法泛化到新数据。本质是模型复杂度过高,拟合了训练数据中的噪声。
2026-05-12 10:03:29
376
原创 AI_数学基础-最优化方法-2.梯度下降家族
优化器梯度来源学习率收敛速度适用场景BGD全量样本固定慢(大数据集)小数据集、凸问题SGD单样本固定/衰减快但震荡在线学习、非凸小批量固定/衰减快且较稳通用首选Momentum小批量固定/衰减更快有峡谷、平原问题RMSprop小批量自适应快RNN、非平稳目标Adam小批量自适应最快且稳几乎所有任务。
2026-05-09 08:04:38
405
原创 AI_数学基础-最优化方法-1.凸优化基础
设函数 f 定义在凸集 D 上。取 x_1=1,\;x_2=3,\;左侧:f(0.5×1+0.5×3)=f(2)=4右侧:0.5×f(1)+0.5×f(3)=0.5×1+0.5×9=5由于 4 \le 5,满足定义,因此 f(x)=x^2 是凸函数。局部最优:存在邻域 N,使得 f(x^*) \le f(x)(最小化问题)对所有 x\in N 成立。全局最优:对所有 x\in \text{dom}f,f(x^*) \le f(x) 成立。其中 f 通常为凸函数(AI 中为损失函数)。
2026-05-07 09:49:23
347
原创 AI_概率统计-5.最大似然估计
简单说,概率描述的是:在已知某个模型或规则的情况下,某个结果出现的可能性。举个例子:你有一枚“公平的”硬币,抛出去正面朝上的概率是0.5。这是已知模型(硬币公平),预测结果(正面)的可能性。随机变量就是把随机事件的结果用一个数字表示。抛硬币:正面=1,反面=0掷骰子:点数1,2,3,4,5,6概率分布告诉我们:一个随机变量取每个可能值的概率。离散分布:结果可列举(如硬币)。用“概率质量函数”描述。连续分布:结果在一个区间内(如身高)。用“概率密度函数”描述。本文主要用伯努利分布。
2026-05-05 09:12:09
219
原创 AI_概率统计-4.机器学习必备
衡量随机变量取值的不确定性。熵越大,不确定性越高;熵越小,不确定性越低(当随机变量只有一个确定取值时,熵为0)。
2026-05-01 21:58:54
381
原创 AI_高等数学-4.必备公式
公式:ddxxn=nxn−1\frac{d}{dx} x^n = n x^{n-1}dxdxn=nxn−1核心知识点:手工计算示例(贴合AI线性变换场景):公式:ddxex=ex\frac{d}{dx} e^x = e^xdxdex=ex核心知识点:手工计算示例(贴合AI激活函数场景):公式:ddxln(x)=1x,x>0\frac{d}{dx} \ln(x) = \frac{1}{x}, \quad x > 0dxdln(x)=x1,x>0核心知识点:手工计算示例(贴合AI交叉
2026-04-27 09:11:02
375
原创 AI_高等数学-3.积分
定义:不定积分是导数的逆运算,即已知一个函数的导数FxF(x)Fx,求原来的函数fxf(x)fx。若f′xFxf′xFx,则∫FxdxfxC∫FxdxfxC其中CCC为任意常数,称为积分常数。记法∫Fxdx∫Fxdx读作“积分FxdxF(x) \, dxFxdxFxF(x)Fx称为被积函数dxdxdx称为积分变量。通俗理解:已知“函数的变化率(导数)”,求“原函数”。
2026-04-26 16:12:33
536
原创 AI_高等数学-2.导数与微分
直观理解:函数fxf(x)fx在点x0x_0x0处的导数f′x0f'(x_0)f′x0描述了fxf(x)fx在x0x_0x0附近的瞬时变化率,即当xxx发生微小变化时fxf(x)fx变化的快慢。数学定义f′xlimΔx→0fxΔx−fxΔxf′xΔx→0limΔxfxΔx−fx几何意义:导数等于函数曲线在点x0fx0x0fx0))
2026-04-24 10:56:45
415
原创 AI_高等数学-1. 函数与极限
当自变量xxx无限趋近于某个值x0x_0x0(或趋于无穷大)时,函数值fxf(x)fx无限趋近于一个确定的常数AAA,则称AAA为极限,记作limx→x0fxA或limx→∞fxA\lim_{x \to x_0} f(x) = A \quad \text{或} \quad \lim_{x \to \infty} f(x) = A.x→x0limfxA或x→∞limfxA核心思想。
2026-04-23 09:19:55
440
原创 AI_概率统计-1.概率基础
随机变量:将随机试验的结果映射为实数的变量。通俗说,就是“取值随机会而定的变量”。离散型随机变量:取值有限或可数无限(如掷骰子的点数、分类任务的类别标签)。概率描述用概率质量函数(PMF)PXxP(X=x)PXx。连续型随机变量:取值充满一个区间(如身高、模型预测的概率值)。概率描述用概率密度函数(PDF)fxf(x)fx,满足∫−∞∞fxdx1∫−∞∞fxdx1,且Pa≤X≤b∫abfxdxPa≤X≤b∫。
2026-04-23 09:18:27
406
原创 AI_线性代数-6.PCA降维详解
数据中心化:每个样本减去对应变量的均值,移到原点,消除整体偏移;计算协方差矩阵:整合方差和协方差,反映数据的波动和变量关联;求特征值与特征向量:特征值决定方向的信息多少,特征向量是数据变化最大的方向;按特征值排序:保留前 k 个最大特征值对应的特征向量(k 是降维后的维度);投影降维:将中心化后的样本,投影到保留的特征向量方向上,得到低维数据。
2026-04-21 08:55:33
454
原创 AI_线性代数-5.SVD(奇异值分解)
SVD 是连接线性代数理论与数据科学应用的桥梁。建议先手工计算小矩阵建立直觉,再用 Python 实践,最后结合几何可视化深入理解。如有特定应用(如图像压缩)需要代码示例,欢迎进一步探讨。
2026-04-20 08:34:40
407
原创 AI_Python基础-5.Python 面向对象编程(OOP)
"ml[1] = 3del ml[0]类与对象__init__构造方法,self代表实例本身。类属性 vs 实例属性:类属性所有实例共享,实例属性各自独立。类方法()操作类属性,静态方法()是普通函数。封装_name约定私有(外部仍可访问),__name名称修饰防止意外覆盖。@property提供 Pythonic 的 getter/setter。继承:单继承用super()调用父类;多继承注意 MRO 顺序(类名.__mro__查看)。多态。
2026-04-17 08:25:44
369
原创 AI_线性代数-4.常见应用
线性变换:矩阵乘法实现了旋转、缩放、投影等几何操作,是图形学和神经网络的基础。最小二乘法:线性回归的闭式解θXTX−1XTyθXTX−1XTy,要求XTXXTX可逆。矩阵求导:核心公式∂Wx∂WxT∂W∂WxxT必须熟记,其余公式可查表。代码实践:掌握(矩阵乘法)、(解线性方程组)、(特征分解)三个核心函数。所有公式、代码均可直接复制到 Obsidian 中,支持 LaTeX 实时渲染。
2026-04-16 08:21:13
409
原创 AI_线性代数-3.特征值与特征向量
对于方阵A∈Rn×nA∈Rn×n,若存在非零向量x∈Rnx∈Rn和标量λ\lambdaλAxλxAxλxxx为AA的特征向量(方向不变)λ\lambdaλ为对应的特征值(拉伸/缩放倍数)若方阵AA有nnnAQΛQ−1AQΛQ−1QQ:特征向量按列组成的矩阵(可逆)Λdiagλ1λ2λnΛdiagλ1λ2λn核心公式AxλxAxλx。
2026-04-15 08:21:51
421
原创 AI_线性代数-2.向量
一个向量就是一个有顺序的数字列表。123[1, 2, 3]123123123在 AI 中,向量可以表示:样本特征、词嵌入、模型参数、梯度等。几何直觉:在二维平面上,向量23[2, 3]23可以看作从原点00(0,0)00指向23(2,3)23的箭头。
2026-04-14 09:28:18
361
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅