- 博客(6)
- 收藏
- 关注
原创 全连接网络输入矩阵的行和列
在标准深度学习框架(PyTorch、TensorFlow)中,输入矩阵的每一行是一个样本,每一列是一个特征维度。所以,列是特征维度,而不是特征向量本身。一个特征向量(即一个样本的所有特征)在矩阵中表现为一行。举例:假设你有 100 个用户,每个用户有 128 个特征(比如年龄、收入、浏览时长等)。每一列(共128列):代表所有用户在某个特征维度上的取值(100 × 1)。每一行(共100行):代表一个完整的用户特征向量(1 × 128)。输入矩阵形状:[100, 128]
2026-06-24 17:32:15
277
原创 深度学习知识点
但一个“全连接网络”如果不包含隐藏层(比如只有输入直接映射到输出的单层感知机),或者结构上不满足多层非线性变换的条件,那它。这 m 个数据必须要有 m 个输入神经元来“接住”它们,然后分别通过 m 条独立的连接线(权重),传递给下一层(第一个隐藏层)的每一个神经元。假设你的数据集是一个表格,有 m 列(比如:年龄、工资、身高),那么你的输入特征维度就是 m。这种层与层之间的“两两相连”就是“全连接”名称的由来。3.多层感知机的第一层的神经元的数目等于输入特征向量的维度。1.全连接网络是指神经网络中的。
2026-06-23 11:57:58
306
原创 用ollama在ubuntu下部署一个大模型
API 服务:Ollama 默认会在后台开启一个 API 服务(地址是 http://localhost:11434),方便你通过编程方式来调用模型能力。模型选择:除了上面提到的模型,你也可以去 Ollama 官网的模型库 寻找其他你感兴趣的模型,比如阿里巴巴的 Qwen(通义千问)系列等。如果你在安装或下载过程中遇到了问题,比如网络连接失败,可以随时把具体的报错信息告诉我,我来帮你分析。下载完成后,用 ollama run 命令启动模型,你会直接进入一个交互式的命令行对话界面。# 1. 初始化模型。
2026-06-21 21:11:12
182
原创 智能体skill基本原理
但此时,它并不会读取Skill的全部内容,而是只读取每个SKILL.md文件最开头的"元数据"(YAML格式的name和description字段)。按需加载资源:此时,智能体会根据指令的指引,动态地、按需地去加载scripts/(可执行脚本)、references/(参考文档)或assets/(模板、图片等)文件夹中的内容。总的来说,智能体通过这种分阶段、按需加载的机制,实现了"知道所有技能,但只加载当前需要的那个",既扩展了能力边界,又保证了核心对话的高效与专注。
2026-06-17 14:34:53
152
原创 深度学习需要学习的内容
以上三个为三大核心,在此基础上,可以根据你的方向补充循神经网络 RNN、生成对抗网络(GAN)、图神经网络(GNN)等,另外。:近两年异军突起的生成模型,像 DALL-E 2、Stable Diffusion 等都是用它。1. 多层感知机(MLP)2.卷积神经网络(CNN)
2026-06-15 14:32:48
30
原创 人工智能学习笔记之关于智能体的一点理解
【摘要】大语言模型作为"大脑"负责思考决策,而智能体在此基础上增加了执行功能的"手脚",形成感知-决策-执行-反馈的完整闭环。其中,MCP协议是实现大模型与外部工具交互的核心标准,通过规范化报文格式实现工具调用。Skills作为可定制的复杂工具集,由MCPServer调度执行具体任务。该架构实现了自然语言输入→模型分析→工具调用→结果反馈的智能化处理流程,使大模型从纯认知系统升级为具备行动能力的智能体。
2026-06-05 17:11:02
285
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅