自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(6)
  • 收藏
  • 关注

原创 全连接网络输入矩阵的行和列

在标准深度学习框架(PyTorch、TensorFlow)中,输入矩阵的每一行是一个样本,每一列是一个特征维度。所以,列是特征维度,而不是特征向量本身。一个特征向量(即一个样本的所有特征)在矩阵中表现为一行。举例:假设你有 100 个用户,每个用户有 128 个特征(比如年龄、收入、浏览时长等)。每一列(共128列):代表所有用户在某个特征维度上的取值(100 × 1)。每一行(共100行):代表一个完整的用户特征向量(1 × 128)。输入矩阵形状:[100, 128]

2026-06-24 17:32:15 277

原创 深度学习知识点

但一个“全连接网络”如果不包含隐藏层(比如只有输入直接映射到输出的单层感知机),或者结构上不满足多层非线性变换的条件,那它。这 m 个数据必须要有 m 个输入神经元来“接住”它们,然后分别通过 m 条独立的连接线(权重),传递给下一层(第一个隐藏层)的每一个神经元。假设你的数据集是一个表格,有 m 列(比如:年龄、工资、身高),那么你的输入特征维度就是 m。这种层与层之间的“两两相连”就是“全连接”名称的由来。3.多层感知机的第一层的神经元的数目等于输入特征向量的维度。1.全连接网络是指神经网络中的。

2026-06-23 11:57:58 306

原创 用ollama在ubuntu下部署一个大模型

API 服务:Ollama 默认会在后台开启一个 API 服务(地址是 http://localhost:11434),方便你通过编程方式来调用模型能力。模型选择:除了上面提到的模型,你也可以去 Ollama 官网的模型库 寻找其他你感兴趣的模型,比如阿里巴巴的 Qwen(通义千问)系列等。如果你在安装或下载过程中遇到了问题,比如网络连接失败,可以随时把具体的报错信息告诉我,我来帮你分析。下载完成后,用 ollama run 命令启动模型,你会直接进入一个交互式的命令行对话界面。# 1. 初始化模型。

2026-06-21 21:11:12 182

原创 智能体skill基本原理

但此时,它并不会读取Skill的全部内容,而是只读取每个SKILL.md文件最开头的"元数据"(YAML格式的name和description字段)。按需加载资源:此时,智能体会根据指令的指引,动态地、按需地去加载scripts/(可执行脚本)、references/(参考文档)或assets/(模板、图片等)文件夹中的内容。总的来说,智能体通过这种分阶段、按需加载的机制,实现了"知道所有技能,但只加载当前需要的那个",既扩展了能力边界,又保证了核心对话的高效与专注。

2026-06-17 14:34:53 152

原创 深度学习需要学习的内容

以上三个为三大核心,在此基础上,可以根据你的方向补充循神经网络 RNN、生成对抗网络(GAN)、图神经网络(GNN)等,另外。:近两年异军突起的生成模型,像 DALL-E 2、Stable Diffusion 等都是用它。1. 多层感知机(MLP)2.卷积神经网络(CNN)

2026-06-15 14:32:48 30

原创 人工智能学习笔记之关于智能体的一点理解

【摘要】大语言模型作为"大脑"负责思考决策,而智能体在此基础上增加了执行功能的"手脚",形成感知-决策-执行-反馈的完整闭环。其中,MCP协议是实现大模型与外部工具交互的核心标准,通过规范化报文格式实现工具调用。Skills作为可定制的复杂工具集,由MCPServer调度执行具体任务。该架构实现了自然语言输入→模型分析→工具调用→结果反馈的智能化处理流程,使大模型从纯认知系统升级为具备行动能力的智能体。

2026-06-05 17:11:02 285

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除