每天骑着小毛驴去集市里敲代码-CSDN博客

原创 Transformer 架构详解——从注意力机制到 GPT

Transformer 是一种神经网络架构。我之前的文章里有提到，原始的模型有点像是记性非常不好的学生，无法记住短期信息；而Transformer就是帮助它们记忆的老师，让模型终于能够高效捕捉数据里的关联3.3 ChatGPT 在做什么（二）简单回顾：神经网络是一种非常有效的模型，用于分析复杂的数据类型，如图像、视频、音频和文本。但针对不同类型的数据，有不同类型的神经网络进行了优化。

2026-02-14 14:17:57 1090

原创 Obsidian+Claude Code打造本地AI知识库

这里其实就跟添加skills的思路是一样的，只是取决于你想要只装在obsidian里面还是全局skills。我今天试了一下新发布的glm5，竟然把我代码里藏了好多天的bug改掉了，感觉还是挺厉害的。

2026-02-13 22:59:12 1359

原创 ChatGPT 在做什么，以及它为什么能起作用（三）

本文探讨了ChatGPT如何通过词嵌入技术将语言转化为数学空间中的向量，揭示了人类语言可能遵循的底层规律。主要内容包括：1) 词嵌入将词语映射为高维向量，语义相近的词在空间中距离更近；2) ChatGPT的成功暗示语言可能存在类似物理定律的"语义运动规律"；3) 自然语言的模糊性与计算语言的精确性形成对比，未来需要结合两者发展更强大的智能系统。文章指出，ChatGPT展现的语言规律表明人类思维可能比想象中更简单可量化。

2026-02-13 22:21:40 896

原创 ChatGPT在做什么，以及它为什么能起作用（二）

神经网络如何"识别"一个残缺、模糊或带噪点的图像？关键就是吸引子（Attractor）我的理解是，不管起点在哪里，最后都会稳定跑到同一个状态，这个“最终状态”就是吸引子。举个不恰当的例子解释就是，一个在碗里的小球，不管你把球放在碗的那个位置，不考虑他弹出的情况，他最终都会停在碗底。【模糊/残缺输入】输入：噪声、残缺、歪斜的"2"↓【神经网络（动态系统）】输入层 → 隐藏层1 → 隐藏层2 → 隐藏层3 → 隐藏层4（逐层提取特征，状态不断收敛）↓【吸引子（稳定状态）】

2026-02-12 20:18:42 1257

原创 ChatGPT在做什么，以及它为什么能起作用（一）

摘要： ChatGPT的核心机制是逐词预测，通过统计海量文本数据生成概率分布，选择最可能的“下一个词”来构建连贯回答。它并不真正“理解”内容，而是基于上下文和随机性（通过温度参数调节）模拟人类语言。模型通过调整数十亿参数来优化预测，其“智能”表现源于大规模训练而非意识。文章揭示了AI语言模型的本质——一个高效的统计概率机器，其“创造力”仅是随机选择低概率词的结果。

2026-02-12 18:45:19 772

原创 Agent Skills详细图文解析：为什么这会改变AI开发

是 Anthropic 推出的一种新的能力抽象层，专门设计来解决大型上下文窗口（Large Context Window）的问题。在 Claude.ai 界面中找到 Skills 设置上传或创建 SKILL.md 文件系统自动识别并加载Agent Skills API 是面向智能体（Agent）技能生命周期管理的应用程序编程接口（API），标准化了技能的创建、加载、调用、更新、销毁等核心操作，是连接智能体核心逻辑与技能模块的核心中间层。简单来说，它就是专门用来。

2026-02-11 08:00:44 631

原创 AgentSkill让Claude变身全能工具人？

每个技能文件夹里，必须有一个叫「SKILL.md」的文件（大写！），它相当于“插件说明书”，告诉AI这个技能能干嘛、怎么干。网上有很多现成的优质“插件”，比如GitHub的，直接下载复制到文件夹里就行。文件内容示例 (C:\Users\用户名\.claude\skills\xlsx\SKILL.md---# 【1. 元数据区 / Metadata】# 作用：Claude 启动时只会读取这一小部分。description 必须准确概括功能，# 只有当用户的问题与这段描述匹配时，下方的指令区才会被加载。

2026-02-10 17:21:38 995

原创 Claude Code 安装指南

Claude Code 对于中国大陆用户，直接使用面临网络与账号双重门槛。但可以通过本地部署 + 国产大模型兼容层（GLM / DeepSeek）方案，实现无障碍安装使用。

2026-02-10 16:32:58 1371

原创 Coze案例-职业咨询顾问

问答节点1：问答节点是在“输出初步的职业诊断”之后的，选择选项问答，目的是根据用户的选择决定后面执行的内容。大模型节点1：命名为“初步职业诊断”，如果这里能够确定职业的大概方向，则可以直接往下进行，节约时间也节约token。问答节点2：连接问答节点1中的选项B和其他。温馨提示：这个工作流是很消耗token的，试运行了一次，依然没钱。大模型3：用户愿意投入的精力和挖掘优势得出最终的综合结果。：这个地方记得，要先连接节点，才能找到开始的变量值。问答4：连接前面的问答1中的A选项和输出2。在资源库中选择工作流。

2026-01-19 20:34:54 640

原创保姆级 Coze 教程（下）：手把手教你搭建复杂应用

2023年6月13日OpenAI公布了Function Call(函数调用)功能，该功能指的是在语言模型中集成外部功能或API的调用能力，这意味着模型可以在生成文本的过程中调用外部函数或服务，获取额外的数据或执行特定的任务。function calling可以解决大模型什么问题？信息实时性：无法获取最新信息数据局限性：训练数据虽多，但无法覆盖所有领域功能扩展性：功能虽强大，但不可能内置所有需要的功能当没有函数调用function calling是，gpt构建ai应用的模式非常简单。

2026-01-17 16:03:37 905

原创 Coze 保姆级教程（上）：从 0 到 1 上手，新手也能轻松搞定

本文是Coze平台AI Agent开发的快速入门指南，重点介绍了AI Agent与普通大模型的区别及开发流程。主要内容包括： AI Agent核心概念：AI Agent是具有工具调用、记忆存储和任务规划能力的智能助手，相比ChatGPT能主动执行复杂任务。 Coze开发平台：提供Bot创建、插件扩展、知识库管理等一站式AI开发环境。提示词设计方法：通过角色定位、技能描述、输出格式和约束条件四个要素构建有效的系统提示词，并演示了职场沟通助手的实际案例。开发全流程：从提示词工程到RAG应用、插件开发、工作流

2026-01-17 12:39:31 1533

lilililiring的博客