- 博客(15)
- 收藏
- 关注
原创 Transformer 架构详解——从注意力机制到 GPT
Transformer 是一种神经网络架构。我之前的文章里有提到,原始的模型有点像是记性非常不好的学生,无法记住短期信息;而Transformer就是帮助它们记忆的老师,让模型终于能够高效捕捉数据里的关联3.3 ChatGPT 在做什么(二)简单回顾:神经网络是一种非常有效的模型,用于分析复杂的数据类型,如图像、视频、音频和文本。但针对不同类型的数据,有不同类型的神经网络进行了优化。
2026-02-14 14:17:57
1090
原创 Obsidian+Claude Code打造本地AI知识库
这里其实就跟添加skills的思路是一样的,只是取决于你想要只装在obsidian里面还是全局skills。我今天试了一下新发布的glm5,竟然把我代码里藏了好多天的bug改掉了,感觉还是挺厉害的。
2026-02-13 22:59:12
1359
原创 ChatGPT 在做什么,以及它为什么能起作用(三)
本文探讨了ChatGPT如何通过词嵌入技术将语言转化为数学空间中的向量,揭示了人类语言可能遵循的底层规律。主要内容包括:1) 词嵌入将词语映射为高维向量,语义相近的词在空间中距离更近;2) ChatGPT的成功暗示语言可能存在类似物理定律的"语义运动规律";3) 自然语言的模糊性与计算语言的精确性形成对比,未来需要结合两者发展更强大的智能系统。文章指出,ChatGPT展现的语言规律表明人类思维可能比想象中更简单可量化。
2026-02-13 22:21:40
896
原创 ChatGPT在做什么,以及它为什么能起作用(二)
神经网络如何"识别"一个残缺、模糊或带噪点的图像?关键就是吸引子(Attractor)我的理解是,不管起点在哪里,最后都会稳定跑到同一个状态,这个“最终状态”就是吸引子。举个不恰当的例子解释就是,一个在碗里的小球,不管你把球放在碗的那个位置,不考虑他弹出的情况,他最终都会停在碗底。【模糊/残缺输入】输入:噪声、残缺、歪斜的"2"↓【神经网络(动态系统)】输入层 → 隐藏层1 → 隐藏层2 → 隐藏层3 → 隐藏层4(逐层提取特征,状态不断收敛)↓【吸引子(稳定状态)】
2026-02-12 20:18:42
1257
原创 ChatGPT在做什么,以及它为什么能起作用(一)
摘要: ChatGPT的核心机制是逐词预测,通过统计海量文本数据生成概率分布,选择最可能的“下一个词”来构建连贯回答。它并不真正“理解”内容,而是基于上下文和随机性(通过温度参数调节)模拟人类语言。模型通过调整数十亿参数来优化预测,其“智能”表现源于大规模训练而非意识。文章揭示了AI语言模型的本质——一个高效的统计概率机器,其“创造力”仅是随机选择低概率词的结果。
2026-02-12 18:45:19
772
原创 Agent Skills详细图文解析:为什么这会改变AI开发
是 Anthropic 推出的一种新的能力抽象层,专门设计来解决大型上下文窗口(Large Context Window)的问题。在 Claude.ai 界面中找到 Skills 设置上传或创建 SKILL.md 文件系统自动识别并加载Agent Skills API 是面向智能体(Agent)技能生命周期管理的应用程序编程接口(API),标准化了技能的创建、加载、调用、更新、销毁等核心操作,是连接智能体核心逻辑与技能模块的核心中间层。简单来说,它就是专门用来。
2026-02-11 08:00:44
631
原创 AgentSkill让Claude变身全能工具人?
每个技能文件夹里,必须有一个叫「SKILL.md」的文件(大写!),它相当于“插件说明书”,告诉AI这个技能能干嘛、怎么干。网上有很多现成的优质“插件”,比如GitHub的,直接下载复制到文件夹里就行。文件内容示例 (C:\Users\用户名\.claude\skills\xlsx\SKILL.md---# 【1. 元数据区 / Metadata】# 作用:Claude 启动时只会读取这一小部分。description 必须准确概括功能,# 只有当用户的问题与这段描述匹配时,下方的指令区才会被加载。
2026-02-10 17:21:38
995
原创 Claude Code 安装指南
Claude Code 对于中国大陆用户,直接使用面临网络与账号双重门槛。但可以通过本地部署 + 国产大模型兼容层(GLM / DeepSeek)方案,实现无障碍安装使用。
2026-02-10 16:32:58
1371
原创 Coze案例-职业咨询顾问
问答节点1:问答节点是在“输出初步的职业诊断”之后的,选择选项问答,目的是根据用户的选择决定后面执行的内容。大模型节点1:命名为“初步职业诊断”,如果这里能够确定职业的大概方向,则可以直接往下进行,节约时间也节约token。问答节点2:连接问答节点1中的选项B和其他。温馨提示:这个工作流是很消耗token的,试运行了一次,依然没钱。大模型3:用户愿意投入的精力和挖掘优势得出最终的综合结果。:这个地方记得,要先连接节点,才能找到开始的变量值。问答4:连接前面的问答1中的A选项和输出2。在资源库中选择工作流。
2026-01-19 20:34:54
640
原创 保姆级 Coze 教程(下):手把手教你搭建复杂应用
2023年6月13日OpenAI公布了Function Call(函数调用)功能,该功能指的是在语言模型中集成外部功能或API的调用能力,这意味着模型可以在生成文本的过程中调用外部函数或服务,获取额外的数据或执行特定的任务。function calling可以解决大模型什么问题?信息实时性:无法获取最新信息数据局限性:训练数据虽多,但无法覆盖所有领域功能扩展性:功能虽强大,但不可能内置所有需要的功能当没有函数调用function calling是,gpt构建ai应用的模式非常简单。
2026-01-17 16:03:37
905
原创 Coze 保姆级教程(上):从 0 到 1 上手,新手也能轻松搞定
本文是Coze平台AI Agent开发的快速入门指南,重点介绍了AI Agent与普通大模型的区别及开发流程。主要内容包括: AI Agent核心概念:AI Agent是具有工具调用、记忆存储和任务规划能力的智能助手,相比ChatGPT能主动执行复杂任务。 Coze开发平台:提供Bot创建、插件扩展、知识库管理等一站式AI开发环境。 提示词设计方法:通过角色定位、技能描述、输出格式和约束条件四个要素构建有效的系统提示词,并演示了职场沟通助手的实际案例。 开发全流程:从提示词工程到RAG应用、插件开发、工作流
2026-01-17 12:39:31
1533
原创 内网离线环境部署Nginx踩坑指南:依赖安装与问题解决
安装nginx需要nginx的包和相关的依赖,若要在内网中安装nginx,就得提前准备好这些东西,本人觉得百度网盘下载东西也没那么方便,于是给网址自己下载就好了。
2025-09-12 16:48:34
675
原创 Dify 升级双方案:如何同时兼容 x86_64 与 ARM64 平台
为了不破坏原有的文件,可以选择在原本的dify文件的同级目录下创建一个dify1.8.1的文件。如果原来的.env有配置,就把原来的跟这个.env.example替换,这是保证你的配置不变的关键,如果docker-compose.yml也有的话对照修改一下就好,因为里面可能有一些新的镜像。如果是amd64的话直接输入打包命令,不过要记得在创建好的镜像打包文件里面,这样才会下载在对应位置,后续也好整理。)下载与你准备的 Docker 镜像版本相匹配的源代码压缩包,目前最新已经更新到1.8.1。
2025-09-08 15:21:00
992
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅