- 博客(795)
- 资源 (7)
- 收藏
- 关注
原创 LLM大模型缓存详解
本文介绍了大语言模型(LLM)中的缓存技术及其优化作用。KV缓存通过存储注意力计算中的键值对,避免重复计算,显著提升推理效率。文章详细阐述了KV缓存、提示缓存和语义缓存三种类型,以及它们在数据结构、容量管理等方面的技术实现。缓存技术能降低推理延迟、减少计算成本并支持更长上下文处理,但也面临显存瓶颈、一致性和安全等挑战。随着算法优化和硬件发展,缓存技术将继续在大模型应用中发挥关键作用,为AI开发者提供重要性能优化路径。
2026-04-13 20:18:27
415
原创 大模型(LLM)接口调用入门指南
文章摘要 本文详细介绍了调用大模型API的核心注意事项和实用技巧,分为六个部分: 调用前的准备:明确需求选择合适模型,注意API密钥安全,理解Token计费规则。 必选参数:包括模型名称和消息体格式,强调多轮对话需完整携带历史记录。 可调参数:如控制随机性的temperature、限制输出长度的max_tokens等,影响效果与成本。 避坑指南:提示词质量至关重要,需管理上下文、处理异常、控制成本、验证输出准确性。 安全合规:严禁生成违法侵权内容,保护隐私数据,遵守版权规定。 示例代码:提供Python调用
2026-04-11 23:14:22
373
原创 Claude Code 架构深度解析
文章摘要 本课程深入解析Anthropic官方Claude Code的架构设计,基于1884个TypeScript源码文件进行系统级审计,重点拆解其AI Agent运行时框架的核心机制。课程涵盖ReAct推理循环引擎、多Agent编排、记忆系统等关键模块,特别关注生产级实现细节如7层异常恢复机制、流式交互优化等。技术栈采用TypeScript+React Ink,包含4700行核心代码的复杂工程实现,为AI编程产品开发提供了权威参考。课程还梳理了8大核心知识点及其面试考察频率,是理解现代AI Agent系统
2026-04-03 01:23:47
608
原创 Claude Code架构与设计原理深度解析(AI编程Agent核心课)
本文深度解析Claude Code作为顶尖AI编程智能体的设计原理,提出极简架构+模型中心化的核心思想。重点包括:单主循环控制架构降低复杂度;大小模型混合调度实现70%成本优化;claude.md全局上下文解决长会话问题;LLM原生检索替代传统RAG;三级工具分层提升效率。文章还提供了可复用的智能体搭建流程,包含架构设计、提示词工程、任务管理等关键技术,兼具工程实践与面试指导价值,适合AI开发者和架构师参考。
2026-04-01 23:49:42
582
原创 Claude Code 逆向工程与AI Agent底层原理深度解析
本文详细讲解了Claude Code逆向工程实操方法,包括本地CLI核心代码篡改、监听脚本植入、交互数据拦截等技术,深入剖析其多模型调度、提示词设计、上下文管理等核心架构。通过实操演示和原理分析,揭示了AI"变笨"的成因,为开发者提供自研AI Agent、优化大模型应用的实用方案。文章涵盖文件定位、日志劫持、模型协作机制等关键技术点,并给出企业级AI编程Agent的架构设计思路和日志监控方案,兼具工程实践与理论深度,适合AI开发者学习和参考。
2026-04-01 00:23:56
411
原创 用 Claude Code + Superpowers 打造你的 AI 编程工作台
本文介绍了在Windows系统上搭建AI编程环境的完整流程,包括安装Node.js、Claude Code工具和接入GLM-5中文模型。重点推荐了Superpowers插件,它能将AI转化为具备工程化思维的开发助手,通过强制实施头脑风暴、测试驱动开发、Git隔离等工作流程,解决AI编程常见的乱改代码、缺乏规划等问题。文章详细说明了安装步骤,并通过搜索功能开发实例展示了Superpowers如何规范AI的开发行为,帮助开发者构建更健壮的项目。
2026-03-31 11:16:27
777
原创 Claude Code 企业级落地最佳实践(工程师/架构师/面试备考版)
本文系统阐述了Claude Code工程化落地的核心方法论,聚焦解决AI编程中上下文溢出导致的需求遗忘、逻辑错误等痛点问题。文章提出以"可验证闭环"为核心原则,详细介绍了四阶段标准开发工作流(探索-规划-实现-提交)、三段式提示词编写规范、CLAUDE.md项目规约配置等关键实践。特别强调通过Hooks、Subagents、Skills等高级功能实现流程强制管控、任务解耦和业务知识沉淀。在安全方面,建议采用白名单、沙箱隔离等机制,并优先使用轻量化CLI工具。文章还提供了上下文治理策略和7
2026-03-31 00:02:21
411
原创 用Claude Code搞定产品上线
摘要:本文介绍了一套专为设计师打造的Claude Code工作流,帮助零基础设计师快速将创意转化为可预览、可上线的Demo。该方法通过AI辅助完成代码编写,设计师只需专注设计目标与修改意见。工作流包含项目规划、实时预览迭代、版本管理和一键部署等完整环节,支持从简单页面到带登录系统的高级功能扩展。这套方案打破了设计师依赖开发的传统模式,让设计师能够独立验证创意,提升作品集制作、创业想法测试和客户对接的效率。(149字)
2026-03-30 23:46:11
348
原创 Apache ZooKeeper 核心技术全解(面试+实战版)
本文系统介绍了Apache ZooKeeper分布式协调服务的核心原理与应用。主要内容包括:ZooKeeper的定位与设计目标,采用树形ZNode数据模型,支持持久/临时节点;Watch监听机制实现变更通知;五大一致性保障确保数据可靠;集群采用主从架构实现读写分离。文章还提供了生产实践建议和面试题解析,强调ZooKeeper在分布式系统中的协调作用,适合开发者学习分布式系统底层原理和实际应用。
2026-03-30 23:08:56
450
原创 代码就是一切|Anthropic Agent Skills 架构与落地精讲
Anthropic 2026年战略转型提出"Code First+Agent Skills"新范式,将业务经验沉淀为可版本化管理的文件资产,通过代码脚本执行确定性任务,大模型仅处理推理决策等不确定环节。核心架构采用渐进式披露分层加载机制解决上下文膨胀问题,明确划分Skills(业务方法论)、MCP(系统连接)、Subagents(任务分工)三大组件边界。落地需遵循高频场景优先、脚本固化、量化验收原则,通过一致性、返工率等指标持续优化。该范式将AI开发导向工程化、标准化,实现Agent能力
2026-03-30 22:53:36
384
原创 Claude Code 保姆级教学:Vibe Coding 从入门到实战
《AI辅助编程实战教程摘要》 本课程面向开发者系统讲解Claude Code工具,涵盖环境配置到工程化落地的全流程。核心内容包含:CLAUDE.md工程化管理、Skills扩展系统、Hooks自动化触发、Subagents多智能体协作等关键技术,重点培养Vibe Coding自然语言开发能力。课程突出实战性,结合MCP通信协议实现外部系统集成,通过对话压缩与用量优化控制成本。配套企业级开发规范与敏捷实践,可提升60%以上交付效率,适合快速原型开发与AI辅助编程面试准备。
2026-03-29 21:45:23
431
原创 Agent Skills与MCP Tools核心原理与实战总结
本文介绍了AI Agent开发中Agent Skills与MCP Tools的协作机制。Agent Skills作为标准化工作流模板,定义任务流程但不实现具体能力;MCP Tools则封装外部能力,提供统一调用接口。二者通过分层架构实现互补:Skill负责"做什么",MCP提供"怎么做"。文章详细阐述了二者的定位、协作流程、开发模式及最佳实践,强调分离流程与能力、遵循声明式开发、支持工具热插拔等核心思想。通过这种架构,开发者可以降低多工具集成成本,构建灵活可扩展的AI
2026-03-29 21:12:21
423
原创 GPT能否替代人类在复杂任务下的直觉?
本文探讨了人类直觉与AI模拟直觉的本质差异。人类直觉是整合经验、情感、身体感知和语境理解的综合认知能力,而AI的"直觉"仅是统计模式识别和概率推断。AI擅长数据分析、知识整合等结构化任务,但在不确定情境、价值判断和创新领域仍需依赖人类直觉。最佳协作模式是让AI处理信息加工,人类专注价值判断和创新任务。研究表明,AI无法替代人类直觉,但可作为有力补充,二者各具不可替代的优势,关键在于认清边界、实现互补。
2026-03-24 10:35:04
224
原创 时间轮(Time Wheel)数据结构入门指南
时间轮是一种高效管理定时任务的数据结构,采用类似时钟表盘的环形设计,通过槽位存储任务和指针标记当前时间。其核心优势在于O(1)时间复杂度操作和批量处理能力,适用于游戏冷却、网络超时等场景。单层时间轮通过周期性指针移动执行任务,多层时间轮(秒/分/时轮)则通过任务降级机制支持长时间延迟。该结构被广泛应用于Netty、游戏服务器等系统,能显著提升大量定时任务的管理效率,具有资源占用少、处理批量化的特点。
2026-03-23 14:03:27
293
原创 Python 代码来绘制云系统架构图 - Diagrams
摘要: Diagrams 是一个基于代码绘制架构图的工具,采用 Diagram as Code 理念,支持快速原型设计、版本控制,并内置主流云服务图标。安装需 Python 3.7+ 和 Graphviz,通过简单代码即可生成架构图(如 AWS 负载均衡→EC2→RDS)。核心功能包括节点连接、集群分组、连线样式定制和布局方向调整,支持中文显示和嵌套集群。适用于云架构设计,已被 Apache Airflow 等项目采用。详情可参考官方文档。 (字数:150)
2026-03-18 18:20:05
453
原创 Vibe Coding时代,后端程序员开发`前端`的最佳实践
摘要:针对后端程序员快速开发前端的需求,推荐Next.js + Tailwind CSS + shadcn/ui组合(T3 Stack模板),提供全栈一体化开发体验,消除接口对接痛点。方案优势包括:AI编码适配度高、零前端配置、强类型安全、极简部署。备选方案包括Nuxt.js(Vue生态)、SvelteKit(语法极简)及UmiJS(国内后台管理)。核心技巧包括:优先TypeScript、用AI生成Tailwind样式、精准需求描述、使用标准模板。配套AI工具推荐Cursor、v0.dev等,配合MCP协议
2026-03-08 21:59:16
4714
原创 Claude Code 官方 13 个核心插件
本文介绍了Claude Code的13款核心插件及其功能。主要包括Git工作流自动化(commit-commands)、功能开发工作流(feature-dev)、并行代码审查(code-review)等开发工具,以及安全指导(security-guidance)、UI设计辅助(frontend-design)等专业插件。文章还提供了插件安装命令和使用建议,推荐新手从基础插件开始,开发者可根据项目需求组合不同插件。所有插件需要Claude Code 1.0.33+版本支持,部分插件可自动激活相关功能。
2026-03-06 00:00:02
4765
原创 Claude-code插件 Hookify
Hookify是Claude Code官方提供的插件,用于简化自定义Hooks的创建和管理。它通过自然语言或Markdown格式定义自动化规则,无需手动编写复杂JSON配置。主要功能包括阻止危险命令、警告调试代码、防止密钥泄露等。安装后可通过简单命令创建规则,规则文件采用YAML+Markdown格式存储。支持多种事件类型触发,如bash命令、文件编辑等。相比原生Hooks,Hookify更易用且维护简单,适合团队快速建立安全规则和工作流自动化。
2026-03-05 23:58:13
4541
原创 Ubuntu24安装ClaudeCode
Claude Code地区不可用解决方案 错误提示"App unavailable in region"表明Claude Code在当前地区受限。推荐以下解决方法: npm安装(最佳方案) npm install -g @anthropic-ai/claude-code 要求Node.js≥18.0 Homebrew安装(macOS/Linux) brew install --cask claude-code 检查地区支持 访问Anthropic支持地区列表确认服务可用性 Windows
2026-03-05 12:40:18
4927
原创 Claude Code In Action 全面精要总结
《Claude Code 专项课程摘要》 本课程系统讲解AI编码助手Claude Code的核心原理与工程实践。核心架构包含语言模型与工具调用层,通过5步工作流程完成任务处理。课程重点剖析了Claude的三大优势:复杂任务处理能力、高扩展性和安全代码检索机制。 实操部分详细介绍了上下文管理、多级配置文件、Plan/Thinking模式等实用技巧,以及会话控制、自定义命令、GitHub集成等高级功能。Hooks与SDK章节深入讲解生命周期扩展机制,包含敏感文件控制、自动类型检查等实战案例,并提供了TypeSc
2026-03-04 13:10:37
9031
原创 MCP 工具链:软件开发全流程的 AI 增强实践
MCP协议重塑AI与开发者协作,提供标准化工具链覆盖软件全生命周期。核心包括数据验证、交互调试等基础工具,以及需求管理、开发测试、部署运维等全流程矩阵。典型工作流支持API驱动开发和全栈敏捷交付,建议采用渐进式接入和Schema优先策略。通过标准化接口,MCP将AI升级为执行代理,其4000+组件生态有望成为软件工程新基建。
2026-03-03 01:12:50
8932
原创 个税APP实用指南:从退税到查收入,一文看懂
个税APP是集退税补税、专项抵扣、收入查询于一体的一站式办税平台。无论是普通上班族还是在校学生,都能通过它完成年度汇算清缴、享受税收优惠,并核对个人收入信息,保障信息安全。
2026-03-02 13:52:21
8997
原创 CPU指令架构
本文分析了CPU指令架构与操作系统的适配关系,重点对比X86、ARM和RISC-V三大主流架构。X86作为CISC代表性能强但功耗高,ARM采用RISC架构以低功耗见长,RISC-V则具有开源优势但生态薄弱。不同架构适配不同操作系统:X86适合Windows/服务器Linux,ARM匹配移动端系统,RISC-V主要用于嵌入式场景。选型需权衡性能、功耗、生态和自主可控需求,高性能选X86,低功耗选ARM,自主可控则考虑RISC-V。指令集特性是决定系统适配策略的关键因素。
2026-02-28 16:39:04
8937
原创 2026年2月-哪款大模型编程最强?GPT-5.3、Claude Opus 4.6、GLM-5、Kimi K2.5、MiniMax M2.5、Gemini 3 Pro 和 DeepSeek v3.2
顶级梯队(Frontier Models)这三款模型代表了当前大语言模型技术的最高水平,在推理能力、多模态处理、长上下文管理等关键维度全面领先其中 Claude Opus 4.6 在长上下文推理和终端操作方面表现最佳,GPT-5.3 在编程能力和智能体任务上优势明显,Gemini 3 Pro 则在多模态融合能力上独占鳌头高性能梯队(High-Performance Models)这些模型在特定领域展现出与顶级梯队相当甚至更优的性能,同时在成本效益方面具有明显优势。
2026-02-13 11:03:04
13764
原创 Agent Teams与大模型协作实战
GLM5测试分析与Agent Teams架构设计摘要 本章探讨GLM5等国产大模型在Agent Teams智能体集群中的工程化应用,提出三大核心方案: 标准化编排设计:通过skill.md/role.md/protocol.md配置文件解决国产模型协作混乱问题,实现熵减式任务管理; 任务适配原则:明确Agent Teams适用于发散型任务(创意生成/多方案探索),收敛型任务(Bug排查/决策)易产生信息噪声; 异构模型融合:采用GLM5(文本/代码)+Kimi(多模态)等组合实现能力互补,并通过跨模型技能迁
2026-02-13 10:39:16
11905
原创 Kotlin 5分钟入门
Kotlin 是由JetBrains开发的现代编程语言,2017 年被 Google 宣布为Android 官方开发语言。
2026-02-06 15:15:17
10147
原创 Kotlin快速入门
本文是Kotlin基础语法的快速入门指南,主要面向有一定编程基础的开发者。课程重点讲解了Kotlin的核心语法特性,包括:程序主函数的简化写法(fun main())、变量声明规则(var/val的区别)、字符串模板的使用($变量和${表达式})、函数定义与调用(包括默认参数和命名参数)、以及编码规范和注释语法。文章强调Kotlin相比Java的语法优势,如类型推断、字符串模板等特性,并提供了大量代码示例。最后总结了Kotlin基础语法的核心要点,帮助开发者快速掌握Kotlin编程思维,为后续Android
2026-02-05 20:02:26
10928
5
原创 Git Hooks
Git 钩子是在 Git 仓库中特定事件发生时自动运行的脚本,分为和。它们位于.git/hooks目录下,默认以.sample结尾的示例文件需要重命名(去掉.sample)才能生效。
2026-02-03 11:47:21
14020
原创 西蒙学习法
本章节围绕西蒙学习法展开系统讲解,立足1万小时定律的时代误区,结合认知心理学、脑科学研究成果,拆解诺奖得主西蒙的高效学习核心理论,戳破“假装学习”的认知错觉,揭示大脑组块化存储知识的底层逻辑,并给出可直接落地的西蒙学习法四步实操流程,核心主旨是让学习者掌握将信息转化为能力的科学方法,以417小时有效学习为基础,通过6个月系统化练习实现从零基础到领域专家的跨越,摆脱低效努力,实现学习能力的质的提升。核心知识点重要性西蒙学习法的核心时间依据与1万小时定律反驳高知识组块的核心原理与高手的本质差距高。
2026-01-30 01:27:22
13950
原创 AI编程 - 最佳实践
组件作用示例系统级指令与规则代码风格要求、项目结构约定Tools可调用工具集文件编辑、代码搜索、终端执行、浏览器控制用户指令与反馈功能需求、修改建议、问题澄清关键洞察:Cursor 会为不同模型(GPT-4、Claude、Gemini 等)单独优化Instructions 和 Tools。在 Shell 环境训练的模型更偏好使用grep而非专用搜索工具某些模型需要明确指令才会在编辑后调用 LinterCursor 自动处理这些差异,你只需专注于构建软件传统开发Agent 协作开发。
2026-01-29 11:35:46
10432
原创 MacBook M3 Pro:React Native 安卓开发
安卓模拟器在 M3 芯片上几乎是“零延迟”运行。相比 Intel Mac,Gradle 构建速度提升约 50% 以上。同一台机器可同时开发 iOS 和 Android,且无需频繁重启。
2026-01-28 14:57:01
14061
原创 新闻 - 2026中国超单身时代发展
中国超单身时代是人口结构、经济成本、社会观念多重因素叠加的结果,既反映了女性独立意识提升、婚姻从“刚需”向“选择”的进步,也暴露出成本过高、资源错配等问题。通过政策引导降低婚育压力、社会观念转型、技术手段优化匹配效率,可逐步缓解单身群体的现实困境,推动形成更包容、多元的婚姻与生活形态。
2026-01-26 13:27:14
10278
原创 opencode.ai
使用支持 truecolor(24-bit 颜色)的现代终端模拟器推荐使用 WezTerm、Alacritty、Ghostty、Kitty 等终端验证终端颜色支持:运行,应输出truecolor或24bit需要获取所选 AI 服务提供商的 API 密钥支持的提供商包括 Anthropic、OpenAI、Google、Amazon Bedrock 等推荐初学者使用 OpenCode Zen 服务(官方服务)"agent": {"tools": {:代理描述,用于帮助选择model:使用的模型。
2026-01-23 12:50:25
13036
原创 【2025年度】编程大模型对比与总结
通过对 2025-2026 年编程大模型的全面对比分析,我们可以得出以下核心结论:在技术能力方面,Claude Opus 4.5 以 80.9% 的 SWE-bench 得分和卓越的代码质量位居榜首,GPT-5.2-Codex 以 80.0% 紧随其后,两者代表了当前编程大模型的最高水平。在特定能力上,GPT-5.2 在推理能力上表现最佳,Gemini 3 Pro 在前端开发领域具有独特优势,而 Qwen3-Coder 在多语言支持方面遥遥领先。在实际使用中,尽管 AI 工具的使用率达到 84%,但。
2026-01-22 22:32:03
11933
原创 2026 年 1 月 15 日 - 21 日国内外 AI 科技大事及热点深度整理报告
本报告梳理了 2026 年 1 月 15 日至 21 日全球人工智能领域的关键动态,核心特征可概括为 **“大模型向实、算力重构、监管分化、具身智能落地加速”**。在这一周内,AI 从实验室技术加速渗透至实体经济核心场景:字节跳动 “扣子 2.0”、阿里通义千问的 Agent 化升级,标志着大模型从 “对话工具” 向 “行动代理” 的跨越;OpenAI 与 Cerebras 的百亿美元算力合作、中国 “上海四小龙” 算力集群的突破,重塑了全球算力供应链格局;
2026-01-22 22:14:39
14344
原创 人工智能领域前沿研究课题与长期发展难题分析报告
摘要:本报告系统梳理了人工智能(AI)领域2025-2026年的前沿研究进展与核心挑战。研究显示,AI正从规模扩张转向深度提质,聚焦五大方向:具身智能(如DeepMind的SIMA 2实现跨环境技能迁移)、基础模型推理机制(涌现能力控制与Tree-of-Thoughts范式)、AI for Science(AlphaFold 2解决蛋白质预测难题)、分布式AGI安全(DeepMind提出防御纵深框架)及可持续性(绿色强化学习降低45%能耗)。尽管在蛋白质预测等任务取得突破,符号接地、强泛化等智能本质问题仍未
2026-01-22 22:12:53
13232
原创 Django原子请求
Django的原子请求(ATOMIC_REQUESTS)机制将每个HTTP请求作为数据库事务处理,确保操作要么全部成功要么全部回滚。通过在settings.py中配置DATABASES选项启用,它简化了开发并保证数据一致性,但可能影响性能且不适合长时间请求。最佳实践是根据业务需求选择性使用,推荐在简单CRUD操作中启用,而对复杂流程或文件处理则应采用更细粒度的事务控制。开发者可通过@transaction.atomic装饰器灵活管理事务边界,平衡数据安全性与系统性能。
2026-01-14 11:40:28
12591
原创 LangChain中的结构化输出
LangChain结构化输出功能解析 LangChain支持智能体按预设格式(JSON、Pydantic模型等)生成结构化输出,简化自然语言解析。通过create_agent函数配置response_format参数,支持两种策略: ProviderStrategy:利用模型提供商(如OpenAI)的原生结构化输出能力,需定义schema(Pydantic模型/数据类等)和可选的strict严格校验。 ToolStrategy:通过工具调用兼容多数模型,支持自定义错误处理(handle_errors)和工具
2026-01-13 10:59:09
10907
原创 LangChain 前端流式输出(Frontend Streaming)
摘要: LangChain 和 LangGraph 通过 React Hook useStream 提供前端流式支持,简化流式消息处理、状态管理和对话分支逻辑。useStream 支持消息流式传输、自动状态管理、对话分支和自定义 UI,适用于本地或生产环境(如 LangSmith 托管)。安装需引入 LangGraph SDK,基本用法包括连接代理、提交消息和渲染状态。核心参数涵盖代理 ID、API 配置、线程管理和回调函数,返回值提供消息、状态、工具调用等交互功能。通过 threadId 可实现对话持久化
2026-01-13 10:55:05
11101
开源的编程字体Menlo,Monaco,Mononoki,Ubuntu, source-code-pro
2024-02-05
C++学习资料, linux基本命令,
2023-12-06
画图/C环境/php/ssh远程连接
2023-11-16
gpt-music, afawefawegawgwa
2025-12-01
PDF Claude Code 完整使用教程:从入门到高级功能的全面指南.pdf
2025-11-30
智囊-真正的智慧并非有一套固定不变的原则可依循,而是对应着不同的现实难局,有恰如其分的不同时策 所以愚昧的人,偶而也会出现深具智慧的反应;倒是聪明的人往往因为太紧守着某些原则,遂做出错误的判断来
2025-03-24
远程软件,手机termux,扩展屏等
2024-10-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅