le——778-CSDN博客

原创免费token40次每分钟，使用 NVIDIA NIM 开源模型代理 Claude Code：本地部署实战记录

最近 Claude Code 火出圈了，但官方 API 的价格让不少人望而却步。好在社区已经有了开源代理方案 ——，通过本地代理把 Claude Code 的请求路由到免费的第三方模型，不用改客户端，设置两个环境变量就能用。申请NVIDIA NIM 免费 API Key（永久有效，40 次/分钟）本地部署代理服务配置和VSCode 插件接入全文操作基于Windows 11，Linux/macOS 用户流程基本一致。所有坑已经帮你踩过，按步骤走一遍就能跑通。

2026-04-24 17:08:34 631

原创一文讲清大模型微调的六个核心概念:SFT、LoRA、CPT、RLHF、DPO、RAG刚接触大模型定制化技术时,很多人都会被这几个缩写绕晕:SFT 和 LoRA 是什么关系?CPT 和 RAG 都是“

改不改模型,改什么,怎么改。不改模型 → Prompt、RAG改模型 → 预训练、CPT、SFT、RLHF/DPO怎么改(省钱版) → LoRA、QLoRA把这张地图刻在脑子里,后面不管学哪一个具体技术,都能在整体框架里找到它的位置,不会再迷失。本文整理自近期学习笔记,如有理解偏差欢迎指正交流。

2026-04-24 14:32:36 398

原创 Hermes Agent Windows Docker 部署完全指南 —— 从零开始搭建你的自我进化 AI 智能体

Hermes Agent 是一个非常有意思的项目——它不只是一个聊天机器人，而是一个能不断自我进化、记住你的偏好、自动积累技能的 AI 助手。拉镜像 → 配模型 → 启动。如果你在部署过程中遇到问题，可以在评论区留言，我会尽量回复。

2026-04-16 10:02:57 1799

原创开源方案：FunASR + 本地大模型，打造线上会议实时翻译系统（语音识别→翻译→语音播报）

做跨国业务的朋友应该都有过这样的痛点：线上会议时，对方说英文你反应不过来，你说中文对方也听不懂，来回切翻译软件效率极低。市面上的同声传译工具要么收费昂贵，要么需要上传音频到云端，数据安全没保障。本文介绍一套完全开源、本地部署你说中文 → 语音识别(FunASR) → 大模型翻译(Qwen3) → 语音合成(TTS) → 虚拟声卡 → 对方听到英文全部在本地运行，不依赖任何付费API，数据不出内网。本方案的核心思路是用开源工具链拼出一套完整的同声传译系统FunASR。

2026-04-15 15:40:27 666

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 免费token40次每分钟，使用 NVIDIA NIM 开源模型代理 Claude Code：本地部署实战记录

原创 一文讲清大模型微调的六个核心概念:SFT、LoRA、CPT、RLHF、DPO、RAG刚接触大模型定制化技术时,很多人都会被这几个缩写绕晕:SFT 和 LoRA 是什么关系?CPT 和 RAG 都是“

原创 Hermes Agent Windows Docker 部署完全指南 —— 从零开始搭建你的自我进化 AI 智能体

原创 开源方案：FunASR + 本地大模型，打造线上会议实时翻译系统（语音识别→翻译→语音播报）

空空如也

空空如也

原创免费token40次每分钟，使用 NVIDIA NIM 开源模型代理 Claude Code：本地部署实战记录

原创一文讲清大模型微调的六个核心概念:SFT、LoRA、CPT、RLHF、DPO、RAG刚接触大模型定制化技术时,很多人都会被这几个缩写绕晕:SFT 和 LoRA 是什么关系?CPT 和 RAG 都是“

原创开源方案：FunASR + 本地大模型，打造线上会议实时翻译系统（语音识别→翻译→语音播报）