- 博客(4)
- 收藏
- 关注
原创 免费token40次每分钟,使用 NVIDIA NIM 开源模型代理 Claude Code:本地部署实战记录
最近 Claude Code 火出圈了,但官方 API 的价格让不少人望而却步。好在社区已经有了开源代理方案 ——,通过本地代理把 Claude Code 的请求路由到免费的第三方模型,不用改客户端,设置两个环境变量就能用。申请NVIDIA NIM 免费 API Key(永久有效,40 次/分钟)本地部署代理服务配置和VSCode 插件接入全文操作基于Windows 11,Linux/macOS 用户流程基本一致。所有坑已经帮你踩过,按步骤走一遍就能跑通。
2026-04-24 17:08:34
631
原创 一文讲清大模型微调的六个核心概念:SFT、LoRA、CPT、RLHF、DPO、RAG刚接触大模型定制化技术时,很多人都会被这几个缩写绕晕:SFT 和 LoRA 是什么关系?CPT 和 RAG 都是“
改不改模型,改什么,怎么改。不改模型 → Prompt、RAG改模型 → 预训练、CPT、SFT、RLHF/DPO怎么改(省钱版) → LoRA、QLoRA把这张地图刻在脑子里,后面不管学哪一个具体技术,都能在整体框架里找到它的位置,不会再迷失。本文整理自近期学习笔记,如有理解偏差欢迎指正交流。
2026-04-24 14:32:36
398
原创 Hermes Agent Windows Docker 部署完全指南 —— 从零开始搭建你的自我进化 AI 智能体
Hermes Agent 是一个非常有意思的项目——它不只是一个聊天机器人,而是一个能不断自我进化、记住你的偏好、自动积累技能的 AI 助手。拉镜像 → 配模型 → 启动。如果你在部署过程中遇到问题,可以在评论区留言,我会尽量回复。
2026-04-16 10:02:57
1799
原创 开源方案:FunASR + 本地大模型,打造线上会议实时翻译系统(语音识别→翻译→语音播报)
做跨国业务的朋友应该都有过这样的痛点:线上会议时,对方说英文你反应不过来,你说中文对方也听不懂,来回切翻译软件效率极低。市面上的同声传译工具要么收费昂贵,要么需要上传音频到云端,数据安全没保障。本文介绍一套完全开源、本地部署你说中文 → 语音识别(FunASR) → 大模型翻译(Qwen3) → 语音合成(TTS) → 虚拟声卡 → 对方听到英文全部在本地运行,不依赖任何付费API,数据不出内网。本方案的核心思路是用开源工具链拼出一套完整的同声传译系统FunASR。
2026-04-15 15:40:27
666
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅