- 博客(962)
- 收藏
- 关注

原创 DeepSeek R1 671B 完整版本地部署教程来了!!!
关于本地部署,大多数人使用的是蒸馏后的8B/32B/70B版本,本质是微调后的Llama或Qwen模型,并不能完全发挥出DeepSeek R1的实力。然而,完整的671B MoE模型也可以通过针对性的量化技术压缩体积,从而大幅降低本地部署门槛,乃至在消费级硬件(如单台Mac Studio)上运行。那么,如何用 ollama 在本地部署 DeepSeek R1 671B(完整未蒸馏版本)模型呢?一篇在海外热度很高的简明教程即将揭晓。作者主页:https://snowkylin.github.io。
2025-02-05 16:12:23
12225
1

原创 深入浅出 AI 智能体(AI Agent)|技术干货
随着人工智能技术的飞速发展,智能体(AI Agents)正逐渐成为人与大模型(如大语言模型)交互的主要方式。智能体是能够执行任务、解决问题并提供服务的 AI 系统,它们通过模拟人类的行为和决策过程,使得与大模型的交互更加自然、高效和个性化。智能体作为人与大模型交互的桥梁,不仅提高了交互的效率和质量,还扩展了大模型的应用范围。随着技术的不断进步,智能体将更加深入地融入我们的日常生活,成为不可或缺的智能伙伴。智能体(英文名:AI Agent 或 AI Bot)是指能够感知其环境并采取行动以实现某种目标的实体。
2025-01-04 17:14:34
25091
1

原创 五款国产AI大模型大测评!Kimi,智谱清言,通义千问,文心一言,豆包谁更胜一筹?
AI大模型是指具有巨大参数量的深度学习模型,通常包含数十亿甚至数万亿个参数。原理主要基于深度学习技术,特别是神经网络和大规模数据的训练,它们通过分析大量数据来学习语言模式、知识表示和任务执行策略。AI大模型的训练过程通常包括以下几个步骤:数据预处理:对原始数据进行清洗、整理和标注,包括去除噪声、填充缺失值、归一化等操作;模型构建:设计并搭建神经网络,这包括确定网络的层次结构、神经元数量、激活函数等;模型训练:将预处理后的数据输入到神经网络中,不断调整神经元的连接权重使模型达到满意的性能;
2024-10-28 11:26:42
50571

原创 Ollama:一个在本地部署、运行大型语言模型的工具
所谓自定义模型就是不适用Ollama官方模型库中的模型,理论可以使用其他各类经过转换处理的模型Ollama库中的模型可以通过提示进行自定义。# 设置温度参数# 设置SYSTEM 消息SYSTEM """作为AI智能助手,你将竭尽所能为员工提供严谨和有帮助的答复。"""Modelfile文档One-API是一个OpenAI接口管理 & 分发系统,支持各类大模型。这里使用Docker快速进行部署。拉取镜像创建挂载目录启动容器访问IP:3001初始账号用户名为 root,密码为 123456。
2024-05-28 10:30:57
8079

原创 【大模型实战案例】手把手教大家微调大模型 Llama 3
Llama 3 近期重磅发布,发布了 8B 和 70B 参数量的模型,我们对 Llama 3 进行了微调!!!今天手把手教大家使用 XTuner 微调 Llama 3 模型。
2024-04-23 18:09:27
4665
2

原创 OpenAI的官方Prompt工程指南详解 - 看这一篇真的就够了
这个技巧偏开发者。普通用户可以跳过。因为模型具有固定的上下文长度,因此用户和助手之间的对话无法无限期地继续。解决此问题有多种解决方法,第一个是总结对话中的历史记录。一旦输入的大小达到预定的阈值长度,这可能会触发总结部分对话的查询,并且先前对话的摘要可以作为系统消息的一部分包括在内。或者,可以在整个对话过程中在后台异步总结之前的对话。这两种方法都行,或者还可以把过去的所有聊天记录存成向量库,后续跟用户对话的时候动态查询嵌入,也可以。
2024-04-10 10:42:26
12931
原创 程序员必看!一文吃透 LoRA 家族:大语言模型高效训练的 “秘密武器”
程序员必看!一文吃透 LoRA 家族:大语言模型高效训练的 “秘密武器”
2025-09-21 10:00:00
375
原创 程序员必看!RAG 揭秘客服 “秒回” 魔法:为啥有的只会说 “抱歉”?
程序员必看!RAG 揭秘客服 “秒回” 魔法:为啥有的只会说 “抱歉”?
2025-09-19 11:45:00
754
原创 大模型(LLM)从 0 到精通:工程师实战路线 + 免费学习资料(路线图 / 书籍 / 课程)全汇总,程序员 & 小白速藏!
大模型(LLM)从 0 到精通:工程师实战路线 + 免费学习资料(路线图 / 书籍 / 课程)全汇总,程序员 & 小白速藏!
2025-09-19 11:45:00
1510
原创 小白必学!AI Agent 核心概念 + 入门知识,程序员也能从 0 到 1 快速上手
小白必学!AI Agent 核心概念 + 入门知识,程序员也能从 0 到 1 快速上手
2025-09-16 10:15:00
1189
原创 程序员必看!全量微调与 LoRA:从技术原理到场景适配,一文搞懂大模型调优
程序员必看!全量微调与 LoRA:从技术原理到场景适配,一文搞懂大模型调优
2025-09-13 15:09:06
1131
原创 AI 行业年龄焦虑加剧!35 岁工程师求职难、遇裁员,如何破局?(附 大模型零基础全套资料)
AI 行业年龄焦虑加剧!35 岁工程师求职难、遇裁员,如何破局?(附 大模型零基础全套资料)
2025-09-12 15:42:55
1048
原创 干货收藏:从技术原理到落地实践,全面拆解RAG检索增强生成,打造可靠的个性化AI知识库
干货收藏:从技术原理到落地实践,全面拆解RAG检索增强生成,打造可靠的个性化AI知识库
2025-09-12 15:37:04
714
原创 搞定 LLM 深度推理不难!3 种核心提示技术进阶指南(小白 & 程序员专属学习篇)
搞定 LLM 深度推理不难!3 种核心提示技术进阶指南(小白 & 程序员专属学习篇)
2025-09-11 15:10:14
608
原创 搞定大模型微调面试不难!这份深度解析,小白、程序员吃透就能拿 Offer
搞定大模型微调面试不难!这份深度解析,小白、程序员吃透就能拿 Offer
2025-09-09 15:54:43
807
原创 程序员 & 小白速收!智能体开发指南:大模型方向全攻略(就业 + 技能 + 保研,建议收藏)
程序员 & 小白速收!智能体开发指南:大模型方向全攻略(就业 + 技能 + 保研,建议收藏)
2025-09-09 15:52:50
739
原创 【强烈收藏】Agent与AI智能体入门指南:大模型的“手脚“如何重塑我们的世界
【强烈收藏】Agent与AI智能体入门指南:大模型的"手脚"如何重塑我们的世界
2025-09-08 15:45:53
1055
原创 从入门到精通:AI Agent 上下文工程(Context Engineering)全指南
从入门到精通:AI Agent 上下文工程(Context Engineering)全指南
2025-09-07 07:30:00
1433
原创 保姆级教程:NAS 轻松跑 Dify,玩 AI 必备的本地知识库搭建技巧
保姆级教程:NAS 轻松跑 Dify,玩 AI 必备的本地知识库搭建技巧
2025-09-03 16:31:50
752
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人