自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(962)
  • 收藏
  • 关注

原创 DeepSeek R1 671B 完整版本地部署教程来了!!!

关于本地部署,大多数人使用的是蒸馏后的8B/32B/70B版本,本质是微调后的Llama或Qwen模型,并不能完全发挥出DeepSeek R1的实力。然而,完整的671B MoE模型也可以通过针对性的量化技术压缩体积,从而大幅降低本地部署门槛,乃至在消费级硬件(如单台Mac Studio)上运行。那么,如何用 ollama 在本地部署 DeepSeek R1 671B(完整未蒸馏版本)模型呢?一篇在海外热度很高的简明教程即将揭晓。作者主页:https://snowkylin.github.io。

2025-02-05 16:12:23 12225 1

原创 深入浅出 AI 智能体(AI Agent)|技术干货

随着人工智能技术的飞速发展,智能体(AI Agents)正逐渐成为人与大模型(如大语言模型)交互的主要方式。智能体是能够执行任务、解决问题并提供服务的 AI 系统,它们通过模拟人类的行为和决策过程,使得与大模型的交互更加自然、高效和个性化。智能体作为人与大模型交互的桥梁,不仅提高了交互的效率和质量,还扩展了大模型的应用范围。随着技术的不断进步,智能体将更加深入地融入我们的日常生活,成为不可或缺的智能伙伴。智能体(英文名:AI Agent 或 AI Bot)是指能够感知其环境并采取行动以实现某种目标的实体。

2025-01-04 17:14:34 25091 1

原创 五款国产AI大模型大测评!Kimi,智谱清言,通义千问,文心一言,豆包谁更胜一筹?

AI大模型是指具有巨大参数量的深度学习模型,通常包含数十亿甚至数万亿个参数。原理主要基于深度学习技术,特别是神经网络和大规模数据的训练,它们通过分析大量数据来学习语言模式、知识表示和任务执行策略。AI大模型的训练过程通常包括以下几个步骤:数据预处理:对原始数据进行清洗、整理和标注,包括去除噪声、填充缺失值、归一化等操作;模型构建:设计并搭建神经网络,这包括确定网络的层次结构、神经元数量、激活函数等;模型训练:将预处理后的数据输入到神经网络中,不断调整神经元的连接权重使模型达到满意的性能;

2024-10-28 11:26:42 50571

原创 Ollama:一个在本地部署、运行大型语言模型的工具

所谓自定义模型就是不适用Ollama官方模型库中的模型,理论可以使用其他各类经过转换处理的模型Ollama库中的模型可以通过提示进行自定义。# 设置温度参数# 设置SYSTEM 消息SYSTEM """作为AI智能助手,你将竭尽所能为员工提供严谨和有帮助的答复。"""Modelfile文档One-API是一个OpenAI接口管理 & 分发系统,支持各类大模型。这里使用Docker快速进行部署。拉取镜像创建挂载目录启动容器访问IP:3001初始账号用户名为 root,密码为 123456。

2024-05-28 10:30:57 8079

原创 【大模型实战案例】手把手教大家微调大模型 Llama 3

Llama 3 近期重磅发布,发布了 8B 和 70B 参数量的模型,我们对 Llama 3 进行了微调!!!今天手把手教大家使用 XTuner 微调 Llama 3 模型。

2024-04-23 18:09:27 4665 2

原创 OpenAI的官方Prompt工程指南详解 - 看这一篇真的就够了

这个技巧偏开发者。普通用户可以跳过。因为模型具有固定的上下文长度,因此用户和助手之间的对话无法无限期地继续。解决此问题有多种解决方法,第一个是总结对话中的历史记录。一旦输入的大小达到预定的阈值长度,这可能会触发总结部分对话的查询,并且先前对话的摘要可以作为系统消息的一部分包括在内。或者,可以在整个对话过程中在后台异步总结之前的对话。这两种方法都行,或者还可以把过去的所有聊天记录存成向量库,后续跟用户对话的时候动态查询嵌入,也可以。

2024-04-10 10:42:26 12931

原创 程序员必看!大模型面试刷题攻略:500 + 题刷透,面试稳了》

程序员必看!大模型面试刷题攻略:500 + 题刷透,面试稳了》

2025-09-21 11:00:00 505

原创 程序员必看!一文吃透 LoRA 家族:大语言模型高效训练的 “秘密武器”

程序员必看!一文吃透 LoRA 家族:大语言模型高效训练的 “秘密武器”

2025-09-21 10:00:00 375

原创 程序员必看!RAG 揭秘客服 “秒回” 魔法:为啥有的只会说 “抱歉”?

程序员必看!RAG 揭秘客服 “秒回” 魔法:为啥有的只会说 “抱歉”?

2025-09-19 11:45:00 754

原创 大模型(LLM)从 0 到精通:工程师实战路线 + 免费学习资料(路线图 / 书籍 / 课程)全汇总,程序员 & 小白速藏!

大模型(LLM)从 0 到精通:工程师实战路线 + 免费学习资料(路线图 / 书籍 / 课程)全汇总,程序员 & 小白速藏!

2025-09-19 11:45:00 1510

原创 别再盲目学大模型!LLM 必备基础知识,一文帮你打牢地基

别再盲目学大模型!LLM 必备基础知识,一文帮你打牢地基

2025-09-18 10:45:00 1041

原创 程序员必看!超全万字指南,带你吃透 Agent 设计九大模式

程序员必看!超全万字指南,带你吃透 Agent 设计九大模式

2025-09-18 09:30:00 755

原创 【小白友好】一文吃透大语言模型(LLM):从 0 搞懂它到底怎么运作!

【小白友好】一文吃透大语言模型(LLM):从 0 搞懂它到底怎么运作!

2025-09-17 12:45:00 934

原创 程序员必看!AI 大模型里的 Token,到底是个啥?

程序员必看!AI 大模型里的 Token,到底是个啥?

2025-09-17 11:15:00 933

原创 小白必学!AI Agent 核心概念 + 入门知识,程序员也能从 0 到 1 快速上手

小白必学!AI Agent 核心概念 + 入门知识,程序员也能从 0 到 1 快速上手

2025-09-16 10:15:00 1189

原创 【干货收藏】AI智能体(Agent)开发全景指南:8大核心技术深度解析

【干货收藏】AI智能体(Agent)开发全景指南:8大核心技术深度解析

2025-09-16 09:45:00 1727

原创 小白必看!史上最全!一篇文章带你搞懂 AI 智能体(AI Agent)

小白必看!史上最全!一篇文章带你搞懂 AI 智能体(AI Agent)

2025-09-15 15:05:09 1207

原创 18 种 RAG 技术大盘点:程序员 / 小白入门大模型,你懂多少?

18 种 RAG 技术大盘点:程序员 / 小白入门大模型,你懂多少?

2025-09-15 15:03:24 972

原创 小白必看:什么是agnet,看这篇就够了

小白必看:什么是agnet,看这篇就够了

2025-09-13 15:10:12 1047

原创 程序员必看!全量微调与 LoRA:从技术原理到场景适配,一文搞懂大模型调优

程序员必看!全量微调与 LoRA:从技术原理到场景适配,一文搞懂大模型调优

2025-09-13 15:09:06 1131

原创 AI 行业年龄焦虑加剧!35 岁工程师求职难、遇裁员,如何破局?(附 大模型零基础全套资料)

AI 行业年龄焦虑加剧!35 岁工程师求职难、遇裁员,如何破局?(附 大模型零基础全套资料)

2025-09-12 15:42:55 1048

原创 干货收藏:从技术原理到落地实践,全面拆解RAG检索增强生成,打造可靠的个性化AI知识库

干货收藏:从技术原理到落地实践,全面拆解RAG检索增强生成,打造可靠的个性化AI知识库

2025-09-12 15:37:04 714

原创 【干货收藏】一文吃透RAG技术:从原理到落地,破解大模型幻觉的关键路径

【干货收藏】一文吃透RAG技术:从原理到落地,破解大模型幻觉的关键路径

2025-09-11 15:32:05 1071

原创 搞定 LLM 深度推理不难!3 种核心提示技术进阶指南(小白 & 程序员专属学习篇)

搞定 LLM 深度推理不难!3 种核心提示技术进阶指南(小白 & 程序员专属学习篇)

2025-09-11 15:10:14 608

原创 别再卷RAG了!Agent才是大模型时代程序员的终极外挂!

别再卷RAG了!Agent才是大模型时代程序员的终极外挂!

2025-09-10 15:54:54 683

原创 AI 大模型入门:从基本原理到代码,吃透语言模型训练与推理

AI 大模型入门:从基本原理到代码,吃透语言模型训练与推理

2025-09-10 15:46:47 1027

原创 搞定大模型微调面试不难!这份深度解析,小白、程序员吃透就能拿 Offer

搞定大模型微调面试不难!这份深度解析,小白、程序员吃透就能拿 Offer

2025-09-09 15:54:43 807

原创 程序员 & 小白速收!智能体开发指南:大模型方向全攻略(就业 + 技能 + 保研,建议收藏)

程序员 & 小白速收!智能体开发指南:大模型方向全攻略(就业 + 技能 + 保研,建议收藏)

2025-09-09 15:52:50 739

原创 【强烈收藏】Agent与AI智能体入门指南:大模型的“手脚“如何重塑我们的世界

【强烈收藏】Agent与AI智能体入门指南:大模型的"手脚"如何重塑我们的世界

2025-09-08 15:45:53 1055

原创 【收藏必备】一文搞懂大模型工具调用:技术原理、实战方法与未来发展趋势

【收藏必备】一文搞懂大模型工具调用:技术原理、实战方法与未来发展趋势

2025-09-08 15:35:44 1233

原创 大模型新人避坑指南:刷到真能少走几年弯路!新手必看的干货经验与建议

大模型新人避坑指南:刷到真能少走几年弯路!新手必看的干货经验与建议

2025-09-07 11:00:00 940

原创 从入门到精通:AI Agent 上下文工程(Context Engineering)全指南

从入门到精通:AI Agent 上下文工程(Context Engineering)全指南

2025-09-07 07:30:00 1433

原创 多模态是什么?一文读懂当下最火的多模态技术,看这一篇就够了!

多模态是什么?一文读懂当下最火的多模态技术,看这一篇就够了!

2025-09-05 16:02:25 837

原创 大模型微调(Fine-tuning)深度指南:从概念到实践的完整解析

大模型微调(Fine-tuning)深度指南:从概念到实践的完整解析

2025-09-05 16:01:16 1030

原创 收藏备用!新手也能懂的大模型RAG知识库搭建全攻略

收藏备用!新手也能懂的大模型RAG知识库搭建全攻略

2025-09-04 14:46:59 832

原创 爆火的DeepSeek大模型详解:收藏这篇,小白秒变AI应用高手

爆火的DeepSeek大模型详解:收藏这篇,小白秒变AI应用高手

2025-09-04 14:26:19 1003

原创 小白入门必看!人人在聊的 Agent(智能体)究竟是啥?一文讲透

小白入门必看!人人在聊的 Agent(智能体)究竟是啥?一文讲透

2025-09-03 16:33:18 776

原创 保姆级教程:NAS 轻松跑 Dify,玩 AI 必备的本地知识库搭建技巧

保姆级教程:NAS 轻松跑 Dify,玩 AI 必备的本地知识库搭建技巧

2025-09-03 16:31:50 752

原创 技术人面试必看!《百面大模型》干货集锦,助你通关大厂

技术人面试必看!《百面大模型》干货集锦,助你通关大厂

2025-09-02 16:14:17 924

原创 终于有人把 MCP、RAG、Agent 的关系讲明白了!核心概念全解析

终于有人把 MCP、RAG、Agent 的关系讲明白了!核心概念全解析

2025-09-02 16:00:24 1020

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除