自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2132)
  • 收藏
  • 关注

原创 LLM大模型学习文档+教程+PDF书籍+系统学习路线,一套全拿到!

LLM相关的内容很多,现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学,学习成本和门槛很高。

2025-03-28 20:04:32 642 1

原创 不会写 Prompt?你可能正在白白浪费 AI

这篇文章就分享下anthropic这家公司出的AI使用指南。anthropic这家公司有些人可能不熟悉,编程领域的明珠 Claude  就是他们家的产品!

2026-01-03 09:30:00 510

原创 可部署本地大模型+知识库(RAG)介绍,一文全讲解(附教程)

本文介绍一种可部署于本地的大模型应用:“本地大模型+知识库(RAG,检索增强生成)”,有助于解决上述的问题。

2026-01-02 08:45:00 349

原创 阿里云大模型课程学习笔记-提示词工程(Prompt Engineering)

提示词工程(Prompt Engineering) 就是研究如何构建和调整提示词,从而让大语言模型实现各种符合用户预期的任务的过程。

2026-01-01 08:15:00 1395

原创 淘天二面:为何大模型离不开RL?

因为是强化学习小白,没有系统深度的 RL 知识储备,本文只是从 LLM 角度出发,简单思考和梳理 LLM 中关于强化学习的若干问题,请大佬们指点。

2025-12-31 10:41:32 726

原创 LLM 应用开发是什么:零基础也可以读懂的科普文(极简版)

LLM 应用开发是什么:零基础也可以读懂的科普文(极简版)

2025-12-31 10:40:41 730

原创 一文带你了解模型量化、剪枝和蒸馏

模型量化、剪枝和蒸馏是三种主流的模型压缩与优化技术,核心目标是在保证模型性能(精度、准确率)的前提下,减小模型体积、降低计算复杂度,使其能在资源受限的设备(如手机、嵌入式设备、边缘终端)上高效部署。

2025-12-31 10:39:58 864

原创 LLM应用开发进阶 · 序-为什么你“会用 LLM”,但做不出复杂应用?

LLM应用开发进阶 · 序-为什么你“会用 LLM”,但做不出复杂应用?

2025-12-31 10:38:33 784

原创 硅谷大厂集体改用中国大模型,国产AI成全球顶流!网友:一用一个不吱声……

硅谷大厂集体改用中国大模型,国产AI成全球顶流!网友:一用一个不吱声……

2025-12-31 10:37:47 420

原创 手把手教你玩转开源大模型:从Llama3到企业级应用

本文将深入探讨如何选择、适配和落地大模型,为企业提供全面的大模型应用指南。

2025-12-30 11:35:59 856

原创 【LangChain】一文读懂RAG基础以及基于langchain的RAG实战

我查找了langchain的官方文档,并利用文档中提供的方法进行了实际操作。这篇文章是我的学习笔记,也希望为同样存在相同困惑的伙伴们能提供一些帮助。

2025-12-30 10:51:43 542

原创 AI对话魔法|Prompt Engineering 探索指南

Prompt Engineering 就是设计和优化与AI对话的“提示词”或“指令”,让AI能准确理解并提供有用的回应。

2025-12-30 10:50:05 602

原创 企业和个人基于业务知识和代码库增强的大模型生成代码实践

本文基于笔者在校招研发入职初起的真实困境出发,针对新人上手难,知识资产容易流失,运维耗时,以及基于AI结合的产研提效做了一系列工作,提出了产研分阶段应用大模型的策略,在第二阶段提出将大模型与系统知识库结合,以解决企业代码相关资产管理和沉淀以及利用率问题,同时能够很好的解决运维以及新人熟悉系统难的问题。

2025-12-30 10:48:19 937

原创 开源 Ai Agent 智能体,能用、能改、能学,美滋滋!

先是 RAG 知识库,再到 MCP 服务,越来越多的互联网公司掀起了 Ai 智能体的设计和落地。作为程序员👨🏻‍💻,我们是最早一波接触和使用了各类的 Ai Agent 产品的暖水鸭🦆,包括;Coze、Dify、Claude,以及编程类软件智能体,Cursor、Trae.ai 等。但是,也是作为程序员,其实我们更好奇,这东西是如何实现的。——我说的,Ai Agent 就不能是那种工作流配置的,太固定的东西,没法适应更多的场景。

2025-12-30 10:47:00 940

原创 保姆级教程:零代码基础也能微调Qwen3,并本地部署

我们将在本文介绍如何微调使模型成为一个"双重人格"的助手,既能进行普通闲聊,又能在需要时切换到更严谨的思考模式来解决复杂问题,特别是数学问题。

2025-12-29 13:52:38 901

原创 零基础也能体验模型微调!魔塔+LLaMa Factory手把手教程

我们天天微调微调,微调到底是啥感觉?所以今天用魔塔+LLaMa Factory 体验微调一个模型,文科生也能跑完,不用考虑你自己电脑的配置。

2025-12-29 13:52:04 1009

原创 LLaMA Factory 如何对大模型进行微调、导出和量化!掌握这几步,轻松搞定

LLaMA Factory的源码里默认提供了很多种可直接训练的数据集,在data目录下。我们就拿identity.json身份认知训练集来做微调。

2025-12-29 13:51:31 800

原创 零基础也能轻松掌握LLM!这份《大语言模型实战》可视化指南,吴恩达都点赞

对于许多初学者或希望深入理解大模型技术的朋友来说,面对浩瀚的理论和复杂的代码,往往会感到无从下手,甚至望而却步。

2025-12-29 13:50:19 745

原创 我力荐这本大模型书,真的贼好懂,还讲得特别细致(附PDF)

随着人工智能的不断演进,大模型正站在最前沿,彻底改变我们与机器的互动方式、信息处理流程,甚至语言本身的理解方式。

2025-12-29 13:49:30 989

原创 LLaMA-Factory:让大模型微调变得如此简单

今天给大家介绍一个开源神器——LLaMA-Factory,它让大模型微调变得前所未有的简单!

2025-12-29 13:48:37 695

原创 4大阶段,10个步骤,助你高效构建企业级智能体(Agent)

今天,我们从整体构建企业级智能体做事的角度来聊聊,如何高效的构建企业级智能体,这里我划分成了4大阶段,10个步骤

2025-12-27 11:40:30 877

原创 暴涨 7000+ GitHub Star!一部手机就能跑本地大模型!NEXA SDK重磅更新

从端侧推理引擎的深度优化,到软硬件协同的模型定制突破,再到全场景解决方案的无缝落地 ——Nexa SDK迎来重磅更新。

2025-12-27 11:39:24 577

原创 你的AI应用正在“裸奔”!一份防止Prompt注入攻击的实战指南

安全不是一劳永逸的,它是一场持续的攻防博弈。随着攻击技术的发展,我们的防御手段也需要不断进化。希望这篇文章能为你提供一个坚实的起点。

2025-12-27 11:38:27 849

原创 探索大模型应用:构建基于检索的RAG实战指南

本文将带你深入了解如何利用检索增强生成模型(RAG)来扩展大模型的能力,并通过一个实战案例,展示如何构建一个基于RAG的AI知识库。

2025-12-27 11:37:46 607

原创 AI智能体开发框架LangChain & LangGraph快速入门实战(包含LangSmith)

今天来点偏技术实战的,带大家用LangChain & LangGraph快速入门用编程创建智能体,用LangSmith进行追踪,Agent-Chat构建Agent UI。

2025-12-27 11:37:02 542

原创 一文搞懂大模型的知识蒸馏(Knowledge Distillation)

这就是知识蒸馏要解决的问题。就像武功传承一样——让高手(大模型)把经验传授给徒弟(小模型)。

2025-12-26 10:06:29 692

原创 一文搞懂大模型:RAG“分而治之“的工程哲学

"分而治之"是工程学中的经典思想——将复杂问题拆解为相对独立的子问题,分别解决后再统一整合。

2025-12-26 10:05:31 608

原创 8K star!从0开始,动手训练一个大语言模型

今天我们要分享的开源项目,它就希望可以带领你从头开始,在0基础的情况下,亲自动手来训练一个微型的大语言模型,让你从实践中获得真知,它就是:MiniMind

2025-12-26 10:04:20 558

原创 写给0基础小白的大模型入门科普

大模型是一个简称。完整的叫法,应该是“人工智能预训练大模型”。预训练,是一项技术,我们后面再解释。

2025-12-26 10:03:28 520

原创 2026年大语言模型的微调, fine-tuning没你想的难

一个LLM的生命周期包含多个步骤,下面将讨论这个周期中最活跃、最密集的部分之一 – fine-tuning(微调)过程。

2025-12-26 10:02:36 561

原创 保姆级大模型微调教程:零代码基础也能微调Qwen3,并实现本地部署

我将在本文介绍如何通过 unsloth 框架以 LoRA 的方法微调 Qwen3-14B 模型。

2025-12-25 11:02:50 885

原创 Google新LLM仅需0.5GB内存即可运行——教你如何在本地微调(附教程)

我没有对整个模型重新训练(那样会让我的笔记本电脑“死机”),而是采用了LoRA(低秩适应)技术。可以把它理解为:不给AI更换整个“大脑”,只给它新增几个神经元。

2025-12-25 11:01:27 803

原创 动手学大模型应用开发,第2天:调用大模型(下)

本章节将指导开发者如何将智谱 AI API 的使用方式,也将介绍如何将其封装成个性化 LLM 嵌入 LangChain 使用。

2025-12-25 10:59:45 783

原创 动手学大模型应用开发,第2天:调用大模型(上)

Prompt 最初是 NLP(自然语言处理)研究者为下游任务设计出来的一种任务专属的输入模板,类似于一种任务(例如:分类,聚类等)会对应一种 Prompt。

2025-12-25 10:58:02 653

原创 动手学大模型应用开发,第1天:学习大模型必知必会

大语言模型(英文:Large Language Model,缩写LLM),也称大型语言模型,是一种人工智能模型,旨在理解和生成人类语言。

2025-12-25 10:56:47 575

原创 Github-LLaMA Factory:百种大语言模型一站式高效微调平台

LLaMA Factory 是一个功能强大、易于使用的开源框架,旨在简化大型语言模型(LLMs)的微调过程。其核心目标是让研究人员和开发者能够以极低的代码成本(甚至零代码),轻松地对超过100种主流大语言模型进行各种高效的微调。

2025-12-24 10:49:12 537

原创 小白能看懂的AI大模型系列:模型微调(LLAma-Factory本地安装)

模型微调是针对base模型的一种局部调整,让模型可以按照你想要的输出内容方式输出内容。从我们日常应用的角度来讲,模型微调其实主要起到两个用处(个人理解)

2025-12-24 10:46:00 247

原创 【LLaMA-Factory】一文吃透近端策略优化,让大模型“自我进化“

在AI的世界里,大模型就像一个聪明的学生,但有时候它需要的不仅仅是"死记硬背"(预训练),更需要"实战演练"(强化学习)来真正成长。

2025-12-24 10:45:08 358

原创 零代码门槛!大模型微调工具全攻略:从选择到部署,一篇搞定

本文将为你系统梳理大模型微调的完整流程,介绍一系列“少写代码”甚至“不写代码”的工具,让你轻松跨越技术门槛,快速上手大模型微调。

2025-12-24 10:44:29 1017

原创 小白入门大模型- 从微调模型开始了解大模型

本文不满足于对 API 的浅尝辄止,而是希望为您提供一份兼具深度与可操作性的“食谱”。读完本文,您将不仅能成功运行代码,更能洞悉其背后的“为什么”,并具备独立解决实际问题的能力。

2025-12-24 10:43:47 908

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除