自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1203)
  • 收藏
  • 关注

原创 一文带你速通RAG、知识库和LLM!检索增强生成(Retrieval Augmented Generation,RAG)

大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!

2025-03-17 11:07:36 431

原创 LLM、Prompt、AI Agent、RAG... 一网打尽大模型热门概念究竟什么是大模型?

大模型(),或者称为基础模型 (),指的是包含超大规模参数(通常在十亿个以上)的神经网络模型。这些参数使得大模型能够处理和理解复杂的任务,如自然语言处理、图像识别等。参数规模大架构规模大训练数据大算力需求大以上“大”衍生出模型能力的强大。我们常说到的大模型,指的是最常用的一类,大语言模型LLM,Large Language Model),如:ChatGPT、DeepSeek等都是大语言模型。注:本文后续的大模型均代指大语言模型LLMPrompt。

2025-03-17 11:05:18 506

原创 AI全栈必问的RAG 是什么!

大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!

2025-03-17 10:59:55 464

原创 大模型微调高效指南:五大前沿PEFT技术揭秘,提升模型性能的关键策略

大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!

2025-03-16 15:00:00 471

原创 AI产品经理必知:100个专业术语,超全汇总!建议收藏

文本摘要是自动生成文本的总结,通常包括提取式摘要和生成式摘要两种方法。四、计算机视觉(Computer Vision)大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!

2025-03-16 12:45:00 643

原创 全面掌握AI大模型:从理论到实践的完整学习路线,看这篇就够了

大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!

2025-03-16 08:45:00 1411

原创 大模型时代什么人才最抢手?哪些是万金油岗位?如何转行大模型?一篇文章讲清楚

大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!

2025-03-15 10:30:00 1891

原创 系统性学习掌握大模型 ——(基础篇)看这篇文章就够了!

大模型,在人工智能领域是指具有大量参数的机器学习/深度学习模型。这种百度百科的解释,大家一搜就看到了,但依旧很难理解透彻,所以还需要更加简洁的语言结合案例进行解释说明。首先,我们将大模型3个字拆开来看,先说明一下什么是模型。模型,简单来讲就是算法或者数学结构,这些算法或数学结构是经过多年研究总结而成的知识。例如数学中的 y=ax+b ,是一个简单的线性模型,y是预测输出,X是输入数据,a和b可以理解为斜率和截距参数,这个模型可以通过找到最佳的a、b值,对预测值和实际值之间的差距进行最小化。

2025-03-15 08:00:00 985

原创 一文讲完17种提示词工程(prompt engineering)方法

大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!

2025-03-15 07:15:00 667

原创 终于!有人总结了大模型学习资料!看完这篇就足够了!

大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!

2025-03-14 11:36:04 427

原创 普通人如何入门AI人工智能?最短学习路线分享

大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!

2025-03-14 08:00:00 613

原创 大模型应用架构选择指南:六大模式深度解析,找到最适合你的方案!

大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!

2025-03-14 07:30:00 718

原创 产品经理到底是做什么的,职业发展路线是怎样的

产品经理(Product manager,PM)是指在公司中针对某一项目或是某一类的产品进行规划和管理的人员,主要负责产品的研发、制造、营销、渠道等工作。产品经理就是带领产品团队,在高效的时间内推出满足需求的产品,负责产品整个生命周期的人。产品经理工作内容关键词释义「产品经理」中的「经理「定义了这个职位是具有管理职能的,「需求」是产品经理工作过程中绕不开的一个至关要素;「需求「是工作的起点,产品经理需要通过各种方式了解到最真实的需求;

2025-03-14 07:00:00 1036

原创 教你从0到1搭建本地大模型,超简单!

大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!

2025-03-13 11:38:25 1034

原创 模型微调之基础篇:模型微调概念以及微调框架

之前我们一直强调,大语言模型(LLM)是概率生成系统。能力边界知识时效性:模型知识截止于训练数据时间点推理局限性:本质是概率预测而非逻辑运算,复杂数学推理易出错(deepseek的架构有所不同)专业领域盲区:缺乏垂直领域知识幻觉现象:可能生成看似合理但实际错误的内容之前一直讲解如何通过各种不同的知识库进行知识片段的检索,并通过提示词临时注入到大模型。从今天开始,我会写一写微调相关的文章。定义:在预训练大模型(如GPT、BERT)的基础上,使用特定领域或任务的数据进行额外训练,使模型适应新任务。类比。

2025-03-13 11:16:09 1114

原创 大模型(LLM)到底是什么?和AI有啥关系?

大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!

2025-03-13 11:10:39 719

原创 一口气读懂“大模型的预训练”是怎么回事

大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!

2025-03-12 08:45:00 1044

原创 Java程序员转型大模型应用开发:掌握这几步就够了!

大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!

2025-03-12 08:15:00 973

原创 5分钟带你看懂什么是大语言模型(LLM)

大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!

2025-03-12 07:30:00 1006

原创 别再死磕大模型!专业模型+Agent才是大模型的未来之路

大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!

2025-03-11 21:03:12 1043

原创 一文搞清楚什么是AI Agent(智能体)

AI智能体,也称为人工智能代理,是一种模拟人类智能行为的人工智能系统,其核心引擎通常是大模型(LLM)。AI智能体能够感知环境、做出决策和执行任务,以实现特定目标。与传统人工智能相比,AI智能体具有自主性、适应性和交互性,能在复杂多变的环境中独立运作。AI智能体不仅能高效处理已知任务,还能灵活应对未知环境。比如,传统机器人只能按预设程序执行任务,而AI智能体可以根据环境变化自主调整策略,完成复杂的工作流程。大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!

2025-03-11 20:59:28 812

原创 大模型技术内参:39 种提示工程

大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!

2025-03-11 20:54:42 741

原创 新手必读!从零开始预训练大语言基础模型,创建属于你自己的大语言神器

大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!

2025-03-10 14:30:00 796

原创 掌握Prompt Engineering(提示工程):解锁大型语言模型的无限潜能

在深入探讨提示工程之前,有必要先了解大型语言模型的基本概念。LLMs通常分为在线模型和离线模型两大类。大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!

2025-03-10 10:30:00 1853

原创 AI应用开发先了解这些概念:智能体、LLM、RAG、提示词工程

大语言模型是一类基于深度学习的人工智能模型,旨在处理和生成自然语言文本。通过训练于大规模文本数据,使得大语言模型能够理解并生成与人类语言相似的文本,执行各类自然语言处理任务。LLM的训练及使用LLM能够理解并生成与人类语言相似的文本,执行各类自然语言处理任务,具体可应用场景包括而不限于文本生成、机器翻译、摘要生成、对话系统、情感分析等。其具有强大的泛化能力、能够处理多种任务。LLM的训练LLM的训练过程分为预训练和微调两个阶段。预训练阶段。

2025-03-10 07:15:00 609

原创 RAG与微调:大模型落地的最佳路径选择

大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!

2025-03-09 11:45:00 673

原创 写给小白的大模型应用科普:AI Agent篇

所以,AI Agent(智能体) 是一种能利用大模型进行自主的任务规划、决策与执行的系统。它的核心思路是让人工智能不仅能回答问题,还能像人一样主动完成一系列关联性的任务;不仅有聪明的“大脑”,还有灵活的“手脚”,必要的时候还会使用“工具”。如果说大模型像一位百科全书式的学者,而AI Agent就像一个“办事能力强的大管家”。这位管家会根据你的需求,把任务拆解成多个步骤,并主动找到资源或工具来完成。比如这个任务:“对比A公司与我公司产品的差异,把结果发送到我邮箱。

2025-03-09 09:30:00 1068

原创 如何从零开始搭建你的专属本地知识库问答系统,看完这篇文章你就懂了

大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!

2025-03-09 08:45:00 753

原创 用大模型学习大模型-40问掌握大模型入门知识点(上)

大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!

2025-03-08 11:08:08 710

原创 大模型时代开发者进阶秘籍:从新手到高手的成长路径全解析

大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!

2025-03-08 11:07:04 700

原创 coze平台保姆级教程,手把手教你创建属于你的AI Agent

大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!

2025-03-08 11:05:28 733

原创 一分钟了解通用\行业\场景大模型的区别和联系

大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!

2025-03-07 16:32:10 977

原创 QwQ-32B一键部署!真正的0代码,0脚本,0门槛

除了上面提到的基本的对话功能,openwebui还有很多有意思的功能,我们来看几个比较常用的功能。模型对比输出您可以添加多个模型,开启对话后,会以分栏的方式,同时展示不同模型的回答。您可以对比回答,挑选更符合要求的。自定义推理参数您可以自定义模型的系统提示词、函数调用、温度k等配置,调出最适合自己的模型参数。此外,OpenWebUI还有个性化知识库、AI对话游乐场等功能,您可以在官方文档[6]中继续探索!大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!

2025-03-07 16:09:29 1039

原创 一文搞懂智能体工作流(Agentic Workflow)

大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!

2025-03-07 16:06:50 742

原创 一文读懂大模型显存需求:从0.5B到70B,你的显卡够用吗?

大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!

2025-03-06 11:23:49 886

原创 再聊大模型的微调训练——指令监督微调SFT & 强化学习RL

大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!

2025-03-06 10:56:43 1132

原创 小白学习大模型:什么是大模型?大模型到底该怎么学?

大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!

2025-03-06 10:50:35 764

原创 100个DeepSeek最实用场景,覆盖各个领域,终于找到AI发力的方向!

DeepSeek-R1 一经推出,便迅速引发了市场的强烈反响。短短几天的时间里,它势如破竹,成功登顶中美两区苹果应用市场免费榜榜单,其受欢迎程度可见一斑。不仅如此,亚马逊、微软、阿里云、百度智能云以及三大电信运营商等行业巨头也纷纷先后宣布接入该模型,足见 DeepSeek-R1 的强大吸引力与影响力。根据 AI 产品榜所提供的数据显示,在 2025 年 1 月 20 日 DeepSeek-R1 发布后的几天里,它持续积蓄能量,并在 1 月的最后一周迎来了爆发式的增长。

2025-03-05 10:36:39 887

原创 别再自己造轮子了!企业自建RAG系统的“坑”比你想象的多

大模型很多技术干货,都可以共享给你们,如果你肯花时间沉下心去学习,它们一定能帮到你!

2025-03-05 10:27:14 914

原创 一文详解!模型压缩四剑客:量化、剪枝、蒸馏、二值化

随着深度学习的飞速发展,模型的规模和复杂度也在不断攀升。以 GPT-175B 为例,它拥有 1750 亿参数,至少需要 320GB 的半精度(FP16)格式存储空间,推理时至少需要五个 A100 GPU,每个 GPU 配备 80GB 内存。如此庞大的模型虽然性能强大,但对硬件资源的要求极高,极大地限制了其在实际场景中的应用。例如,在嵌入式设备、移动设备等资源受限的环境中,这些设备的算力和内存有限,无法直接运行如此庞大的模型。

2025-03-05 10:25:19 829

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除