自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(129)
  • 收藏
  • 关注

原创 【LLM大模型】你要的AI Agent工具都在这里

本文主要聊了AI Agent的工具规范,以及常用工具。AI Agent只有借助工具才能发挥威力。

2024-07-22 10:48:46 552

原创 【ai大模型】人工智能大模型技术白皮书,从0入门大模型,附文档+LLM实战教程

中国人工智能学会发布了《中国人工智能大模型技术白皮书》,系统梳理了大模型技术演进,深入探讨关键技术要素,并剖析当前挑战及未来展望。

2024-07-22 10:42:33 458

原创 LLM大模型时代,AI产品经理的机器学习算法入门指南

什么是机器学习算法?下篇文章是笔者分享的关于AI产品经理的机器学习算法的内容,推荐作为刚刚踏入成为的AI产品经理同学来看哦!

2024-07-21 11:45:00 526

原创 Git大模型项目:LLM(so-large-lm)课程教程+笔记!(附资源)

本前言介绍的课程笔记源自于“大模型理论基础(so-large-lm)”课程, 一个致力于探索和理解大型模型发展的前沿课程。一年前,该课程已经讲述了MOE和RAG架构的重要性,并在课程内容中对这两种架构进行了深入讲解。这不仅证明了学习大模型理论基础的重要性,也展示了课程内容的前瞻性和实用价值。

2024-07-20 09:15:00 620

原创 LLM大语言模型优化方法简介:Prompt、RAG、Fine-tuning

GPT、LLama、Gemini等大语言模型虽展现出强大能力,但在实际应用中仍有问题,例如在准确性、知识更新速度和答案透明度方面,仍存在挑战。

2024-07-19 15:43:24 680

原创 LLM大模型:Tree-RAG工作流程及实体树应用介绍

T-RAG方法基于将检索增强生成(Retrieval-Augmented Generation,简称RAG)架构与开源经过微调的大型语言模型(Large Language Model,简称LLM)以及实体树向量数据库相结合。这种方法的重点在于上下文检索。

2024-07-18 16:46:39 617

原创 LLM大模型LangChain的RAG实践

LLM是几乎是解决各个任务的最佳解决方案。在通用聊天这一领域,很多大模型都能够实现接近人类的水平表现。

2024-07-18 16:45:50 689

原创 LangChain 实战:Agent思维

大模型是被训练出来的,它可以结合本地知识库,也可以调用搜索或在线API来增强自身的能力。这些都不是大模型内部的数据,我们称为外部工具。当大模型需要通过自主判断调用外部工具来进一步完成任务时,LangChain给我们提供了Agent(代理)模块。驱动Agent工作的是ReAct思想框架。

2024-07-18 16:45:06 950

原创 LLM大模型:关于Llama 3 AI大模型的几点总结

Llama3 在MMLU(学科知识理解)、GPQA(一般问题)、HumanEval(代码能力)、GSM-8K(数学能力)、MATH(比较难得数学)五个基准测试上,不管是Llama3-8B,还是Llama-70B,都优于目前比较优秀的大模型。

2024-07-17 15:08:10 972

原创 LLM大模型:通过7大指标监测并评估大语言模型的表现

自然语言处理(Natural Language Processing)领域在大语言模型(LLM)的使用下迅速发展。因为其出色的文本生成和理解能力,LLM 已在全球范围内得到广泛应用。

2024-07-17 15:03:03 822

原创 LLM大模型:微调语言模型前,需要考虑这三个关键方面

目前,市场正处于LLMs(大语言模型)和生成式人工智能的风口上。IBM的一项数据显示,将近三分之二的企业高管感受到了来自投资者的压力——要求他们加快使用生成式人工智能。

2024-07-17 15:01:54 1018

原创 【大模型入门】中国人工智能大模型技术白皮书,从0入门大模型,附文档+LLM实战教程

近期,中国人工智能学会发布了《中国人工智能大模型技术白皮书》,系统梳理了大模型技术演进,深入探讨关键技术要素,并剖析当前挑战及未来展望。 我为大家做了简要总结,并附上文档分享给大家。

2024-07-17 10:25:03 1152

原创 AI产品经理的工作流程与现有产品经理的区别

与互联网传统的产品经理不同,AI产品经理的能力要求、门槛等相对会更高。本文作者梳理了AI产品经理的工作流程与现有产品经理的区别,可以帮助大家更好理解这个岗位。

2024-07-16 16:17:16 364

原创 【ai大模型】基于LangChain构建RAG应用

Streamlit是一个开源的 Python 库,它使得数据科学家和开发者能够快速构建和共享美观的机器学习模型和数据应用程序。使用Streamlit,用户无需深入了解前端开发,即可创建交互式的 Web 应用。它的设计哲学是简单、快速和直观,使得用户可以通过编写 Python 脚本来定义应用的布局和行为。

2024-07-16 16:15:10 806

原创 【ai大模型】聊聊大模型的屏蔽词工程

在做微调训练时,鉴于业务场景的需要,可能会存在微调数据集中含有敏感词汇,譬如:自杀、跳楼等。而开源模型可能没有做敏感词汇的屏蔽工程。因此可能就会出现不可预控的现象,而我遇到的是,当我输入敏感词汇时,模型(基于ChatGLM3)大多数时候返回空,继续正常提问,还是空的。此时模型相当于已经挂了。

2024-07-16 16:14:05 830

原创 【AI大模型】初识LangChain的快速入门指南(附入门文档)

LangChain是一个基于大语言模型用于构建端到端语言模型应用的框架,它提供了一系列工具、套件和接口,让开发者使用语言模型来实现各种复杂的任务,如文本到图像的生成、文档问答、聊天机器人等。

2024-07-15 10:21:18 1329

原创 Datawhale出品:LLM大模型《GLM-4 大模型部署微调教程》发布!

智谱 AI 发布了最新开源模型 GLM4,通过 10T 高质量多语言数据与更先进的训练技术,达到了更加出色的生成效果。

2024-07-15 10:18:24 963

原创 【AI大模型】达到1k stars后,我对大模型开源教程的反思!(附llm教程)

这个开源项目是为了提供浅显易懂且前沿的大模基础知识而打造的,能收获1k个stars⭐️也是对这个项目的肯定。我为一起付出努力的贡献者感到开心,也为这个课程的核心贡献者表达谢意。

2024-07-15 10:14:51 1100

原创 【大模型】一文带你了解RAG(检索增强生成) | 概念理论介绍+ 代码实操(含源码)

针对大型语言模型效果不好的问题,之前人们主要关注大模型再训练、大模型微调、大模型的Prompt增强,但对于专有、快速更新的数据却并没有较好的解决方法,为此检索增强生成(RAG)的出现,弥合了LLM常识和专有数据之间的差距。

2024-07-13 10:31:47 665

原创 【ai大模型】在大模型RAG系统中应用知识图谱

在基于大模型的RAG应用中,可能会出现不同类型的问题,通过知识图谱的辅助可以在不同阶段增强RAG的效果,并具体说明在每个阶段如何改进答案和查询。

2024-07-13 10:30:18 995

原创 【ai大模型】为啥LLM大模型还没完全取代你?

大模型对其input和output,也就是它的输入输出有数量限制。为了保护它的,这计算能力或保护相当于一个带宽概念,如说openAI之前只有32k。最新上下文窗口扩张到128k,大概相当于一本《Clean Code》,这个角度来说,这个问题其实已被解决。

2024-07-13 10:29:39 767

原创 【LLM大模型】自主 AI Agent 的构建|Function Calling 技术实例探索

大语言模型拥有令人惊叹的语言理解和生成能力,却也存在自主决策、与外部系统交互等方面的不足。函数调用(Function Calling)技术的出现,正是为解决这一难题而生的创新方案,它赋予了大语言模型更强的自主能力和与外部世界连接的能力,成为实现真正智能自主 Agent 的关键一环。

2024-07-12 11:36:33 543

原创 【LLM大模型】一文带你了解RAG(检索增强生成) | 概念理论介绍+ 代码实操(含源码)

针对大型语言模型效果不好的问题,之前人们主要关注大模型再训练、大模型微调、大模型的Prompt增强,但对于专有、快速更新的数据却并没有较好的解决方法,为此检索增强生成(RAG)的出现,弥合了LLM常识和专有数据之间的差距。

2024-07-12 11:26:30 872

原创 LLM大模型:在RAG系统中应用知识图谱

关于大模型及其应用方面的文章层出不穷,聚焦于自己面对的问题,有针对性的阅读会有很多的启发,本文源自Whyhow.ai 上的一些文字和示例。对于在大模型应用过程中如何使用知识图谱比较有参考价值,特汇总分享给大家。

2024-07-12 11:25:56 870

原创 【LLM大模型】如何选择合适的 Embedding 模型?

检索增强生成(RAG)是生成式 AI (GenAI)中的一类应用,支持使用自己的数据来增强 LLM 模型(如 ChatGPT)的知识。

2024-07-10 10:40:21 746

原创 【LLM大模型】RAG 修炼手册|一文讲透 RAG 背后的技术

Embedding 是将离散的非结构化数据转换为连续的向量表示的技术。在自然语言处理中,Embedding 常常用于将文本数据中的单词、句子或文档映射为固定长度的实数向量,使得文本数据能够在计算机中被更好地处理和理解。通过 Embedding,每个单词或句子都可以用一个实数向量来表示,这个向量中包含了该单词或句子的语义信息。这样,相似的单词或句子就会在嵌入空间中被映射为相近的向量,具有相似语义的词语或句子在向量空间上的距离也会较近。

2024-07-10 10:36:34 1003

原创 【LLM大模型】RAG 修炼手册|揭秘 RAG 时代的新向量数据库

随着对大型模型应用探索的深入,检索增强生成技术(Retrieval-Augmented Generation)受到了广泛关注,并被应用于各种场景,如知识库问答、法律顾问、学习助手、网站机器人等。

2024-07-10 10:32:08 848

原创 【LLM大模型】如何在LlamaIndex中使用RAG?

LlamaIndex 是一个数据框架,用于帮助基于 LLM 的应用程序摄取、构建结构和访问私有或特定领域的数据。

2024-07-09 11:08:22 696

原创 LLM大模型技术及趋势总结

本篇文章旨在希望大家对大模型的本质、技术和发展趋势有简单的了解。由于近期大模型技术发展很快,这里对大模型的技术、本质及未来趋势进行总结和探讨时,水平有限,疏漏在所难免,请大家谅解。

2024-07-09 10:49:08 854

原创 【AI 大模型】GPT 大模型训练架构

Transformer 架构 是 Google 设计的 , 当前最流行的 GPT 大模型 都使用的该架构 , 最著名的就是 OpenAI 的 ChatGPT 大模型

2024-07-09 10:47:13 809

原创 【LLM大模型】pytorch在有限的资源下部署大语言模型(以ChatGLM-6B为例)

pytorch在有限的资源下部署大语言模型(以ChatGLM-6B为例)

2024-07-08 13:49:27 554

原创 2024爆火全网LLM大模型教程:从零开始构建大语言模型,已突破20K star!

对GPT大模型感兴趣的有福了!这本书的名字叫 《Build a Large Language Model (From Scratch)》 也就是 从零开始构建大语言模型!

2024-07-08 13:47:25 1627

原创 LLaMA:开放和高效的基础语言模型

我们介绍了LLaMA,这是一个参数范围从7B到65B的基础语言模型集合。我们在数以万亿计的标记上训练我们的模型,并表明有可能完全使用公开可用的数据集来训练最先进的模型,而不必求助于专有的和不可获取的数据集。

2024-07-08 13:45:32 805

原创 LangChain终极内幕指南,学会langchain就看它了

在人工智能迅速演进的时代,诸如Open AI的ChatGPT和Google的Bard等大型语言模型(LLMs)正彻底改变我们与技术互动的方式。这些技术巨头和SaaS公司正在竞相利用LLMs的威力,创造更为智能和实用的应用程序。

2024-07-05 10:57:22 1004

原创 【LLM大模型】LangChain从到入门到实战

LangChain是一项旨在赋能开发人员利用语言模型构建端到端应用程序的强大框架。它的设计理念在于简化和加速利用大型语言模型(LLM)和对话模型构建应用程序的过程。

2024-07-05 10:55:59 875

原创 LLM大模型时代,程序员当下如何应对 AI 的挑战

随着 AI 技术的飞速发展,特别是大模型的出现,传统的程序员角色正在经历深刻的变革,我们不得不重新对自己进行审视和思考。

2024-07-04 15:35:56 758

原创 从人工到自动化到AIOps再到ChatOps:大模型在运维领域的应用

在信息技术飞速发展的今天,运维工作已经从最初的人工操作,逐步演变为自动化、AIOps(人工智能运维)和ChatOps(通过聊天的方式去运维)。

2024-07-04 15:34:25 648

原创 一文教你读懂:LoRA实现大模型LLM微调

微调使我们能够将模型调整到目标领域和目标任务。然而,它在计算上可能非常昂贵-模型越大,更新其层的成本就越高。作为更新所有层的替代方法,已经开发了参数高效的方法,例如前缀调整和适配器。

2024-07-03 10:27:47 342

原创 基于LLM(Large Language Model,大语言模型)的智能问答系统

基于LLM(Large Language Model,大语言模型)的智能问答系统是一种利用先进的人工智能技术,尤其是自然语言处理(NLP)技术,来构建能够理解和回答用户问题的系统。这种系统通过训练大量文本数据,学习语言的规律和模式,从而能够理解和生成人类语言。

2024-07-03 10:26:18 295

原创 多模态大模型面对误导性问题:看懂图片也会答错,一骗就中招

多模态大语言模型(MLLMs)因其在视觉理解和推理方面的突出表现,例如生成详细的图像描述和回答复杂的问题等,逐渐成为近期AI研究的热点。

2024-07-02 11:57:37 856

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除