自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

小然的百宝盒

终身学习

  • 博客(28)
  • 收藏
  • 关注

转载 RAG实战 15 - RAG的自动源引文验证技术

一、RAG如何解决幻觉? 二、证据验证 三、代码实现 3.1 安装llmware包 3.2 使用Setup()命令来下拉一组数百个有用的示例文档,这些文档打包在llmware公共repo中

2024-01-15 18:59:05 244

转载 RAG实战14 - 利用LongContextRetriver克服RAG中的中间丢失现象

一、检索增强生成 二、实现更好的RAG系统以避免LIM(中间丢失)的技术 三、合并检索器 四、准备工作 五、代码实现 5.1 安装所需的包 5.2 导入所需的包 5.3 设置OpenAI Key 5.4 设置Embedding模型 5.5 数据处理 5.6 把文档split为块

2024-01-15 18:49:57 223

转载 RAG实战 13 - 利用MongoDB矢量搜索实现RAG高级检索

一、基本RAG 二、路径的细化:父子文档关系 2.1 步骤1:父子文档关系 2.2 步骤二:问答 三、MongoDB矢量搜索:高级RAG背后的动力 3.1 矢量搜索:快速寻找答案 3.2 结构与速度想结合 3.3 语境丰富性:增加的层次 3.4 MongoDB:不仅仅是一个数据库 3.5 结果:

2024-01-15 18:30:17 494

转载 RAG实战 12 - 在RAG管道中实现上下文压缩和过滤

LLM之RAG实战(十二)| 在RAG管道中实现上下文压缩和过滤 一、什么是上下文压缩? 二、上下文压缩中遵循的步骤 三、准备工作 四、代码实现 4.1 安装所需的依赖项 4.2 导入需要的包 4.3 设置Huggingafechub token 4.4 导入数据 4.5 设置文本切分器 4.6

2024-01-15 18:23:08 378

转载 RAG实战 11 - 使用Mistral-7B和Langchain搭建基于PDF文件的聊天机器人

一、LangChain简介 1.1 模型I/O模块 1.2 检索模块 1.3 链条模块 1.4 代理模块 1.5 记忆模块 1.6 回调模块 二、Mistral-7B 三、HuggingFace Embedding 四、chroma向量存储 五、pypdf库 六、实现代码

2024-01-15 17:28:14 348

转载 RAG实战10 - 构建一个RAG支持的聊天机器人(包括聊天、嵌入和重排序)

转载自:LLM之RAG实战(十)| 如何构建一个RAG支持的聊天机器人,包括聊天、嵌入和重排序在人工智能和机器学习不断发展的环境中,聊天机器人变得越来越复杂,从简单的转变为。在这篇博客文章中,我们将深入研究创建一个RAG支持的聊天机器人,该聊天机器人利用先进的NLP模型进行聊天、嵌入和重新排序,并使用进行高效的文档检索。

2024-01-15 16:08:47 419

转载 高级RAG 3 - 多文档RAG体系结构

一、Llamaindex结构化检索介绍 二、结构化层次检索的优点 三、结构化层次检索代码实现 步骤1:安装库 步骤2:导入库 步骤3:下载Github issues 步骤4:将数据加载到Weaviate Vector Store 步骤5:对原始文档建立Weaviate Index 步骤6:建立自动检索机制

2024-01-15 15:53:46 422

转载 RAG实战 8 - 使用Neo4j和LlamaIndex实现多模态RAG

转载自:LLM之RAG实战(八)| 使用Neo4j和LlamaIndex实现多模态RAG。 数据预处理对数据创建索引多模态RAG pipeline结论

2024-01-15 15:49:46 355 1

原创 RAG实战 7 - 使用llama_index实现多模态RAG

转载自:LLM之RAG实战(七)| 使用llama_index实现多模态RAG。

2024-01-14 16:39:20 1833 1

转载 RAG 2 - 选择最佳embedding和重排序模型

一、理解Retrieval Evaluation中的评估指标:二、设置环境三、设置Key四、下载数据五、加载数据六、生成问题上下文对七、自定义检索器八、评估九、结果十、分析embedding性能重排序的影响重排序的必要性:总体优势十一、结论参考文献

2024-01-14 16:26:18 834 1

转载 高级RAG 1 - 使用小块检索

一、基本RAG回顾步骤1:加载文档步骤2:将文档解析为文本块(节点)步骤3:选择embedding模型和LLM步骤4:创建索引、检索器和查询引擎二、高级方法1:较小的子块参照较大的父块步骤1:创建较小的子块步骤2:创建索引、检索器和查询引擎三、高级方法2:语句窗口检索步骤1:创建句子窗口节点解析器步骤2:创建查询引擎结论

2024-01-13 21:15:55 131 1

转载 RAG实战4 - Self-RAG 如何革命工业LLM

(1) SELF-RAG 的目标SELF-RAG 的设计使得任意的语言模型(LM)可以生成包含“反思tokens”(reflection tokens) 的文本。这些token来自于扩展的模型词汇(即,原始词汇加上反思tokens)。(2) 训练细节生成模型M是在一个经过筛选的语料库上进行训练的,该语料库包含由检索器R检索到的段落和由评判模型C预测的反思tokens。(3) 评判模型C它被训练用于生成反思tokens,这些tokens用于评估检索到的段落和给定任务的输出质量。

2024-01-13 20:57:31 311 1

转载 RAG实战 3:LlamaIndex解锁自定义LLM关键步骤分块、索引、查询介绍

LLamaIndex是一个由Jerry Liu创建的Python库,它可以使用语言模型对大型文档集进行高效的文本搜索和摘要。开发人员可以使用LLamaIndex 快速添加私有/自定义数据,以增强现有的LLM。它不需要对大模型进行再训练,即可提供个性化和数据驱动的响应。由于大模型的上下文有限,处理超大文档的成本很高,而通过对原始文本上进行关键词搜索的效率是非常低的。为了克服这些挑战,LLamaIndex采用了两种关键策略:首先,它将文档分为较小的上下文,如句子或段落,这些上下文被称为节点。

2024-01-13 20:14:57 740 1

转载 RAG实战2 - 使用LlamaIndex + Metaphor 实现知识工作自动化

Metaphor API旨在将你的LLM连接到互联网,它允许你在互联网上进行完全神经化、高度语义化的搜索,还可以从结果中获得干净的HTML内容。根据人们在互联网上谈论事物的方式,Metaphor 被训练来预测互联网上的链接。例如,有人可能会这样发布他们读到的一篇很棒的文章:通过训练一个模型来预测人们谈论这些链接的方式,最终的结果是一种完全不同的互联网搜索方式——就像你要分享你想要的链接一样进行搜索。虽然一开始有点不直观,但以这种方式搜索可以返回极高质量的结果。

2024-01-13 19:29:01 261 1

转载 RAG实战1 - 使用Mistral-7b, LangChain, ChromaDB搭建自己的WEB聊天界面

一、RAG介绍二、安装python环境以及相关的包三、导入相关包四、Mistral-7b模型介绍五、Embedding模型六、Prompt Template七、数据加载八、数据注入九、查询十、问答十一、基于Gradio搭建问答UI界面

2024-01-13 19:00:29 850 2

转载 RAG综述论文详解

大型语言模型(LLMs)在自然语言处理(NLP)领域的表现超越了之前任何模型。GPT系列模型、LLama系列模型、Gemini以及其他大型语言模型在多个评估基准上展现了卓越的语言和知识掌握能力,超越了人类水平。然而,大型语言模型也显示出许多缺点。它们常常制造虚假事实,在处理特定领域或高度专业化的查询时缺乏知识。例如,当所需信息超出模型训练数据的范围或需要最新数据时,LLM可能无法提供准确的答案。这一限制在将生成型人工智能部署到现实世界的生产环境中构成挑战,因为盲目使用黑盒LLM可能不够。

2024-01-12 11:19:09 281 1

转载 最全的RAG技术概览

介绍 基础RAG 高级RAG 1. 分块和向量化 1.1 分块 1.2 向量化 2.搜索索引 2.1向量存储索引 2.2 层次索引 2.3 假设性问题和HyDE 2.4 上下文增强 2

2024-01-11 16:16:02 414 1

转载 RAG综述论文详解(ArronAI)

LLM之RAG理论(二)| RAG综述论文详解 一、介绍 二、背景 2.1 定义 2.2 RAG与微调 三、RAG框架 3.1 Naive RAG 3.2 Advanced RAG 3.2.1 预检索过程 3.2.2 嵌入 微调嵌入

2024-01-10 19:11:45 201

转载 CHAIN-OF-NOTE - 笔记链提高RAG透明度

一、笔记链概述 二、阅读笔记的类型 三、笔记示例 3.1 类型1——直接回答: 3.2 类型2——有用上下文: 3.3 类型3——无关或未知: 四、训练模型 五、评估笔记链 六、个案研究 七、关键要点

2024-01-10 17:20:09 161

转载 面向生产的 LLM 优化

研究界不断提出新的、巧妙的方法来加速更大的 LLM 的推理。举个例子,一个颇有前景的研究方向是投机解码,其中“简单词元”是由更小、更快的语言模型生成的,而只有“难词元”是由 LLM 本身生成的。详细介绍超出了本文的范围,但可以阅读这篇不错的博文。GPT3/4、Llama-2-70b、Claude、PaLM 等海量 LLM 能够在或 ChatGPT 等聊天应用中快速运行的原因是很大一部分归功于上述精度、算法和架构方面的改进。

2024-01-03 18:53:29 81 1

转载 Transformers 中原生支持的量化方案概述

通过本文,我们比较了多种设置下的 bitsandbytes 和 GPTQ 量化。我们发现,bitsandbytes 更适合微调,而 GPTQ 更适合生成。(1) 使用 bitsandbytes 量化基础模型 (零样本量化)(2) 添加并微调适配器(3) 将训练后的适配器合并到基础模型或反量化模型之中!(4) 使用 GPTQ 量化合并后的模型并将其用于部署我们希望这个概述让每个人都能更轻松地将 LLM 应用至各自的应用场景中,我们期待看到大家用它构建自己的有趣应用!

2024-01-03 17:39:45 272 1

转载 2024车联网产业十大趋势:“技术、场景、运营”分层次持续迭代演进,“可信数据”和“普惠服务”实现商业运营闭环

一、技术趋势一1、分层建设逻辑协同的云控基础平台2、统筹布局车联网算力网络,实现算网一体共生发展3、“人/货-车-路-网-云-图/定位-安全”提供广义车联网服务二、技术趋势二1、多模网络提供“车-车-路-云”互相之间的有效连接2、多模网络提供各种类型业务场景的可靠保障3、多模网络向一网多能方向发展三、技术趋势三1、大模型时代下,构建车联网行业大模型和车联网细分场景模型2、车联网融合感知算法从后融合向特征级融合和前融合演进3、跨域融合感知算法提升感知性能四、技术趋势四1、“道路基础数

2024-01-03 15:21:34 908 1

转载 Hugging Face 年度回顾:2023,开源大模型之年

🍜 预训练大型语言模型的配方🗝️ 2022 年,从规模竞赛转向数据竞赛🌊 2023, 开放发布之年*小型* 大语言模型的崛起随处可见的对话模型社区的进展如何?开启定制模型的大门模型融合:极致的定制化参数高效微调:触手可及的个性化体验量化:模型普及于各处接下来呢?要点回顾

2024-01-03 11:26:40 91 1

转载 什么是第三代通用计算?

一、相比专用,通用是更高级别的能力1、牧本波动2、专用是临时的,通用是永恒的3、通用案例:智能手机4 通用案例:AGI大模型二、通用,是大芯片成功的必由之路1、越来越复杂的系统需要通用2、大芯片的高门槛需要通用3、云边端融合需要通用三、既通用又高性能的计算存在吗?1、系统存在“二八定律”‍2、团队分工协同,既通用又高效四、第三代通用计算1、基于异构协同视角的计算架构划分2、增加“通用”约束,形成通用计算架构3、最终的形态,为什么是异构融合而不是DSA?

2023-12-29 10:46:12 27 1

转载 软硬件共同定义:超异构开放生态

一、处理器类型:从CPU到ASIC1、CPU指令集架构ISA2、(CPU视角的)GPU架构3、ASIC专用处理引擎4、DSA领域专用架构5、小结:从CPU到ASIC,架构越来越碎片化二、计算架构:从异构到超异构1、CPU性能瓶颈,引发连锁反应2、异构计算存在的问题3、超异构存在的前提条件:复杂系统和超大规模4、从异构并行到超异构并行5、Intel:超异构、XPU和oneAPI6、Intel超异构分析7、NVIDIA自动驾驶 Thor8、为什么是现在?9、小结:超异构设计和开发

2023-12-29 10:45:24 100 1

转载 改进大模型需要微调还是RAG?微软最新论文告诉你谁更胜一筹

1、论文介绍2、评估大模型具备的知识3、大模型失败的原因4、改进方法1:微调4.1 有监督微调4.2 强化学习4.3 无监督微调5、改进方法2:检索增强生成(RAG)6、论文实验6.1 实验数据集6.2 对比模型6.3 实验结果

2023-12-29 10:37:04 612 1

转载 万字解读 | 汽车芯片的现状与展望

引言——中国车“芯”任重而道远1、汽车芯片是什么2、汽车芯片市场现状3、汽车芯片的细分领域3.1 主控芯片智能化的核心(1)MCU-控制指令运算的基础芯片(2)SoC-智能运算的大算力芯片3.2 功率半导体电动车的心脏3.3 传感器让电动车具备感知能力3.4 模拟芯片现实世界与数字世界的桥梁3.5 存储芯片海量数据背后的支柱4、汽车芯片的发展趋势

2023-12-29 09:52:05 303 2

转载 算力芯片,终局之战?

一、计算架构的发展趋势1、计算架构的发展阶段2、CPU同构,单个处理器,单个生态3、GPU异构,两个处理器,两个生态融合二、计算生态的极端重要性三、算力芯片,终局之战1、多异构融合,更多生态的融合2、异构融合,最后一场战役四、唯一可能的破局之道:开放1、异构融合计算,架构必须收敛2、除了最强者,开放是其他家的唯一选择3、开放,让大家回到同一起跑线

2023-12-28 16:14:47 276

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除