自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 资源 (5)
  • 收藏
  • 关注

原创 LLM与RAG的初识-6

随着技术的发展,Flare和Self-RAG等自适应检索方法,已经被提出并优化了RAG检索过程,使LLM能够主动判断检索的时机和内容,帮助提高检索信息的效率和相关性。通过迭代检索和自适应检索的应用,LLM可以更有效地处理复杂和多维度的问题,同时避免无效或不相关信息的干扰,从而提高生成内容的准确性和相关性。总的来说,在微调过程中,研究者可以根据特定的需求和数据格式定制模型,与预训练阶段相比,这降低了资源消耗,同时保留了调整模型输出风格的能力。不同的数据源提供了不同的知识粒度和维度,需要不同的处理方法。

2024-03-25 00:47:34 646 1

原创 LLM与RAG的初识-5

在RAG(检索增强生成)框架中,生成器扮演着至关重要的角色,它负责将检索到的信息转换成自然流畅的文本回答。在RAG中,生成器的输入不仅包括传统的上下文信息,还包括通过检索器获得的相关文本段落,这使得生成器能够更好地理解问题背后的上下文,并产生更丰富信息的回应。一般优化过程指的是包含(输入,输出)对的训练数据,旨在训练模型在给定输入x的情况下生成输出y的能力。在Cheng等人的工作中,采用了一种相对经典的训练过程,即给定输入x,检索相关文档z(论文中选择Top-1),整合(x,z)后,模型生成输出y。

2024-03-25 00:46:19 668 1

原创 LLM与RAG的初识-4

在RAG(检索增强生成)框架中,"R"代表检索。它在RAG管道中的作用是从庞大的知识库中检索出最相关的前k个文档。然而,构建一个高质量的检索器并非易事。

2024-02-27 09:18:03 936

原创 LLM与RAG的初识-3

模块化RAG结构打破了传统的原始RAG框架,提供了更大的多样性和整个过程的灵活性。通过先进的索引方法、更精细的检索策略和有效的后处理方法来优化RAG的性能。它采用不同的检索技术组合,适应不同的查询类型和信息需求,确保一致地检索到最相关和上下文丰富的信息。对于原始RAG而言,这种框架提供了适应性和丰富性。对检索到的信息进行重新排序,将最相关的信息放置在提示的边缘,以及通过压缩不相关的上下文、突出关键段落和减少总体上下文长度来提高RAG性能。这些改进涉及检索生成的质量、索引的优化、检索过程的优化等多个方面。

2024-02-27 09:09:36 963

原创 LLM与RAG的初识-2

RAG的这种设计允许它从外部知识源检索相关信息,增强大型语言模型生成精确、准确且上下文丰富的答复的能力。其主要职责是从一个庞大的知识库中检索出与输入查询最相关的信息片段。检索器的目标是确保检索到的信息与用户查询高度相关,从而为生成器提供准确和丰富的输入。生成器的作用则是将检索器提供的信息片段整合成流畅、连贯的文本。它利用这些信息片段来指导、优化和丰富生成过程,从而生成既准确又具有信息量的文本。生成器通常是一个大型语言模型,它能够理解和使用检索到的信息片段来生成与用户查询紧密相关的文本。

2024-02-23 17:28:01 855 1

原创 LLM与RAG的初识-1

检索增强生成(Retrieval-Augmented Generation, RAG)是一种结合了信息检索和文本生成技术的自然语言处理(NLP)方法。这种方法利用大型语言模型(LLM)的生成能力,并结合了检索系统从大量数据中检索相关信息的能力。RAG的目标是生成既准确又具有信息量的文本,同时确保生成的文本与给定的查询或任务紧密相关。通过检索与输入查询最相关的信息片段,然后使用这些片段来指导、优化和丰富生成过程,RAG提高了生成文本的准确性和相关性。

2024-02-23 17:05:33 899 1

原创 千帆杯-贺岁灵感模型--Preliminary attempt

生成一个可制作贺岁文案内容的精调模型(限定使用ERNIE Speed,通过对模型精调使其保持原有能力的同时,具备准确理解并执行文案创作中创作长度相关指令的能力)。

2024-02-20 11:41:09 2034 2

原创 强化学习笔记-免模型预测

在有模型强化学习中,智能体尝试先学习环境模型,该模型可以是环境的动态或奖励函数。换句话说,给定一对状态-动作,它可以预测下一个状态或产生的奖励。利用这个环境模型,智能体可以计划最佳的行动策略,例如通过模拟可能的未来状态来预测哪个动作会导致最大的累积奖励。模型强化学习的优点是可以在不与真实环境交互的情况下进行学习,因此可以节省实验的成本。但缺点是,这种模型往往难以精确表现环境或者由于复杂度太高而难以学习和计算。相比之下,免模型强化学习则直接学习在特定状态下执行特定动作的价值或优化策略。

2023-12-21 08:28:19 889

原创 强化学习笔记-马尔可夫决策过程

以数学的形式来描述智能体在与环境交互的过程中学到一个目标的过程。智能体充当的是作出决策或动作,并且在交互过程中学习的角色,环境指的是智能体与之交互的一切外在事物,不包括智能体本身。

2023-12-21 08:27:27 1510

原创 强化学习笔记-基本概念与方向

离线强化学习( offline reinforcement learning ),即在离线环境中进行训练,然后将训练好的模型部署到在线环境中进行决策。在探索的过程中,智能体会尝试一些未知的动作,从而可能会获得更多的奖励,但同时也可能会遭受到惩罚。而在利用的过程中,智能体会选择已知的动作,从而可能会获得较少的奖励,但同时也可能会遭受较少的惩罚。在实际应用中,智能体往往需要在实时或者在线环境中进行决策,在这种情况下训练不仅会降低效率(实时环境响应动作更慢),而且还会带来安全隐患(训练过程中可能会出现意外)。

2023-12-15 16:53:40 41

原创 [Datahub]元数据管理平台的部署(踩坑)经历

Datahub的部署与测试

2023-11-24 17:45:51 581

原创 Huffman编码、Shannon编码、Fano编码——《小王子》文本压缩与解压

Huffman编码、Shannon编码、Fano编码——《小王子》文本压缩与解压

2022-07-08 11:44:52 2770 4

基于python编程的简易圣诞树绘制源码

圣诞树代码编程python。 基于python语言开发,使用turtle库进行绘制。压缩文件中包含完整的代码,主要来自线上开源内容的整理,包括6个python代码实现。

2023-12-21

Python程序设计基础与实战(微课版)代码源码

Python程序设计基础与实战(微课版)代码源码,内有1-20章的代码

2023-12-21

《小王子》文本压缩与解压(Matlab)

1 采用熵编码对《小王子》文本进行压缩,生成压缩文件; 2 将压缩文件解压,并与源文件比较; 3 从香农编码、Huffman编码、Fano编码中选择一种; 4 计算编码效率,并与理论值对比,分析差异原因。 编码思路分析: 1. Huffman编码 2. Shannon编码 3. Fano编码 4. APP搭建

2023-04-18

智能停车收费系统数据流程图和数据字典

智能停车场收费系统数据流程图 智能停车场收费系统数据字典 1数据流词条 2数据元素词条 3数据文件词条 4加工词条 5外部实体

2022-07-08

数字传输与接入技术—无源光网络

随着人们对光纤接入技术的进一步深入研究,无源光网络(PON)逐渐走入人们的视野。本文从无源光网络的基本原理入手,介绍了ATM无源光网络(APON),以太无源光网络(EPON),千兆无源光网络(GPON),波分复用无源光网络(WDN-PON),并指出其关键技术和系统特点,并进行较为全面的比较。同时,介绍了PON技术特点和发展方向。

2022-07-08

交通规划—城市用地功能组织和布局分析实验(实验报告5500字+CAD结果图)

以北京交通大学及魏公村路口、白石新桥、西直门桥、明光桥范围内所在区域为例分析: 一、实验区域的基本情况 二、实验区域的城市用地分布图 三、实验区域城市用地比例构成 四、实验区域用地相互关系评价及依据 五、实验区域用地组成存在问题及改进建议 报告5500字

2022-07-08

射频原理与应用—毫米波雷达天线(透镜天线)

近年来,随着人们对行车安全和自动驾驶的需求日益增长,具备主动安全技术的高级辅助驾驶系统发展迅速。随着汽车雷达系统的大规模应用,汽车安全性能得到极大提升,这也有效降低了汽车碰撞事故的发生概率。毫米波天线是汽车雷达系统中实现电磁波信号辐射和接收的重要元件,其辐射性能的优劣将直接影响雷达系统的探测效果。 本次研究性学习的研究主题为毫米波汽车雷达天线。毫米波天线作为汽车雷达系统中实现电磁波信号辐射与接受的重要元件,其辐射性能的优劣将直接影响到汽车雷达系统对障碍物的探测结果。毫米波天线主要有喇叭天线、透镜天线、微带天线阵列。本文主要介绍的是透镜天线的研究背景、研究现状、基本原理和种类,以及以某一个特定透镜天线单元为例,分析了该天线的工作频率、辐射分布和天线增益等。

2022-07-08

交通安全工程—我国交通安全现状分析及改进建议(7500字+16图表)

2006年至2020年是我国道路交通运输基础设施建设和汽车保有量快速发展的重要时期。从近十几年来我国交通事故发生数量来看,道路交通事故发生量呈现先降后升再降趋势,于2015年事故发上量达历史低点,后再次出现反弹,2018年事故发生数甚至超过十年前的统计水平,直接财产损失进一步增高,死亡人数到达峰值,这与近年来我国汽车保有增长和驾驶人的违法驾驶密切相关,虽然2018年之后道路交通事故数量有所下降,但也不排斥是由于疫情原因人们出行次数减少使事故数量减少,所以对于道路安全问题依旧应引起足够重视。现结合近年我国交通事故统计数据,对发生交通事故情况进行分析,分析其时间、空间分布特征,对比不同性别、年龄发生交通事故的概率,在此基础上分析事故产生原因,最后结合我国道路安全实际情况提出建议。

2022-07-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除