- 博客(569)
- 资源 (28)
- 收藏
- 关注
原创 从零实现深度学习框架【实现自己的PyTorch(已完结)】
本着“凡我不能创造的,我就不能理解”的思想,此系列文章会基于纯Python以及NumPy从零创建自己的深度学习框架,该框架类似PyTorch能实现自动求导。
2021-12-19 15:38:18
5344
原创 [论文粗读][REALM: Retrieval-Augmented Language Model Pre-Training
⭐ 为了以更可解释和模块化的方式捕捉知识,作者提出了REALM预训练框架,通过学习文本知识检索器来增强语言模型预训练算法。
2024-11-06 08:22:13
1021
原创 [论文粗读]HippoRAG: Neurobiologically Inspired Long-Term Memory for Large Language Models
⭐ 作者提出了HippoRAG,首先使用大语言模型将语料库转换为无模式知识图(KG)来模拟新皮层处理感知输入的能力,作为人工海马体索引。给定一个新的查询,HippoRAG识别查询中的关键概念,并在KG上运行个性化PageRank(PPR)算法,使用查询概念作为种子,以整合跨段落的检索信息。
2024-10-28 08:38:21
255
原创 [论文粗读]STRUCTRAG: BOOSTING KNOWLEDGE INTENSIVE REASONING OF LLMS VIA INFERENCE-TIME HYBRID INFORMATIO
⭐ 现有的RAG方法在知识密集型推理任务中存在困难,因为这些任务所需的有效信息严重分散。本篇工作受认知理论的启发,该理论认为人类在处理知识密集型推理时会将原始信息转换为各种结构化知识,提出了StructRAG框架,它可以识别当前任务的最佳结构类型,将原始文档重建为这种结构化格式,并根据生成的结构推断答案。
2024-10-24 08:23:32
1003
原创 [论文笔记]ColPali: Efficient Document Retrieval with Vision Language Models
⭐ 作者介绍了一种新的多模态检索框架ColPali,可以生成文本和图像的ColBERT类多向量表示,也引入后期交互计算每个查询标记和文档标记之间的交互,最终得到一个分数可用于检索排名。
2024-10-23 08:35:36
244
1
原创 [论文笔记]HERMES 3 TECHNICAL REPORT
⭐ 本篇工作提出了如何良好地训练base模型提供指令遵循和函数调用能力,其提出的函数调用格式启发了vLLM和Ollama等支持工具调用。
2024-10-19 14:24:52
742
原创 [论文笔记]RA-DIT: RETRIEVAL-AUGMENTED DUAL INSTRUCTION TUNING
⭐ 作者提出了一种检索增强微调的方法,为语言模型和检索器进行微调。引导LLM最佳地利用检索到的信息并忽略干扰内容。
2024-10-18 08:42:17
868
原创 [论文笔记]Improving the Domain Adaptation of Retrieval Augmented Generation (RAG) Models for Open Domain
⭐ 作者提出对检索器和生成器进行联合训练来完成QA任务和领域自适应,通过微调RAG模型及其检索器,同时在训练期间异步更新知识编码。
2024-10-17 08:52:40
951
原创 [论文笔记]Active Retrieval Augmented Generation](Active Retrieval Augmented Generation
⭐ 在RAG长文本的生成过程中,作者提出主动检索增强生成的方法,首先开始回复问题,如果LLM对于生成的句子不太确信,则使用它作为查询检索相关文档,然后根据检索到的文档重新生成下一句话,直到生成结束。
2024-10-12 22:24:46
974
原创 [论文笔记]ColBERT: Eficient and Effective Passage Search via Contextualized Late Interaction over BERT
⭐ ColBERT引入了一种晚期交互(late interaction)架构,该架构使用BERT独立编码查询和文档,然后采用一种廉价但强大的交互步骤来建模它们的细粒度相似性。通过推迟这种细粒度的交互,ColBERT能够利用深度语言模型的表达能力,同时获得离线预计算文档表示的能力,从而显著加快查询处理速度。
2024-10-11 08:34:35
617
1
原创 [论文笔记]DAPR: A Benchmark on Document-Aware Passage Retrieval
⭐ 作者提出了可以直接将长文本的全局文本信息拼接到切分后的文本块前面。全局文本信息有(1) 文档的标题 (2) 文档的关键短语,使用TopicRank算法抽取 (3) 共指解析,通过跨段共指解析消解来处理文本块中的代词。
2024-10-10 08:49:16
1028
原创 [论文笔记]SGPT: GPT Sentence Embeddings for Semantic Search
⭐ 作者提出了利用仅编码器的类GPT架构来产生句子嵌入以支持语义检索和其他嵌入任务。在Bi-Encoder设置中,使用位置加权平均池化来得到具有语义信息的句子嵌入。在Cross-Encoder设置中,提取预训练GPT模型的对数概率产生无监督结果。
2024-10-03 21:37:19
1570
2
原创 如何处理模型API速率限制
当我们访问大模型相关的API服务时,通常会遇到速率限制(即限流),它用于防止用户向某个API发送大量请求,防止请求过载,确保每个人都能公平地访问API。
2024-09-16 18:33:56
1188
原创 [论文笔记]MEMORAG: MOVING TOWARDS NEXT-GEN RAG VIA MEMORY-INSPIRED KNOWLEDGE DISCOVERY
⭐ 作者提出了MemoRAG,一种通过长期记忆增强的检索增强生成新范式。它使用轻量且长上下文的LLM构建全局记忆,用于生成上下午相关的线索。用另一个表达力强的LLM,根据检索到的信息生成最终答案。
2024-09-12 20:36:01
1561
1
原创 [论文笔记]ChatQA: Surpassing GPT-4 on Conversational QA and RAG
⭐ 作者介绍了 ChatQA,一种两阶段指令微调方法,提高了 RAG 的表现。还引入了一种针对多轮对话 QA 优化的密集检索器。
2024-09-11 21:00:00
1908
5
原创 [论文笔记]RankRAG: Unifying Context Ranking with Retrieval-Augmented Generation in LLMs
⭐ 作者提出了一种新的两阶段指令微调框架RankRAG,该框架对LLM进行指令微调,以实现RAG中上下文排名和答案生成的双重目的。阶段一利用SFT对高质量指令跟随数据集进行微调,阶段二对LLM进行检索增强生成和上下文排名的指令微调。
2024-09-10 18:33:32
1020
原创 [论文笔记]QLoRA: Efficient Finetuning of Quantized LLMs
⭐ 作者提出了QLoRA,一种高效的微调方法,它在减少内存使用的同时保持16位微调任务的完整性能。这是通过:4位NormalFloat、双重量化(对量化常数进行量化)、分页优化器(GPU内存不足的情况下,自动进行CPU和GPU之间的页面传输)来管理内存峰值实现的。微调时冻结**4位量化预训练语言模型**而向低秩适配器(LoRA)反向传播梯度。
2024-09-07 22:44:46
2123
2
原创 [论文笔记]LLM.int8(): 8-bit Matrix Multiplication for Transformers at Scale
⭐ 作者开发了一个两部分量化程序LLM.int8()。首先使用向量级量化,对矩阵乘法中的每个内积使用单独的归一化常数,从而对大多数特征进行量化。然而,对于突现的异常值(outlier),还包括了一种新的混合精度分解方案,将异常特征维度隔离到16位矩阵乘法中,同时仍然有99.9%以上的值在8位中进行乘法运算。
2024-09-07 17:48:37
1481
原创 [论文笔记]Making Large Language Models A Better Foundation For Dense Retrieval
⭐ 本工作提出了LLaRA,该方法作为对 LLM 进行后处理适应以用于密集检索应用。LLaRA 包含两个前置任务: LLM 的文本嵌入分别用于重构输入句子的词元和预测下一个句子的词元。通过这种方式旨在捕捉输入文本本身和下一句的全局语义,从而使LLM变成一个有效的密集检索器。
2024-09-06 08:16:53
1795
1
原创 [论文笔记]Circle Loss: A Unified Perspective of Pair Similarity Optimization
⭐ 作者提出了 Circle 损失,这是一种简单的深度特征学习损失函数。通过对每个相似度得分进行加权,Circle 损失使深度特征学习受益于灵活的优化和明确的收敛目标。
2024-09-04 19:30:00
781
原创 Sentence-BERT实现文本匹配【对比损失函数】
还是基于Sentence-BERT架构,或者说Bi-Encoder架构训练嵌入模型,但是本文使用的是对比损失函数。
2024-09-04 09:48:03
1561
原创 [论文笔记]Dimensionality Reduction by Learning an Invariant Mapping
⭐ 作者提出了一个对比学习损失函数,可以应用于带标签的文本对上,但是其负样本(不相似)对生成的方法比较暴力——样本数量的平方级别。
2024-09-04 09:08:57
775
原创 Sentence-BERT实现文本匹配【回归目标函数】
我们通过Sentence-Bert提出的分类目标函数来训练句子嵌入模型,本文同样基于Sentence-Bert的架构,但改用回归目标函数。
2024-09-03 14:32:10
1171
原创 Sentence-BERT实现文本匹配【分类目标函数】
本文实战Sentence-BERT提出的如何训练嵌入模型的方法,主要是基于句子对的分类目标函数实现。
2024-09-03 14:29:49
1763
原创 [论文笔记]RAFT: Adapting Language Model to Domain Specific RAG
⭐ 本篇工作提出了一种检索增强微调方法RAFT,可以提高模型在开卷领域内问答的能力。在训练RAFT时,给定一个问题和一组检索到的文档,训练模型忽略那些在回答问题时无用的干扰文档。RAFT通过逐字引用相关文档中的正确序列来帮助回答问题,同时结合RAFT的思维链式响应,帮助提高模型的推理能力。
2024-09-03 08:02:39
828
原创 [论文笔记]Rethink Training of BERT Rerankers in Multi-Stage Retrieval Pipeline
⭐ 作者提出了一种局部对比估计方法用于训练重排序器,即首先通过一阶段的检索器来选择负样本,然后与正样本做对比学习,有效防止模型训崩。
2024-08-27 20:30:00
306
原创 [论文笔记]Improving Retrieval Augmented Language Model with Self-Reasoning
⭐ 作者提出了一种新颖的自我推理框架,其核心思想是利用LLM自身生成的推理轨迹。该框架包括三个过程来构建自我推理轨迹:关注相关性的过程、证据选择性过程、一个轨迹分析过程。基于GPT4生成了2000个高质量的训练样本,提出了一种阶段性训练过程基于这些样本训练自我推理生成模型,声称效果很好,但是训练样本和训练好的模型都没有公开出来。
2024-08-21 22:49:00
960
原创 [论文笔记]Reciprocal Rank Fusion outperforms Condorcet and individual Rank Learning Methods
⭐ 作者提出了倒数排名融合(RRF)的简单方法,但是效果超过了逼他复杂得多的方法,仅是考虑每个系统中排名的倒数(计算倒数时先增加一个固定的偏移量k,防止异常值影响)。可以尝试用在粗牌之后精排之前,或者看是否能替代精排。
2024-08-16 19:45:00
1090
2
原创 [论文笔记]ZeRO: Memory Optimizations Toward Training Trillion Parameter Models
⭐ 主要介绍了DeepSpeed框架用到的零冗余优化器(ZeRO)技术,使得训练万亿级别参数的大模型成为了可能。通过ZeRO-DP优化模型状态,通过ZeRO-R优化剩余状态。
2024-08-15 21:19:26
1279
原创 [论文笔记]vLLM: Efficient Memory Management for Large Language Model Serving with PagedAttention
⭐ 作者提出了PagedAttention,受到传统虚拟内存和操作系统中分页技术启发的注意力算法。并在此基础上构建了vLLMLLM服务系统。定义KV块的概念,对应操作系统中的分页,一个KV块默认包含16个K/V向量,通过动态分配的机制最多只浪费了15个向量对应的内存,实现逻辑块和物理块的分离,物理上虽然不连续但逻辑上是连续的,通过块表维护逻辑块和物理块之间的映射。同时通过引用计数和写时复制的技术来支持物理块共享,进一步提高了空间的利用率,从而提高了批处理大小,增大了吞吐量。
2024-08-10 14:17:31
1316
原创 [论文笔记]BM25S:Python打造超越RANK-BM25的实现
首先介绍了一种新的计算 BM25 分数的方法,速度远超RANK-BM25(BM25Okapi)。最后通过代码实战中文上的表现。
2024-08-08 19:16:22
1636
原创 [论文笔记]思维链提示的升级版——回退提示
⭐ 作者提出了回退提示技术,使大模型能够进行抽象,从包含具体细节的实例中推导出高层次的概念和基本原则。通过利用这些概念和原则来指导推理,LLMs显著提高了按照正确推理路径解决问题的能力。
2024-07-30 19:09:12
538
1
原创 [论文笔记]一种超越思维链的提示策略——少到多提示
⭐ 作者提出了一种超越思维链的提示策略——从最少到最多,关键思想是将复杂问题分解为一系列较简单的子问题,然后按依次解决它们。后面子问题的解决可以依赖前面解决的子问题的答案。
2024-07-26 19:07:29
1034
1
原创 [论文笔记]LangGPT: Rethinking Structured Reusable Prompt Design Framework for LLMs from the Programming
⭐ 作者提出了基于双层结构的提示设计框架,还提供了基于LangGPT的常见场景的通用提示模板。重要的是上线了一个在线社区,其中包含很多提示案例可以来学习参考。
2024-07-16 19:34:03
988
原创 [论文笔记]构建基于RAG聊天机器人的要素
⭐ 作者来自英伟达的团队,介绍了他们在构建企业级RAG聊天机器人的经验。提出了FACTS这5个要注意的方面以及15个可提升性能的控制点。是一篇偏实战的工作,值得仔细研读。
2024-07-12 20:30:00
957
原创 [论文笔记]涨点近5%! 以内容中心的检索增强生成可扩展的级联框架:Pistis-RAG
⭐ 作者提出了一个新颖的框架,以内容为中心。该框架包括不同的阶段:匹配、预排名、排名、多路径推理和聚合。其中包含了很多工程细节,值得参考。但没有看到总体耗时相关的描述以及整体代码,可能耗时会相对较长。
2024-07-11 08:29:34
995
2
原创 [论文笔记]RAPTOR: RECURSIVE ABSTRACTIVE PROCESSING FOR TREE-ORGANIZED RETRIEVAL
⭐ 作者引入了一种新颖的方法,递归嵌入、聚类和总结文本片段,从底部开始构建具有不同摘要级别的树。在推理期间,首先将这棵树拉平,然后从拉平的树节点中检索,将跨不同抽象级别的庞大文档中的信息整合起来。
2024-07-10 20:54:17
2034
3
英文-中文机器翻译数据集
2022-07-21
bert_sentence_classification.7z
2021-09-25
词性标注traindata.rar
2020-08-29
RocketMQ实战与原理解析【清晰版】
2018-11-03
Java网络编程第4版英文版
2018-07-03
Dubbo与Zookeeper、SpringMVC整合和使用
2017-05-13
安卓实现选择联系人
2014-09-08
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅