愤怒的可乐-CSDN博客

⭐ 作者提出了QLoRA，一种高效的微调方法，它在减少内存使用的同时保持16位微调任务的完整性能。这是通过：4位NormalFloat、双重量化(对量化常数进行量化)、分页优化器(GPU内存不足的情况下，自动进行CPU和GPU之间的页面传输)来管理内存峰值实现的。微调时冻结**4位量化预训练语言模型**而向低秩适配器(LoRA)反向传播梯度。

2024-09-07 22:44:46 1981 2

原创 [论文笔记]LLM.int8(): 8-bit Matrix Multiplication for Transformers at Scale

⭐ 作者开发了一个两部分量化程序LLM.int8()。首先使用向量级量化，对矩阵乘法中的每个内积使用单独的归一化常数，从而对大多数特征进行量化。然而，对于突现的异常值(outlier)，还包括了一种新的混合精度分解方案，将异常特征维度隔离到16位矩阵乘法中，同时仍然有99.9%以上的值在8位中进行乘法运算。

2024-09-07 17:48:37 1360

原创 Sentence-BERT实现文本匹配【CoSENT损失】

目前最流行的文本嵌入训练方法CoSENT详细介绍！

2024-09-06 09:03:07 998

原创 [论文笔记]Making Large Language Models A Better Foundation For Dense Retrieval

⭐ 本工作提出了LLaRA，该方法作为对 LLM 进行后处理适应以用于密集检索应用。LLaRA 包含两个前置任务： LLM 的文本嵌入分别用于重构输入句子的词元和预测下一个句子的词元。通过这种方式旨在捕捉输入文本本身和下一句的全局语义，从而使LLM变成一个有效的密集检索器。

2024-09-06 08:16:53 1731 1

原创 [论文笔记]Circle Loss: A Unified Perspective of Pair Similarity Optimization

⭐ 作者提出了 Circle 损失，这是一种简单的深度特征学习损失函数。通过对每个相似度得分进行加权，Circle 损失使深度特征学习受益于灵活的优化和明确的收敛目标。

2024-09-04 19:30:00 675

原创 Sentence-BERT实现文本匹配【对比损失函数】

还是基于Sentence-BERT架构，或者说Bi-Encoder架构训练嵌入模型，但是本文使用的是对比损失函数。

2024-09-04 09:48:03 1507

原创 [论文笔记]Dimensionality Reduction by Learning an Invariant Mapping

⭐ 作者提出了一个对比学习损失函数，可以应用于带标签的文本对上，但是其负样本(不相似)对生成的方法比较暴力——样本数量的平方级别。

2024-09-04 09:08:57 724

原创 Sentence-BERT实现文本匹配【回归目标函数】

我们通过Sentence-Bert提出的分类目标函数来训练句子嵌入模型，本文同样基于Sentence-Bert的架构，但改用回归目标函数。

2024-09-03 14:32:10 1106

原创 Sentence-BERT实现文本匹配【分类目标函数】

本文实战Sentence-BERT提出的如何训练嵌入模型的方法，主要是基于句子对的分类目标函数实现。

2024-09-03 14:29:49 1657

原创 [论文笔记]RAFT: Adapting Language Model to Domain Specific RAG

⭐ 本篇工作提出了一种检索增强微调方法RAFT，可以提高模型在开卷领域内问答的能力。在训练RAFT时，给定一个问题和一组检索到的文档，训练模型忽略那些在回答问题时无用的干扰文档。RAFT通过逐字引用相关文档中的正确序列来帮助回答问题，同时结合RAFT的思维链式响应，帮助提高模型的推理能力。

2024-09-03 08:02:39 705

原创 [论文笔记]Rethink Training of BERT Rerankers in Multi-Stage Retrieval Pipeline

⭐ 作者提出了一种局部对比估计方法用于训练重排序器，即首先通过一阶段的检索器来选择负样本，然后与正样本做对比学习，有效防止模型训崩。

2024-08-27 20:30:00 227

原创 [论文笔记]Improving Retrieval Augmented Language Model with Self-Reasoning

⭐ 作者提出了一种新颖的自我推理框架，其核心思想是利用LLM自身生成的推理轨迹。该框架包括三个过程来构建自我推理轨迹：关注相关性的过程、证据选择性过程、一个轨迹分析过程。基于GPT4生成了2000个高质量的训练样本，提出了一种阶段性训练过程基于这些样本训练自我推理生成模型，声称效果很好，但是训练样本和训练好的模型都没有公开出来。

2024-08-21 22:49:00 880

原创 [论文笔记]Reciprocal Rank Fusion outperforms Condorcet and individual Rank Learning Methods

⭐ 作者提出了倒数排名融合(RRF)的简单方法，但是效果超过了逼他复杂得多的方法，仅是考虑每个系统中排名的倒数(计算倒数时先增加一个固定的偏移量k，防止异常值影响)。可以尝试用在粗牌之后精排之前，或者看是否能替代精排。

2024-08-16 19:45:00 1023 2

原创 [论文笔记]ZeRO: Memory Optimizations Toward Training Trillion Parameter Models

⭐ 主要介绍了DeepSpeed框架用到的零冗余优化器(ZeRO)技术，使得训练万亿级别参数的大模型成为了可能。通过ZeRO-DP优化模型状态，通过ZeRO-R优化剩余状态。

2024-08-15 21:19:26 1213

原创 [论文笔记]vLLM: Efficient Memory Management for Large Language Model Serving with PagedAttention

⭐ 作者提出了PagedAttention，受到传统虚拟内存和操作系统中分页技术启发的注意力算法。并在此基础上构建了vLLMLLM服务系统。定义KV块的概念，对应操作系统中的分页，一个KV块默认包含16个K/V向量，通过动态分配的机制最多只浪费了15个向量对应的内存，实现逻辑块和物理块的分离，物理上虽然不连续但逻辑上是连续的，通过块表维护逻辑块和物理块之间的映射。同时通过引用计数和写时复制的技术来支持物理块共享，进一步提高了空间的利用率，从而提高了批处理大小，增大了吞吐量。

2024-08-10 14:17:31 1163

原创 [论文笔记]BM25S：Python打造超越RANK-BM25的实现

首先介绍了一种新的计算 BM25 分数的方法，速度远超RANK-BM25(BM25Okapi)。最后通过代码实战中文上的表现。

2024-08-08 19:16:22 1248

原创 [论文笔记]思维链提示的升级版——回退提示

⭐ 作者提出了回退提示技术，使大模型能够进行抽象，从包含具体细节的实例中推导出高层次的概念和基本原则。通过利用这些概念和原则来指导推理，LLMs显著提高了按照正确推理路径解决问题的能力。

2024-07-30 19:09:12 470 1

原创 [论文笔记]一种超越思维链的提示策略——少到多提示

⭐ 作者提出了一种超越思维链的提示策略——从最少到最多，关键思想是将复杂问题分解为一系列较简单的子问题，然后按依次解决它们。后面子问题的解决可以依赖前面解决的子问题的答案。

2024-07-26 19:07:29 968 1

原创 [论文笔记]LangGPT: Rethinking Structured Reusable Prompt Design Framework for LLMs from the Programming

⭐ 作者提出了基于双层结构的提示设计框架，还提供了基于LangGPT的常见场景的通用提示模板。重要的是上线了一个在线社区，其中包含很多提示案例可以来学习参考。

2024-07-16 19:34:03 959

原创 [论文笔记]构建基于RAG聊天机器人的要素

⭐ 作者来自英伟达的团队，介绍了他们在构建企业级RAG聊天机器人的经验。提出了FACTS这5个要注意的方面以及15个可提升性能的控制点。是一篇偏实战的工作，值得仔细研读。

2024-07-12 20:30:00 906

原创 [论文笔记]涨点近5%! 以内容中心的检索增强生成可扩展的级联框架:Pistis-RAG

⭐ 作者提出了一个新颖的框架，以内容为中心。该框架包括不同的阶段：匹配、预排名、排名、多路径推理和聚合。其中包含了很多工程细节，值得参考。但没有看到总体耗时相关的描述以及整体代码，可能耗时会相对较长。

2024-07-11 08:29:34 957 2

原创 [论文笔记]RAPTOR: RECURSIVE ABSTRACTIVE PROCESSING FOR TREE-ORGANIZED RETRIEVAL

⭐ 作者引入了一种新颖的方法，递归嵌入、聚类和总结文本片段，从底部开始构建具有不同摘要级别的树。在推理期间，首先将这棵树拉平，然后从拉平的树节点中检索，将跨不同抽象级别的庞大文档中的信息整合起来。

2024-07-10 20:54:17 1659 2

原创 [论文笔记]Mixture-of-Agents Enhances Large Language Model Capabilities

⭐ 作者提出了一种混合多个智能体的方法，通过多层的设计，最终层给出输出。取得了较好的效果，但成本和响应时间也增加很多。在仅需要高质量回复的场景下可以使用。

2024-06-25 18:29:34 1125 1

原创 [论文笔记]Are Large Language Models All You Need for Task-Oriented Dialogue?

⭐ 作者测试了基于LLM做领域识别、状态追踪和响应生成。但是状态追踪的效果不好，如果想用LLM做TOD需要额外加入状态追踪逻辑。

2024-06-17 19:11:57 1255 1

原创 LangGraph核心概念

介绍LangGraph核心概念。

2024-06-14 22:47:18 1128

原创 [论文笔记]Query Rewriting for Retrieval-Augmented Large Language Models

⭐ 作者提出了可在查询之前先应用LLM作为重写器对问题进行重写，然后再走RAG的流程。同时也提出了可以训练一个小模型来作为重写器。但博主对该小模型的泛化能力存疑。建议还是通过在提示词中给一些示例，让LLM进行重写。

2024-06-11 20:01:52 1532 1

原创 [论文笔记]AIOS: LLM Agent Operating System

⭐ 作者借鉴操作系统的知识，把LLM多智能体的协作看成是一个操作系统，包括短期的内存(记忆)管理器和长期的存储管理器、智能体调度器、访问管理器等。

2024-06-07 22:47:09 1586 2

原创 [论文笔记]KwaiAgents: Generalized Information-seeking Agent System with Large Language Models

⭐ 作者提出了KwaiAgents，由三个部分组成。(1)KAgentSys，一个自主代理循环，集成了存储库、工具库、任务规划和结束模块。(2)KAgentLMs，一套不断微调以增强代理能力的开源LLMs，可以帮助6B-13B的大模型具有较好的代理能力。(3)KAgentBench，一个评估LLMs在不同能力下对不同代理系统的响应性能的基准测试。

2024-06-05 20:51:37 1127

原创 [论文笔记]Plan-and-Solve Prompting: Improving Zero-Shot Chain-of-Thought Reasoning by Large Language Mod

⭐ 为了解决思维链应用中的计算错误、缺失推理步骤错误和语义理解错误。作者引入了计划与解决提示策略。引导大语言模型制定一个将整个任务分解为较小子任务的计划，并根据计划执行子任务，从而达到更好的效果。

2024-06-05 20:45:46 837 1

原创 [论文笔记]Mixtral of Experts

⭐ 作者提出了Mixtral-8x7B，是一种稀疏的混合专家模型，通过门控机制来选择专家(MoE层)，每个时间步只激活少量的专家，可以加快推理计算，但实际上要存储所有的参数所需的资源也是不少的。

2024-06-05 20:43:49 1052

原创 [论文笔记]Mistral 7B

⭐ 作者提出了Mistral模型，相比LLaMA引入一些改动：滑动窗口注意力、滚动缓存以及预填充和分块。不管是基础模型还是指令微调模型效果都比较优秀。

2024-06-04 00:07:40 1513 1

原创 [论文笔记]MemGPT: Towards LLMs as Operating Systems

⭐ 作者受传统操作系统中层次化内存系统的启发，提出了虚拟上下文管理技术，通过在物理内存和磁盘之间进行分页，提供无限上下文的错觉。

2024-05-31 18:27:38 1306 2

原创 Llama改进之——分组查询注意力

本文介绍了分组查询注意力的实现以及如何应用旋转位置编码到分组查询注意力上。

2024-05-31 18:26:29 1825

Transformer机器翻译数据集

机器翻译数据集，使用教程 https://helloai.blog.csdn.net/article/details/135344697

2024-01-03

英文-中文机器翻译数据集

中英文翻译数据集： Anyone can do that. 任何人都可以做到。 How about another piece of cake? 要不要再來一塊蛋糕？ She married him. 她嫁给了他。 I don't like learning irregular verbs. 我不喜欢学习不规则动词。 It's a whole new ball game for me. 這對我來說是個全新的球類遊戲。 He's sleeping like a baby. 他正睡着，像个婴儿一样。 He can play both tennis and baseball. 他既会打网球，又会打棒球。 We should cancel the hike. 我們應該取消這次遠足。 He is good at dealing with children. 他擅長應付小孩子。

2022-07-21

介绍TFIDF与BM25的优秀PPT

介绍从TFIDF到BM25的优秀PPT

2022-06-23

bert_sentence_classification.7z

基于HuggingFace 哈工大hfl/chinese-bert-wwm-ext预训练模型微调的中文句子分类模型

2021-09-25

chinese_sentence_classification_corpus.7z

中文问句分类数据集，可用于训练中文问句分类和句向量抽取等任务。

2021-09-25

sentence_classification.7z

基于HuggingFace 哈工大hfl/chinese-robert-wwm-ext预训练模型微调的中文句子分类模型

2021-09-24

chinese_wwm_ext_pytorch.zip

哈工大发布的BERT WWM-EXT版预训练模型

2021-09-21

VIM常见命令总结vim常见命令总结

VIM常见命令总结VIM常见命令总结

2021-08-19

datasets.rar

文章中用到的数据

2021-03-01

英文情绪分类数据集文件

经典的英文情绪分类/情感分析数据集

2020-09-02

词性标注traindata.rar

英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。

2020-08-29

Typora 0.9.9.66 绿色版

2019-03-19

RabbitMQ示例代码

rabbitmq示例代码，

2018-12-17

RocketMQ实战与原理解析【清晰版】

作者是阿里资深数据专家，对RocketMQ有深入的研究，并有大量的实践经验。在写这本书之前，作者不仅系统、深入地阅读了RocketMQ的源代码，而且还向RocketMQ的官方开发团队深入了解了它的诸多设计细节。作者结合自己多年使用RocketMQ的经验，从开发和运维两个维度，给出了大部分场景下的优秀实践，能帮助读者在学会使用和用好RocketMQ的同时，尽量少“踩坑”。同时，本书也结合源码分析了分布式消息队列的原理，使读者可以在复杂业务场景下定制有特殊功能的消息队列。该PDF仅供购买纸质版参考，请在下载24小时后删除！！！

2018-11-03

Angular6依赖注入Demo

Angular6依赖注入Demo，包含懒加载实现。 Angular6依赖注入Demo，包含懒加载实现。

2018-07-23

Java网络编程第4版英文版

《Java网络编程（第四版）》实用指南全面介绍了如何使用Java开发网络程序。你将学习如何使用Java的网络类库既快速又轻松地完成常见的网络编程任务，如编写多线程服务器、加密通信、广播到本地网络，以及向服务器端程序提交数据。作者提供了真正可实用的程序来讲解他介绍的方法和类。第4版经过全面修订，已经涵盖REST、SPDY、异步I/O和很多其他高级技术。本书主要内容有：研究Internet底层协议，如TCP/IP和UDP/IP；了解Java的核心I/O API如何处理网络输入和输出；发现InetAddress类如何帮助Java程序与DNS交互；用Java的URI和URL类定位、识别和下载网络资源；深入研究HTTP协议，包括REST、HTTP首部和cookie；使用Java的底层Socket类编写服务器和网络客户端；利用非阻塞I/O同时管理多个连接。

2018-07-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

Transformer机器翻译数据集

英文-中文机器翻译数据集

介绍TFIDF与BM25的优秀PPT

bert_sentence_classification.7z

chinese_sentence_classification_corpus.7z

sentence_classification.7z

chinese_wwm_ext_pytorch.zip

VIM常见命令总结vim常见命令总结

datasets.rar

英文情绪分类数据集文件

词性标注traindata.rar

Typora 0.9.9.66 绿色版

RabbitMQ示例代码

RocketMQ实战与原理解析【清晰版】

Angular6依赖注入Demo

Java网络编程第4版英文版

snmp4j-2.2.5.jar

非常好的红黑树教程，值得一看

Dubbo与Zookeeper、SpringMVC整合和使用

dubbo-admin-2.5.4

Java JDBC 连接数据库实例

安卓实现选择联系人

JavaIO 2nd Edition PDF

软件需求规格说明书

非递归归并排序详细分析

Ｃ＋＋真值表模拟程序

coloader80.dll

空空如也