愤怒的可乐-CSDN博客

原创从零实现深度学习框架【实现自己的PyTorch(已完结)】

本着“凡我不能创造的，我就不能理解”的思想，此系列文章会基于纯Python以及NumPy从零创建自己的深度学习框架，该框架类似PyTorch能实现自动求导。

2021-12-19 15:38:18 6023

原创人工智能数学基础之高等数学

人工智能中用到的高数知识，看这一篇就够了。

2019-07-15 23:18:25 11550 6

强化学习中贝尔曼方程的重要性就不说了，本文利用高中生都能看懂的数学知识推导贝尔曼方程。折扣回报GtG_tGt的定义为：Gt=Rt+1+γRt+2+γ2Rt+3+⋯=∑k=0∞γkRt+k+1(1)G_t = R_{t+1} +\gamma R_{t+2} + \gamma^2 R_{t+3} + \cdots = \sum_{k=0}^\infty \gamma^k R_{t+k+1} \tag 1Gt=Rt+1+γRt+2+γ2Rt+3+⋯=k=0∑∞γkRt+k+1(1)注意GtG

2025-04-29 20:45:23 424

原创揭开 MCP 的神秘面纱：标准化 AI 上下文管理的未来(上)

最近MCP大火，本文尝试揭开它神秘的面纱。文章较长，分为上下两篇。

2025-04-08 22:30:00 866 1

原创揭开 MCP 的神秘面纱：标准化 AI 上下文管理的未来(下)

最近MCP大火，本文尝试揭开它神秘的面纱。文章较长，分为上下两篇。这是第二篇。

2025-04-08 22:30:00 605

原创 Lora微LLAMA模型实战

本文介绍如何复现Alpaca-lora，即基于alpaca数据集用lora方法微调Llama模型。

2025-03-18 22:16:09 1030

原创 [论文笔记]Conan-embedding: General Text Embedding with More and Better Negative Samples

⭐ 作者提出了Conan-Embedding模型，提出在训练过程中动态挖掘更好的难负样本的方法，取得了SOTA结果。

2025-01-03 21:50:41 1180 1

原创 [论文粗读]A Simple Framework for Contrastive Learning of Visual Representations

⭐ 作者提出了一种对比学习框架，虽然论文是基于视觉探讨的，但后续也影响了很多NLP方面的工作。在更深更宽的模型和更大的批次、更长的训练时间基础上，首先通过多种数据增强产生有效的正样本用于对比学习。其次在表示和对比损失之间引入可学习的非线性头。最后利用归一化温度缩放交叉熵损失进行对比学习。在训练结束后，该引入的非线性头会被丢弃。

2025-01-01 21:45:00 777

原创 [论文笔记]Representation Learning with Contrastive Predictive Coding

⭐ InfoNCE中的Info指的是互信息，目标是在学习过程中最大化互信息。InfoNCE在给定一个正样本和一组互样本的情况下，最大化正样本和一组负样本得分之间的对比，让模型能更好的学习数据的表示。

2025-01-01 13:48:14 1131 1

原创 InfoNCE Loss详解(上)

InfoNCE对比学习损失是学习句嵌入绕不开的知识点，本文就从头开始来探讨一下它是怎么来的。

2024-12-28 12:39:47 1015

原创 [论文笔记]An LLM Compiler for Parallel Function Calling

⭐ 这是一篇很厉害的工作，作者受计算机中编译器的启发，设计了LLMCompiler这一框架。首先利用函数调用规划器指定函数调用的执行计划；然后通过任务获取单元来调度函数调用任务，找出其中的依赖和独立任务；最后通过执行器(并行)执行这些任务。

2024-11-15 22:27:50 1567

原创 [论文粗读][REALM: Retrieval-Augmented Language Model Pre-Training

⭐ 为了以更可解释和模块化的方式捕捉知识，作者提出了REALM预训练框架，通过学习文本知识检索器来增强语言模型预训练算法。

2024-11-06 08:22:13 1185

原创 [论文粗读]HippoRAG: Neurobiologically Inspired Long-Term Memory for Large Language Models

⭐ 作者提出了HippoRAG，首先使用大语言模型将语料库转换为无模式知识图(KG)来模拟新皮层处理感知输入的能力，作为人工海马体索引。给定一个新的查询，HippoRAG识别查询中的关键概念，并在KG上运行个性化PageRank(PPR)算法，使用查询概念作为种子，以整合跨段落的检索信息。

2024-10-28 08:38:21 467

原创 [论文粗读]STRUCTRAG: BOOSTING KNOWLEDGE INTENSIVE REASONING OF LLMS VIA INFERENCE-TIME HYBRID INFORMATIO

⭐ 现有的RAG方法在知识密集型推理任务中存在困难，因为这些任务所需的有效信息严重分散。本篇工作受认知理论的启发，该理论认为人类在处理知识密集型推理时会将原始信息转换为各种结构化知识，提出了StructRAG框架，它可以识别当前任务的最佳结构类型，将原始文档重建为这种结构化格式，并根据生成的结构推断答案。

2024-10-24 08:23:32 1223

原创 [论文笔记]ColPali: Efficient Document Retrieval with Vision Language Models

⭐ 作者介绍了一种新的多模态检索框架ColPali，可以生成文本和图像的ColBERT类多向量表示，也引入后期交互计算每个查询标记和文档标记之间的交互，最终得到一个分数可用于检索排名。

2024-10-23 08:35:36 1058 1

原创 [论文笔记]HERMES 3 TECHNICAL REPORT

⭐ 本篇工作提出了如何良好地训练base模型提供指令遵循和函数调用能力，其提出的函数调用格式启发了vLLM和Ollama等支持工具调用。

2024-10-19 14:24:52 1064 1

原创 [论文笔记]RA-DIT: RETRIEVAL-AUGMENTED DUAL INSTRUCTION TUNING

⭐ 作者提出了一种检索增强微调的方法，为语言模型和检索器进行微调。引导LLM最佳地利用检索到的信息并忽略干扰内容。

2024-10-18 08:42:17 1251 1

原创 [论文笔记]Improving the Domain Adaptation of Retrieval Augmented Generation (RAG) Models for Open Domain

⭐ 作者提出对检索器和生成器进行联合训练来完成QA任务和领域自适应，通过微调RAG模型及其检索器，同时在训练期间异步更新知识编码。

2024-10-17 08:52:40 1180 1

原创 [论文笔记]Active Retrieval Augmented Generation](Active Retrieval Augmented Generation

⭐ 在RAG长文本的生成过程中，作者提出主动检索增强生成的方法，首先开始回复问题，如果LLM对于生成的句子不太确信，则使用它作为查询检索相关文档，然后根据检索到的文档重新生成下一句话，直到生成结束。

2024-10-12 22:24:46 1194 1

原创 [论文笔记]ColBERT: Eficient and Effective Passage Search via Contextualized Late Interaction over BERT

⭐ ColBERT引入了一种晚期交互(late interaction)架构，该架构使用BERT独立编码查询和文档，然后采用一种廉价但强大的交互步骤来建模它们的细粒度相似性。通过推迟这种细粒度的交互，ColBERT能够利用深度语言模型的表达能力，同时获得离线预计算文档表示的能力，从而显著加快查询处理速度。

2024-10-11 08:34:35 1102 1

原创 [论文笔记]DAPR: A Benchmark on Document-Aware Passage Retrieval

⭐ 作者提出了可以直接将长文本的全局文本信息拼接到切分后的文本块前面。全局文本信息有(1) 文档的标题 (2) 文档的关键短语，使用TopicRank算法抽取 (3) 共指解析，通过跨段共指解析消解来处理文本块中的代词。

2024-10-10 08:49:16 1147 1

原创 [论文笔记]SGPT: GPT Sentence Embeddings for Semantic Search

⭐ 作者提出了利用仅编码器的类GPT架构来产生句子嵌入以支持语义检索和其他嵌入任务。在Bi-Encoder设置中，使用位置加权平均池化来得到具有语义信息的句子嵌入。在Cross-Encoder设置中，提取预训练GPT模型的对数概率产生无监督结果。

2024-10-03 21:37:19 1754 6

原创如何处理模型API速率限制

当我们访问大模型相关的API服务时，通常会遇到速率限制(即限流)，它用于防止用户向某个API发送大量请求，防止请求过载，确保每个人都能公平地访问API。

2024-09-16 18:33:56 5297

原创 [论文笔记]MEMORAG: MOVING TOWARDS NEXT-GEN RAG VIA MEMORY-INSPIRED KNOWLEDGE DISCOVERY

⭐ 作者提出了MemoRAG，一种通过长期记忆增强的检索增强生成新范式。它使用轻量且长上下文的LLM构建全局记忆，用于生成上下午相关的线索。用另一个表达力强的LLM，根据检索到的信息生成最终答案。

2024-09-12 20:36:01 2516 1

原创 [论文笔记]ChatQA: Surpassing GPT-4 on Conversational QA and RAG

⭐ 作者介绍了 ChatQA，一种两阶段指令微调方法，提高了 RAG 的表现。还引入了一种针对多轮对话 QA 优化的密集检索器。

2024-09-11 21:00:00 2322 6

原创 [论文笔记]RankRAG: Unifying Context Ranking with Retrieval-Augmented Generation in LLMs

⭐ 作者提出了一种新的两阶段指令微调框架RankRAG，该框架对LLM进行指令微调，以实现RAG中上下文排名和答案生成的双重目的。阶段一利用SFT对高质量指令跟随数据集进行微调，阶段二对LLM进行检索增强生成和上下文排名的指令微调。

2024-09-10 18:33:32 1621 1

原创 Cross-Encoder实现文本匹配(重排序模型)

本文介绍了CrossEncoder重排序模型的原理和代码实践。

2024-09-10 18:33:15 2155

原创 [论文笔记]QLoRA: Efficient Finetuning of Quantized LLMs

⭐ 作者提出了QLoRA，一种高效的微调方法，它在减少内存使用的同时保持16位微调任务的完整性能。这是通过：4位NormalFloat、双重量化(对量化常数进行量化)、分页优化器(GPU内存不足的情况下，自动进行CPU和GPU之间的页面传输)来管理内存峰值实现的。微调时冻结**4位量化预训练语言模型**而向低秩适配器(LoRA)反向传播梯度。

2024-09-07 22:44:46 2727 3

原创 [论文笔记]LLM.int8(): 8-bit Matrix Multiplication for Transformers at Scale

⭐ 作者开发了一个两部分量化程序LLM.int8()。首先使用向量级量化，对矩阵乘法中的每个内积使用单独的归一化常数，从而对大多数特征进行量化。然而，对于突现的异常值(outlier)，还包括了一种新的混合精度分解方案，将异常特征维度隔离到16位矩阵乘法中，同时仍然有99.9%以上的值在8位中进行乘法运算。

2024-09-07 17:48:37 2213 1

原创 Sentence-BERT实现文本匹配【CoSENT损失】

目前最流行的文本嵌入训练方法CoSENT详细介绍！

2024-09-06 09:03:07 1345

原创 [论文笔记]Making Large Language Models A Better Foundation For Dense Retrieval

⭐ 本工作提出了LLaRA，该方法作为对 LLM 进行后处理适应以用于密集检索应用。LLaRA 包含两个前置任务： LLM 的文本嵌入分别用于重构输入句子的词元和预测下一个句子的词元。通过这种方式旨在捕捉输入文本本身和下一句的全局语义，从而使LLM变成一个有效的密集检索器。

2024-09-06 08:16:53 2001 2

原创 [论文笔记]Circle Loss: A Unified Perspective of Pair Similarity Optimization

⭐ 作者提出了 Circle 损失，这是一种简单的深度特征学习损失函数。通过对每个相似度得分进行加权，Circle 损失使深度特征学习受益于灵活的优化和明确的收敛目标。

2024-09-04 19:30:00 936 1

原创 Sentence-BERT实现文本匹配【对比损失函数】

还是基于Sentence-BERT架构，或者说Bi-Encoder架构训练嵌入模型，但是本文使用的是对比损失函数。

2024-09-04 09:48:03 1754

原创 [论文笔记]Dimensionality Reduction by Learning an Invariant Mapping

⭐ 作者提出了一个对比学习损失函数，可以应用于带标签的文本对上，但是其负样本(不相似)对生成的方法比较暴力——样本数量的平方级别。

2024-09-04 09:08:57 929 1

原创 Sentence-BERT实现文本匹配【回归目标函数】

我们通过Sentence-Bert提出的分类目标函数来训练句子嵌入模型，本文同样基于Sentence-Bert的架构，但改用回归目标函数。

2024-09-03 14:32:10 1304

原创 Sentence-BERT实现文本匹配【分类目标函数】

本文实战Sentence-BERT提出的如何训练嵌入模型的方法，主要是基于句子对的分类目标函数实现。

2024-09-03 14:29:49 2255 2

原创 [论文笔记]RAFT: Adapting Language Model to Domain Specific RAG

⭐ 本篇工作提出了一种检索增强微调方法RAFT，可以提高模型在开卷领域内问答的能力。在训练RAFT时，给定一个问题和一组检索到的文档，训练模型忽略那些在回答问题时无用的干扰文档。RAFT通过逐字引用相关文档中的正确序列来帮助回答问题，同时结合RAFT的思维链式响应，帮助提高模型的推理能力。

2024-09-03 08:02:39 1157 1

原创 [论文笔记]Rethink Training of BERT Rerankers in Multi-Stage Retrieval Pipeline

⭐ 作者提出了一种局部对比估计方法用于训练重排序器，即首先通过一阶段的检索器来选择负样本，然后与正样本做对比学习，有效防止模型训崩。

2024-08-27 20:30:00 425 1

原创 [论文笔记]Improving Retrieval Augmented Language Model with Self-Reasoning

⭐ 作者提出了一种新颖的自我推理框架，其核心思想是利用LLM自身生成的推理轨迹。该框架包括三个过程来构建自我推理轨迹：关注相关性的过程、证据选择性过程、一个轨迹分析过程。基于GPT4生成了2000个高质量的训练样本，提出了一种阶段性训练过程基于这些样本训练自我推理生成模型，声称效果很好，但是训练样本和训练好的模型都没有公开出来。

2024-08-21 22:49:00 1244

原创 [论文笔记]Reciprocal Rank Fusion outperforms Condorcet and individual Rank Learning Methods

⭐ 作者提出了倒数排名融合(RRF)的简单方法，但是效果超过了逼他复杂得多的方法，仅是考虑每个系统中排名的倒数(计算倒数时先增加一个固定的偏移量k，防止异常值影响)。可以尝试用在粗牌之后精排之前，或者看是否能替代精排。

2024-08-16 19:45:00 1344 2

Transformer机器翻译数据集

机器翻译数据集，使用教程 https://helloai.blog.csdn.net/article/details/135344697

2024-01-03

英文-中文机器翻译数据集

中英文翻译数据集： Anyone can do that. 任何人都可以做到。 How about another piece of cake? 要不要再來一塊蛋糕？ She married him. 她嫁给了他。 I don't like learning irregular verbs. 我不喜欢学习不规则动词。 It's a whole new ball game for me. 這對我來說是個全新的球類遊戲。 He's sleeping like a baby. 他正睡着，像个婴儿一样。 He can play both tennis and baseball. 他既会打网球，又会打棒球。 We should cancel the hike. 我們應該取消這次遠足。 He is good at dealing with children. 他擅長應付小孩子。

2022-07-21

介绍TFIDF与BM25的优秀PPT

介绍从TFIDF到BM25的优秀PPT

2022-06-23

bert_sentence_classification.7z

基于HuggingFace 哈工大hfl/chinese-bert-wwm-ext预训练模型微调的中文句子分类模型

2021-09-25

chinese_sentence_classification_corpus.7z

中文问句分类数据集，可用于训练中文问句分类和句向量抽取等任务。

2021-09-25

sentence_classification.7z

基于HuggingFace 哈工大hfl/chinese-robert-wwm-ext预训练模型微调的中文句子分类模型

2021-09-24

chinese_wwm_ext_pytorch.zip

哈工大发布的BERT WWM-EXT版预训练模型

2021-09-21

VIM常见命令总结vim常见命令总结

VIM常见命令总结VIM常见命令总结

2021-08-19

datasets.rar

文章中用到的数据

2021-03-01

英文情绪分类数据集文件

经典的英文情绪分类/情感分析数据集

2020-09-02

词性标注traindata.rar

英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。英文词性标注训练数据。

2020-08-29

Typora 0.9.9.66 绿色版

2019-03-19

RabbitMQ示例代码

rabbitmq示例代码，

2018-12-17

RocketMQ实战与原理解析【清晰版】

作者是阿里资深数据专家，对RocketMQ有深入的研究，并有大量的实践经验。在写这本书之前，作者不仅系统、深入地阅读了RocketMQ的源代码，而且还向RocketMQ的官方开发团队深入了解了它的诸多设计细节。作者结合自己多年使用RocketMQ的经验，从开发和运维两个维度，给出了大部分场景下的优秀实践，能帮助读者在学会使用和用好RocketMQ的同时，尽量少“踩坑”。同时，本书也结合源码分析了分布式消息队列的原理，使读者可以在复杂业务场景下定制有特殊功能的消息队列。该PDF仅供购买纸质版参考，请在下载24小时后删除！！！

2018-11-03

Angular6依赖注入Demo

Angular6依赖注入Demo，包含懒加载实现。 Angular6依赖注入Demo，包含懒加载实现。

2018-07-23

Java网络编程第4版英文版

《Java网络编程（第四版）》实用指南全面介绍了如何使用Java开发网络程序。你将学习如何使用Java的网络类库既快速又轻松地完成常见的网络编程任务，如编写多线程服务器、加密通信、广播到本地网络，以及向服务器端程序提交数据。作者提供了真正可实用的程序来讲解他介绍的方法和类。第4版经过全面修订，已经涵盖REST、SPDY、异步I/O和很多其他高级技术。本书主要内容有：研究Internet底层协议，如TCP/IP和UDP/IP；了解Java的核心I/O API如何处理网络输入和输出；发现InetAddress类如何帮助Java程序与DNS交互；用Java的URI和URL类定位、识别和下载网络资源；深入研究HTTP协议，包括REST、HTTP首部和cookie；使用Java的底层Socket类编写服务器和网络客户端；利用非阻塞I/O同时管理多个连接。

2018-07-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

Transformer机器翻译数据集

英文-中文机器翻译数据集

介绍TFIDF与BM25的优秀PPT

bert_sentence_classification.7z

chinese_sentence_classification_corpus.7z

sentence_classification.7z

chinese_wwm_ext_pytorch.zip

VIM常见命令总结vim常见命令总结

datasets.rar

英文情绪分类数据集文件

词性标注traindata.rar

Typora 0.9.9.66 绿色版

RabbitMQ示例代码

RocketMQ实战与原理解析【清晰版】

Angular6依赖注入Demo

Java网络编程第4版英文版

snmp4j-2.2.5.jar

非常好的红黑树教程，值得一看

Dubbo与Zookeeper、SpringMVC整合和使用

dubbo-admin-2.5.4

Java JDBC 连接数据库实例

安卓实现选择联系人

JavaIO 2nd Edition PDF

软件需求规格说明书

非递归归并排序详细分析

Ｃ＋＋真值表模拟程序

主流编程语言的选择和学习杂谈

coloader80.dll

空空如也