Scabbards_-CSDN博客

原创知识图谱 Graph Rag 方法横向对比

本文综述了五种基于图的RAG方法创新： HippoRAG（NeurIPS 2024）受海马体记忆机制启发，通过无模式知识图谱和PPR算法实现高效多跳检索，直接召回关联证据。 LightRAG（EMNLP 2025）优化为轻量级双层检索（实体/关系+主题匹配），支持增量更新，显著降低计算开销。 KGGen（NeurIPS 2025）聚焦高质量知识图谱构建，通过聚类和LLM验证提升图谱稠密度。 GraphFlow（NeurIPS 2026）将检索建模为强化学习问题

2026-06-09 19:53:39 343

原创 TIV：在大型推理模型中通过向量进行有效推理的思想注入

与显式生成思维过程不同，TIV 将可学习向量注入到 Transformer 各层中最终 token 的 post-attention hidden states 中，从而实现一种隐式且轻量化的推理机制。我们进一步提出了一种两阶段强化学习策略：第一阶段用于校准模型的推理分布，第二阶段则将其蒸馏为一种基于向量的策略，并同时优化准确率与简洁性。

2026-06-01 17:49:20 186

原创 LLM 时代下的轻量级NER 解法

主播不是弄nlp 出身的，这个任务有速度需求所以基于llm 的并不是最优解，所以补一下这块知识，如果有问题欢迎指正。首先说一下我们的任务场景：100ms 以内的实体抽取，所有大模型都全军覆没，0.5b+量化也未能幸免，所以我们就把目光移向了传统的encoder based 的模型

2026-05-28 16:47:34 420

原创阿里云百炼 MCP 部署

记录一下阿里云 mcp 平台上架自己的mcp

2026-03-25 11:01:59 317

原创通过自蒸馏的Reinforcement Learning

大型语言模型正越来越多地通过强化学习在可验证领域（如代码和数学）进行后训练。然而，当前基于可验证奖励的强化学习方法（RLVR）仅依赖每次尝试的标量结果奖励进行学习，这导致了严重的信用分配问题（credit assignment bottleneck）。实际上，许多可验证环境能够提供丰富的文本反馈，例如运行时错误或评审打分，这些信息能够解释一次尝试为何失败。本文将这一情境形式化为一种带有丰富反馈的强化学习问题，并提出了自蒸馏策略优化。

2026-03-20 15:15:10 621

原创基于docker的vLLM服务部署

简单记录一下docker 部署vllm 服务，为什么呢，因为我就是记不住啊

2026-03-16 20:03:57 630

原创 LLamaFactory 微调实战

llama factory 实战 + 理论

2026-03-02 17:57:29 1198

原创 TRE: 鼓励在Trust Rigon 进行探索

为了解决这一问题，我们提出了 Trust Region Entropy（TRE）方法。该方法鼓励模型仅在其“信任区域（trust region）”内进行探索。我们在数学推理任务（MATH）、组合搜索任务（Countdown）以及偏好对齐任务（HH）上进行了大量实验，结果表明，TRE 在各项任务中均稳定优于标准 PPO、传统熵正则化方法以及其他探索基线方法。

2026-02-25 20:08:04 1153

原创 verl 强化学习框架速通

verl 强化学习框架以及一些llm ppo 理论速通一下，不太懂，如果里面有不对的欢迎指正

2026-02-10 19:15:32 923

原创深度学习性能分析/测试（AI Infra) 相关

之前面Nvidia-Infra 的时候准备的一些底层相关内容，二面了两个半小时然后挂了orz （面试官还是很好的) 不过确实感觉现在的工作更贴合算法一些，燃尽了23333

2026-02-10 11:29:11 907

原创 Linux装机/配置环境+常用指令

拿到一台新服务器的一些环境配置和一些linux指令，老是搞忘咋办呢

2026-02-06 15:23:44 655

原创 TTRL: Test-Time Reinforcement Learning

本文研究了在缺乏显式标签的数据上，对大型语言模型（LLMs）进行推理任务的强化学习（RL）。该问题的核心挑战在于：在推理阶段无法访问真实标签（ground truth）的情况下，如何进行奖励估计。尽管这一设定看似难以实现，我们发现，测试时扩展（Test-Time Scaling, TTS）中的常见做法（如多数投票），能够产生出乎意料地有效的奖励信号，足以驱动强化学习训练。在此基础上，本文提出了测试时强化学习（Test-Time Reinforcement Learning, TTRL），一种在无标签数据

2026-02-02 14:21:40 926

原创 Docker 速通

docker 指令啥的梳理总结一下，之前就用了用没咋理解

2025-11-28 14:48:54 855

原创 Segment Anything: SAM & SAM2

梳理了一下经典的 Segment Anything SAM 和它用于分割视频的续作SAM2 的模块。

2025-11-02 23:40:19 1128

原创 KGGEN: 用语言模型从纯文本中提取知识图

人工生成的知识图谱数量有限，而自动抽取的知识图谱往往质量堪忧。本文提出了一种解决数据稀缺问题的新方法——一个文本到知识图谱（text-to-KG）生成器 KGGen。该方法利用语言模型从纯文本中生成高质量的知识图谱。与其他知识图谱抽取器不同，KGGen 会对相关实体进行聚类，以减少生成图谱中的稀疏性。

2025-10-31 09:51:20 908

原创知识图谱 Graph Rag 概念速通

时隔一年又回来做graph rag了，重新梳理一下知识图谱和graph rag的一些概念，下一篇写一些现有的graph rag 的横向对比。

2025-10-30 17:09:26 758

原创 Symbolic Representation 用于任意到任意生成任务

我们提出了一种符号化生成任务描述语言，并结合了一个推理引擎（inference engine），提供了一种全新且高效的方式，用于表示和执行多模态任务，且无需针对特定任务进行训练。通过利用预训练的大语言模型（LLM）来推理符号化任务描述，我们的方法成功地合成了多种多样的多模态生成任务，充分展示了其灵活性以及在统一不同类型生成式 AI 能力方面的潜力。

2025-10-30 14:10:02 908

原创 SR-Scientist: 利用 ai agent 进行科学公式的发现

在本文中，我们介绍了 SR-Scientist 框架，该框架将大型语言模型从被动的方程提出者转变为用于符号回归的自主科学家。通过分析数据、评估和优化方程，该智能体通过主动与环境交互生成并优化假设。我们的实验表明，SR-Scientist 在精度、泛化能力、对噪声的鲁棒性以及符号准确性方面显著优于现有方法。此外，我们开发了一个完整的强化学习管道，使智能体能够自我进化并增强其发现能力。

2025-10-28 21:27:44 1154

原创 Agent Laboratory：利用 LLM Agent 作为研究助手

一个自动生成论文的agent, 该框架以人类提供的研究想法为起点，依次经历文献综述、实验实施与报告撰写三个阶段，最终产出完整的科研成果，包括代码仓库与研究报告。是启发性工作，效果难以达到实际学术需求水准，所以主要分析和思考了一下Method 部分。

2025-10-26 23:48:41 1141

原创 github 个人静态网页搭建（一）部署

今年因为开学一个月之后才拿到签证被迫gap了，最近论文没啥好思路，再则又攒了点文章想着看看能不能申请个更好的项目所以搭个个人网站，本人之前纯算法开发可以说0经验，所以这个笔记也希望帮到更多的人？以后个人网站和csdn同步更新啦，github 关注主播Scabbards1500谢谢喵

2025-10-19 22:30:27 3347 3

原创 Aristotle: Mastering Logical Reasoning with A Logic-Complete Decompose-Search-Resolve Framework

本文提出Aristotle，一个逻辑完备的LLM推理框架，通过结构化整合符号逻辑提升效能与效率。传统方法（如Chain-of-Thought）在逻辑任务中存在子任务断裂、搜索冗余和矛盾未解等问题。Aristotle创新性地引入三个模块：LogicalDecomposer（基于逻辑结构分解问题）、LogicalSearchRouter（反证法搜索矛盾）和LogicalResolver（逐步消解冲突），首次实现符号逻辑在推理全流程的深度融合。

2025-08-08 23:54:47 1185

原创 Evolver: Chain-of-Evolution Prompting to Boost Large Multimodal Modelsfor Hateful Meme Detection

通过融合进步的文化理念，仇恨表情包（meme）不断演变，新的表情包不断出现，使得依赖广泛培训的现有方法变得过时或无效。在这项工作中，我们提出了Evolver，通过整合模因的进化属性和上下文信息，通过进化链（CoE）提示融合了大型多模态模型（Large Multimodal Models, LLM）。

2025-06-30 20:43:48 1225

原创 Faithful Logical Reasoning via Symbolic Chain-of-Thought

本研究提出符号思维链（Symbolic Chain-of-Thought, SymbCoT）框架，创新地将符号表达和逻辑规则与符号思维链提示相结合，以提高法学硕士的逻辑推理能力。具体来说，SymbCoT在主干LLM的基础上，将自然语言上下文翻译成符号格式，然后推导出一个循序渐进的方案，用符号逻辑规则来解决逻辑推理问题，然后由验证者来检查翻译和推理链。在FOL和CO符号表达的5个标准基准上的实验结果表明，SymbCoT在逻辑推理上显著增强了vanilla CoT。

2025-06-15 21:41:35 1335

原创 CPT304-2425-S2-Software Engineering II

CPT304 你背死我得了

2025-06-03 23:08:53 1989

原创 CPT304 Software Engineering II 题型收集

一些题型，304你背死我得了

2025-06-03 23:08:50 1314

原创 CPT302-2425-S2-Multi-Agent Systems

笔记没例题管用我认为，不过考点还是要抄的

2025-05-30 16:45:15 1402

原创 CPT302 Multi-Agent Systems 题型

multi-agent 的各种题目收集

2025-05-30 16:38:09 1183

原创 CAN302 Technologies for E-Commerce

考的地方就学，不考的地方打死不学.jpg

2025-05-27 16:14:04 2131

原创 CAN302 Technologies for E-Commerce 试题收集

电商往年考试题整理，今年又大改，往难改，我们21届太倒霉辣

2025-05-27 16:13:16 1131

原创 INT202笔记整理

今天看别的课的时候想起来好像以前学过rsa然后发现这门课只发了例题笔记没发，补发一下*

2025-05-25 12:06:38 1277

原创 An Image isWorth 32 Tokensfor Reconstruction and Generation 一个图像值32个Token用于重建和生成

生成模型的最新进展突出了图像标记化（image tokenization ）在高效合成高分辨率图像中的关键作用。与直接处理像素相比，标记化将图像转换为潜在表示（latent representations），减少了计算需求，提高了生成过程的有效性和效率。先前的方法，如VQGAN，通常使用具有固定下采样因子的二维潜在网格（2D latent grids）。然而，这些二维标记化在管理图像中存在的固有冗余（inherent redundancies）方面面临挑战，其中相邻区域经常显示相似性。

2025-04-14 19:37:42 1592

原创 Large Language Model（LLM）的训练和微调

SFT，RLHF，PPO，DPO 微调等梳理

2025-04-12 14:25:43 1624

原创生成模型速通（Diffusion，VAE，GAN）

最近有同学找我讨论生成觉得有点意思就学了学

2025-03-23 22:58:35 1330

原创人工智能的未来：探索大型概念模型的潜力

Meta引入了大型概念模型（Large Concept Models, lcm），代表了传统的基于令牌的框架的重大转变。lcm使用概念作为理解的基本单位，支持更复杂的语义推理和上下文感知决策。鉴于这一新兴技术的学术研究有限，我们的研究旨在通过收集、分析和综合现有的灰色文献来弥补知识差距，以提供对lcm的全面了解。具体来说，我们(i)识别和描述LCM与llm的区别特征，（ii）探索LCM在多个领域的潜在应用，（iii）提出未来的研究方向和实际策略，以推进LCM的发展和采用。

2025-03-21 15:04:44 1110

原创理解知识如何在大型Vision-Language Models 中演化

这项工作研究了多模态知识如何在lvlm中发展。使用early exit 和降维技术，我们设计了几种策略来跟踪模型中的知识，并在三个层次上探索这个主题：单个令牌概率、令牌概率分布和特征编码。基于两个关键节点，即关键层和突变层，我们首次深入了解了lvlm中的知识进化过程。此外，根据不同进化阶段的特点，我们还在模型压缩和幻觉消除等问题上探索了新的视角。

2025-03-10 20:47:11 1299 2

原创一种基于滑动层合并的高效深度修剪大模型的方法

我们提出了一种滑动层合并方法 sliding layer merging method，该方法根据预定义的相似度阈值从上到下动态地选择和融合连续层 consecutive layers，从而在保持模型性能的同时简化了模型结构。

2025-03-09 16:57:24 1060

原创模型压缩梳理

最近在复现模型压缩的工作，看了一下视频稍微整理一下知识点。大概看了看深度学习模型的推理优化方法，包括模型小型化、低比特量化、模型剪枝及知识蒸馏。

2025-03-08 15:20:11 1150

原创 EGE-UNet：一种有效的分组增强UNet皮肤病灶分割方法

EGE-UNet以轻量级的方式集成了一个Group multi-axis Hadamard Product Attention module（GHPA）和一个Group Aggregation Bridge module（GAB）。GHPA对输入特征进行分组，并在不同轴上执行Hadamard Product Attention mechanism（HPA），从不同角度提取病理信息。

2025-03-04 15:35:55 1300

原创 Canny 边缘检测

canny边缘检测一点小笔记

2025-01-27 13:38:33 1436

原创基于实例感知交互的联合的显微电镜图像去噪与分割

我们的框架包括三个组成部分：去噪网络、分割网络和促进特征级交互的融合网络。首先，去噪网络减轻了噪声的退化。随后，分割网络学习实例级亲和先验，编码重要的空间结构信息。最后，在融合网络中，我们提出了一种新的实例感知嵌入模块（IEM），利用分割特征中的重要空间结构信息进行去噪。IEM在统一的框架内实现了两个任务之间的交互，并通过联合训练机制促进了从去噪到分割的隐式反馈。

2025-01-22 21:22:47 1010

CPT107 离散数学期末复习笔记配套例题

一边复习一边梳理的东西，挺细挺全，还有本人一些碎碎念无视就好w 可以搜笔记知识点对应的目录号来找例题，，，说实话我以为自己复习的很无敌了但是，，，考试时间大家要安排好，适当做出取舍啥的，，，我就因为有些地方写太细了最后有一点没写完血亏了，，，大家一定要注意时间分配，，，一定，，，以及还整理了配套的笔记，可以在主页看，，，然后因为西浦万年不课改的习惯我觉得应该可以帮到后面学的人，希望这份笔记能够帮助到大家，，，以及机构啥的不要商用，，，有啥想问的直接私信戳我w

2023-01-06

CPT107 期末复习笔记

XJTLU CPT107 离散数学期末复习笔记一边复习一边梳理的东西，挺细挺全，还有本人一些碎碎念无视就好w 说实话我以为自己复习的很无敌了但是，，，考试时间大家要安排好，适当做出取舍啥的，，，我就因为有些地方写太细了最后有一点没写完血亏了，，，大家一定要注意时间分配，，，一定，，，以及还整理了配套的例题，可以在主页看，，，然后因为西浦万年不课改的习惯我觉得应该可以帮到后面学的人，希望这份笔记能够帮助到大家，，，以及机构啥的不要商用，，，有啥想问的直接私信戳我w

2023-01-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

CPT107 离散数学 期末复习笔记配套例题

CPT107 期末复习笔记

空空如也

CPT107 离散数学期末复习笔记配套例题