自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(71)
  • 收藏
  • 关注

原创 【论文阅读】AstraNav-Memory: Contexts Compression for Long Memory

AstraNav-Memory具身导航论文阅读

2026-04-23 18:48:43 375

原创 【论文阅读】Ground Slow, Move Fast: A Dual-System Foundation Model for Generalizable VLN

上海AI Lab最新双系统VLN模型论文详解

2026-02-22 12:29:56 1129

原创 【论文阅读】Dynam3D: Dynamic Layered 3D Tokens Empower VLM for Vision-and-Language Navigation

3D具身导航模型论文详解

2026-02-21 17:32:15 735

原创 【论文阅读】Towards Learning a Generalist Model for Embodied Navigation

NaviLLM具身智能模型论文详解

2026-02-13 11:51:12 1089

原创 【论文阅读】Vision-and-Language Navigation: A Survey of Tasks, Methods, and Future Directions

VLN综述论文阅读

2026-02-07 12:20:36 1073

原创 【论文阅读】Motus: A Unified Latent Action World Model

清华大学统一世界模型Motus论文详解

2026-01-04 02:04:57 589

原创 【论文阅读】Genie: Generative Interactive Environments

谷歌世界模型Genie论文详解

2025-12-28 01:01:45 1172

原创 数字逻辑笔记—同步时序电路

数字逻辑学习笔记--第六章同步时序电路

2025-12-09 20:40:46 1765

原创 数字逻辑笔记—触发器

数字逻辑学习笔记--第五章触发器

2025-12-06 16:09:30 1066

原创 数字逻辑笔记—组合逻辑电路

数字逻辑学习笔记--第四章组合逻辑电路

2025-12-03 21:38:43 947

原创 数字逻辑笔记—硬件描述语言Verilog HDL

数字逻辑学习笔记--第三章硬件描述语言Verilog HDL

2025-11-26 15:28:37 477

原创 数字逻辑笔记—逻辑代数基础

数字逻辑学习笔记--第二章逻辑代数基础

2025-11-25 16:03:20 622

原创 【论文阅读】Knowledge Circuits in Pretrained Transformers

LLM中知识存储方式新解释的论文详解

2025-10-16 16:34:11 646 1

原创 Baukit库使用教程--监督和修改LLM中间层输出

Baukit库使用教程--监控和修改模型输入输出示例

2025-09-14 17:38:36 478

原创 【论文阅读】TrojVLM: Backdoor Attack Against Vision Language Models

多模态大模型后门注入方式

2025-09-10 21:15:10 552

原创 【论文阅读】Revisiting Backdoor Attacks against Large Vision-Language Models from Domain Shift

视觉语言大模型后门注入泛化新方法

2025-09-09 20:44:16 859

原创 【论文阅读】Safety is Not Only About Refusal: Reasoning-Enhanced Fine-tuning for Interpretable LLM Safety

CMU大模型安全SFT方法论文详解

2025-09-03 17:49:41 980

原创 【论文阅读】UNDERSTANDING AND ENHANCING SAFETY MECHANISMS OF LLMS VIA SAFETY-SPECIFIC NEURON

大模型安全神经元论文详解

2025-09-01 18:21:17 729

原创 【论文阅读】Mechanistic Interpretability for AI Safety

大模型可解释性综述性论文核心内容详解

2025-08-21 00:45:16 1500

原创 【论文阅读】How do Large Language Models Understand Relevance? A Mechanistic Interpretability Perspective

大模型在检索过程中的可解释性论文详解

2025-08-12 15:59:39 812

原创 【论文阅读】Transformer Feed-Forward Layers Build Predictions by Promoting Concepts in the Vocabulary Spac

transformer中FFN层对于输出分布的作用论文详解

2025-08-07 18:11:14 1048

原创 【论文阅读】Transformer Feed-Forward Layers Are Key-Value Memories

transformer中的FFN的作用分析——论文详解

2025-08-05 11:24:58 1367

原创 【论文阅读】KDProR: A Knowledge-Decoupling Probabilistic Framework for Video-Text Retrieva

开放知识的文本视频检索模型KDProR论文详解

2025-08-04 11:52:59 1008

原创 【论文阅读】Editing Large Language Models: Problems, Methods, and Opportunities

大模型编辑技术的综述性论文详解

2025-08-03 00:05:18 824

原创 【论文阅读】Safety Alignment Should Be Made More Than Just a Few Tokens Deep

token级大模型安全深度论文详解

2025-07-28 19:23:41 1593

原创 【论文阅读】ON THE ROLE OF ATTENTION HEADS IN LARGE LANGUAGE MODEL SAFETY

注意力头在大模型安全中的作用分析--论文详解

2025-07-27 23:35:20 1328 2

原创 【论文阅读】How Alignment and Jailbreak Work: Explain LLM Safety through Intermediate Hidden States

大模型安全对齐以及越狱攻击原理论文讲解

2025-07-25 18:10:51 1295

原创 【论文阅读】REVISITING DEEP AUDIO-TEXT RETRIEVAL THROUGH THE LENS OF TRANSPORTATION

任务定义音频-文本检索的目标是学习音频与其对应文本描述之间的跨模态对齐关系系统要能理解某段音频应该对应哪段文本描述(反之亦然)。对齐方式学习一个联合嵌入空间,能将音频和文本映射到同一个空间中,使得它们之间的相似性可以直接比较。主流方法当前最有效的方法是对比学习,能训练出具有良好表现力的跨模态嵌入空间。给定训练数据Dxiyii1nD{(xi​yi​i1n​,m-LTM 目标是最小化 mini-batch 版本的 KL 散度:bbb。

2025-07-24 18:58:44 925

原创 【论文阅读】On Metric Learning for Audio-Text Cross-Modal Retrieval

给定一个音频-文本数据集Daitii1ND{(ai​ti​i1N​aia_iai​是音频片段tit_iti​是配对的文本描述aiti(a_i, t_i)ai​ti​是正样本对aitj≠iai​tji​是负样本对模型架构音频编码器fff:将音频映射到共享嵌入空间。文本编码器ggg:将文本映射到共享嵌入空间。相似度计算音频aia_iai​和文本tjt_jtj​的相似度s。

2025-07-24 11:44:30 1210

原创 【DEBUG】Debug日志001:RL项目记录

还是cuda越界,和cu93似乎略有区别。:wandb初始化超时,因为连不上网。:配置文件中,将其设置成离线模式。:调整参数传递顺序之后,成功运行。

2025-07-18 13:26:49 546

原创 【论文阅读】Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction

下一尺度预测——视觉自回归方法VAR论文讲解

2025-07-05 12:17:19 934 1

原创 【论文阅读】VARGPT-v1.1

视觉自回归生成模型VARGPT1.1模型论文讲解

2025-07-04 11:27:29 703 1

原创 【论文阅读】DeepEyes: Incentivizing “Thinking with Images” via Reinforcement Learning

小红书最新VLM--DeepEyes论文讲解

2025-07-02 12:31:24 1246 1

原创 【论文阅读】SRPO: Enhancing Multimodal LLM Reasoning via Reflection-Aware Reinforcement Learning

字节跳动最新自我反思强化学习机制--SRPO论文讲解

2025-06-29 18:09:11 1357 1

原创 【论文阅读】UniRL: Self-Improving Unified Multimodal Models via Supervised and Reinforcement Learning

Self- Improving的统一生成模型UniRL论文详解

2025-06-28 12:10:11 1301 1

原创 【论文阅读】Video-R1: Reinforcing Video Reasoning in MLLMs

MMlab最新视频推理模型 Video-R1论文讲解

2025-06-28 00:07:46 1008 2

原创 【论文阅读】X-REASONER: Towards Generalizable Reasoning Across Modalities and Domains

微软研究院提出全新多模态大模型的强化学习和迁移学习新方法

2025-06-25 02:32:46 840 1

原创 【论文阅读】R1-Reward: Training Multimodal Reward Model Through Stable Reinforcement Learning

多模态奖励模型强化学习训练方法--R1-Reward论文详解

2025-06-24 01:51:53 887 1

原创 【论文阅读】VideoChat-R1: Enhancing Spatio-Temporal Perception via Reinforcement Fine-Tuning

视频方向强化学习模型--VideoChat-R1模型论文讲解

2025-06-02 16:04:14 1187 1

原创 【论文阅读】DanceGRPO: Unleashing GRPO on Visual Generation

DanceGRPO:第一个视觉生成大一统强化学习框架--论文详解

2025-05-30 18:13:45 2614 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除