论文阅读笔记
文章平均质量分 89
论文阅读笔记是学术研究的重要工具,用于系统性整理文献核心观点、研究方法与个人见解,帮助构建知识体系并辅助后续写作。
happyprince
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
2026年03月22日一周论文总结
最近5天(截至2026-03-22)的566篇AI相关论文主要聚焦计算机视觉(cs.CV)、人工智能(cs.AI)、自然语言处理(cs.CL)、机器学习(cs.LG)四大核心领域,涵盖扩散模型优化、多模态融合、LLM推理与效率提升、机器人与 embodied 智能等关键方向。原创 2026-03-22 01:05:30 · 436 阅读 · 0 评论 -
2026年03月11日热门论文
当前AI研究呈现"深度深耕+跨界融合"趋势,聚焦五大方向:长文本/序列一致性、多模态融合、领域专用化、训练效率提升和精细化评估。研究论文可分为多模态与视觉智能、LLM与代理系统等四大类。在多模态领域,研究涵盖3D重建、长文本生成、图像编辑等,如Holi-Spatial实现自动化3D场景理解,Lost in Stories解决LLM长文本连贯性问题。LLM方向关注推理能力提升和代理系统开发,如Believe Your Model改进推理校准,$OneMillion-Bench构建专业代理评原创 2026-03-11 00:42:41 · 451 阅读 · 0 评论 -
2026年03月06日热门论文
当前AI研究呈现"理论实践并重、技术深耕下沉"的发展态势,聚焦视频生成、大模型优化、多模态融合等六大方向。视频生成领域突破长时序连贯性瓶颈,如Helios实现分钟级实时合成;大模型优化聚焦记忆检索与参数修剪,提升效率与专业性;多模态技术向安全评估与3D理解延伸;强化学习转向异构Agent协作与专业场景适配;目标检测突破开放词汇难题;基准测试则向结构化推理与长期维护能力评估拓展。整体呈现技术纵深发展与场景精准落地的双重特征。原创 2026-03-05 22:27:41 · 593 阅读 · 0 评论 -
2026年03月05日热门论文
AI研究正围绕"统一化、高效化、安全化、实用化"四大方向突破。Hugging Face最新收录的36篇论文显示:多模态领域通过统一编码器打破边界(如Utonia实现3D点云跨域表征);代码智能领域构建复杂任务评估框架(如BeyondSWE揭示代码代理能力缺口);LLM优化聚焦可控性与效率(如DynaMoE实现动态专家激活);视频生成领域提升精准控制(如BBQ-to-Image实现数值化图像生成);强化学习通过预测嵌入增强世界模型(如NE-Dreamer优化时序预测)。这些创新推动AI从实原创 2026-03-04 22:46:36 · 812 阅读 · 0 评论 -
2026年03月04日热门论文
2026年3月Hugging Face平台收录的37篇论文,呈现出“技术深耕与场景拓展并行,效率优化与能力突破并重”的核心趋势。在价值导向上,“精准适配”成为关键词,无论是资源分配的动态调整、数据质量的精准筛选,还是模型能力与任务需求的精准匹配,都彰显了AI技术从“规模制胜”向“效率与效果双优”的转型。正如《周易》所言“穷则变,变则通,通则久”,当前AI研究正通过持续的技术迭代,突破现有瓶颈,迈向更实用、更可靠的发展阶段。核心价值:精准对齐人类标准。核心价值:效率与效果双优。核心价值:降低训练成本。原创 2026-03-03 23:30:42 · 534 阅读 · 0 评论 -
2026年02月27日热门论文
大模型训练与推理追求“轻量化与高性能平衡”,通过机制创新突破效率瓶颈;创新点:提出SMTL框架,以“并行证据获取”替代传统串行推理,通过统一数据合成管道覆盖确定性问答与开放式研究场景,在BrowseComp等四大基准中取得SOTA性能,推理步骤减少70.7%,实现效率与泛化性双赢。创新点:构建AI Gamestore开放评测平台,通过LLM与人类协作合成100款人类游戏,评测前沿视觉语言模型的通用能力,发现模型在世界模型学习、记忆与规划任务中的性能仅为人类的10%,为通用智能研究指明方向。原创 2026-02-28 00:40:13 · 470 阅读 · 0 评论 -
2026年02月25日热门论文
2026年2月Hugging Face平台发布的24篇论文,聚焦于大语言模型(LLM)、多模态模型、Agent智能体、技术优化四大核心领域,呈现出“技术深耕与场景落地双向奔赴”的鲜明特征。一方面,研究者们着力破解模型训练、推理、部署中的核心技术瓶颈,如长上下文处理、高效量化、训练稳定性等;整体趋势印证了“穷理以致其知,反躬以践其实”的治学之道,AI技术正从通用能力构建走向场景化、精细化、高效化的深水区。更多内容关注公众号"快乐王子AI说"原创 2026-02-25 21:46:29 · 1059 阅读 · 0 评论 -
2026年02月24日热门论文
当前AI研究呈现多模态融合、机器人智能体优化、LLM推理系统升级三大趋势。重点论文包括:VBVR数据集突破视频推理规模限制;Mobile-O实现移动端高效多模态处理;VLANeXt构建通用视觉-语言-动作机器人框架;ManCAR优化序列推荐推理;tttLRM创新3D重建方法。这些研究围绕算力依赖、跨场景迁移、推理效率等瓶颈展开突破,推动AI技术向轻量化、精准化、工程化方向发展。原创 2026-02-24 22:49:33 · 910 阅读 · 0 评论 -
2026年02月23日热门论文
Hugging Face最新研究呈现四大方向:1)大模型训练与推理优化,包括VESPO方法提升离线强化学习稳定性,以及探索推理模型隐式停止能力;2)虚实融合与具身智能,开发支持精细交互的视频世界模型和实时空间感知的数字人系统;3)多模态与视觉语言模型,提出视觉信息增益度量和构建DeepVision-103K数学数据集;4)机器人智能控制,研究端到端物体重排策略和平滑运动控制方法。这些研究体现了AI向模型优化、场景落地和技术融合的发展趋势,推动从理论创新到实际应用的转化。原创 2026-02-23 21:23:47 · 731 阅读 · 0 评论 -
2026年02月22日热门论文
AI前沿研究五大趋势总结(150字) 当前AI研究呈现效率优化与安全实用并重的显著特征:1)扩散模型通过稀疏注意力(SpargeAttention2)和动态patch调度(DDiT)实现3-16倍加速;2)LLM研究转向安全对齐(NeST仅微调0.44M参数降低90%风险)与轻量化部署(Roofline建模优化边缘计算);3)智能代理突破跨平台交互(Mobile-Agent-v3.5支持多GUI平台)与世界建模(CUWM模拟Office操作);4)机器人技术融合未来预测(FRAPPE);5)基础架构创新如M原创 2026-02-23 00:51:02 · 826 阅读 · 0 评论 -
2026年02月21日热门论文
2026年2月Hugging Face论文聚焦AI三大核心趋势:效率优化、Agent智能体演进及安全对齐。效率类论文如SpargeAttention2通过混合掩码规则实现16.2倍提速;Agent类研究如Mobile-Agent-v3.5支持多平台GUI自动化;安全类创新NeST仅调优0.44M参数即可降低90.2%不安全生成。其他亮点包括Arcee Trinity的400B稀疏专家架构、TactAlign的触觉迁移技术等,展现AI技术在性能提升、场景拓展与安全部署方面的持续突破。原创 2026-02-22 00:20:06 · 987 阅读 · 0 评论 -
2026年02月20日热门论文
AI研究正围绕效率、泛化、安全、落地四大方向纵深发展,形成"筑基、拓界、守底、落地"的研究格局。18篇论文分为五类:1)基础架构优化类研究注意力机制、动态token化等底层创新;2)多智能体类构建世界模型提升决策能力;3)机器人类解决跨模态感知与控制难题;4)安全对齐类开发轻量化调优等方法;5)领域专用类聚焦科学计算等细分场景。这些研究通过技术创新与实证分析,推动AI从实验室走向实际应用。原创 2026-02-20 23:10:56 · 1006 阅读 · 0 评论 -
2026年02月15日热门论文
2026年2月的顶流论文中,创新点:利用扩散模型并行生成优势,提出迭代式投票精炼机制,通过一致性分析定位不确定令牌并重新生成,在不增加训练成本的前提下,实现推理精度的显著提升,践行“集思广益”的智能协作理念。创新点:直指“浅层探索陷阱”,以状态覆盖理论为基,设计长度激励与冗余惩罚双机制,驱动模型生成更长推理轨迹,在上下文内实现多假设验证与深度探索,彰显“三思而后行”的智能本质。原创 2026-02-16 00:05:07 · 565 阅读 · 0 评论 -
2026年02月14日热门论文
AI研究正从规模竞赛转向质效深耕,聚焦三大趋势:安全可靠性(如自进化AI系统的风险管控)、效率优化(混合架构与蒸馏技术突破资源瓶颈)、多模态融合(从感知到理解+行动的跨模态应用)。代表性论文包括:安全领域的《The Devil Behind Moltbook》揭示自进化三难困境;效率优化方面的《MiniCPM-SALA》实现长文本高效处理;多模态研究《DeepGen 1.0》以轻量化模型提升图像生成质量;机器人领域《GigaBrain-0.5M*》结合世界模型强化学习提升任务性能。这些研究展现了AI从&qu原创 2026-02-15 00:27:47 · 482 阅读 · 0 评论 -
2026年02月12日热门论文
当前AI研究呈现三大核心趋势:效率优化、多模态融合与Agent应用深化。大模型研究转向参数精简与推理加速,如Flash模型通过稀疏架构实现11B活跃参数的高效推理;多模态突破2D-3D生成边界,如Stroke3D实现笔触到绑定动画的转换;Agent系统向专业化发展,涵盖代码生成、经济谈判等场景,如FeatureBench构建功能开发评估体系。同时强化学习与安全对齐技术持续升级,形成技术深耕-场景拓展-安全兜底的三维发展格局,推动AI从实验室走向产业落地。原创 2026-02-12 23:27:43 · 984 阅读 · 0 评论 -
2026年02月11日热门论文
当前AI领域研究正循着“穷则变,变则通,通则久”的演进逻辑,从规模化扩张转向精细化深耕,呈现三大核心趋势:一是,LLM预训练与扩散模型突破“规模依赖”,通过数据精准筛选、长上下文压缩、训练方差优化实现“提质降本”;二是,Agent智能体从单一场景适配走向多模态协同、环境自主生成与技能递归进化,逼近真实世界交互需求;三是,多模态模型打破视觉、音频、文本的壁垒,在科学推理、具身交互、高保真生成等场景实现“感知-推理-行动”闭环。原创 2026-02-12 01:12:02 · 583 阅读 · 0 评论 -
2026年02月10日热门论文
当下AI领域研究正朝着“高效化、多模态、强落地、负责任”四大核心方向深度演进。模型效率优化聚焦参数利用与推理提速,通过混合专家架构、量化技术、动态路由等手段,在不牺牲性能的前提下降低部署成本;agent智能体成为落地核心载体,覆盖科学发现、金融分析、人机交互等多元场景,强化长程推理与自主决策能力;同时,模型可靠性与数据治理受到广泛关注,从偏见修正、隐私保护到数据分层管理,为技术可持续发展筑牢根基。正如《周易》所言“穷则变,变则通,通则久”,这些趋势正是AI技术在突破瓶颈、回应现实需求过程中的必然演进。原创 2026-02-11 01:11:27 · 352 阅读 · 0 评论 -
2026年02月09日热门论文
本文总结了前沿论文围绕LLM应用的五大核心趋势:1)LLM Agent能力强化,聚焦可靠性、记忆管理与安全防御;2)多模态融合与推理,推动感知向协同推理演进;3)检索与深度推理联动,解决知识时效性与推理深度问题;4)优化算法与效率提升;5)构建真实场景评估体系。重点介绍了CAR-bench评估Agent一致性、Spider-Sense分层防御框架、MemSkill动态记忆优化等创新工作,以及多模态推理中的时序一致性保障和数学定理语义检索等突破,为LLM从能力生成到价值落地提供了系统性技术路径。原创 2026-02-08 22:49:02 · 687 阅读 · 0 评论 -
2026年02月01日热门论文
当前AI研究呈现四大趋势:1)LLM效率革新,聚焦嵌入缩放、令牌压缩与量化训练(如Scaling Embeddings、ConceptMoE);2)多模态融合,突破跨模态协同与幻觉抑制(如MMFineReason、MAD);3)Agent赋能科研,通过长上下文推理与闭环流程推动自动化(如DeepSearchQA);4)实用导向强化,通过基准测试(如EEG Foundation Models)与专用模型实现精准落地。这些研究从算力优化到场景深耕,推动AI从理论到应用的跨越式发展。原创 2026-02-01 00:03:38 · 923 阅读 · 0 评论 -
[论文阅读笔记79]An Index-based Approach for Efficient and Effective Web Content Extrac
本文提出基于索引的网页内容提取方法(Index-based Web Content Extraction),通过将HTML分割为结构化片段并预测相关位置索引,有效解决现有方法在效率与适应性上的不足。该方法训练了IndexLM系列模型(0.6B/1.7B/4B参数),在RAGQA系统和直接评估中表现优异:平均F1最高达57.94(RAGQA)、87.40(主内容提取)、31.69(查询相关提取),提取速度比生成式方法快10倍以上。实验表明,该方法能有效处理海量网页内容,克服LLM上下文限制问题。原创 2025-12-22 00:47:39 · 539 阅读 · 0 评论 -
[论文阅读笔记78]BookRAG:A Hierarchical Structure-aware Index-based Approach for Retrie
BookRAG提出了一种针对复杂层级文档(如书籍、手册)的新型检索增强生成方法,其创新点在于:1)构建BookIndex索引结构,融合文档原生层级树和细粒度知识图谱;2)基于信息觅食理论实现智能检索策略,动态分类查询类型并匹配定制化流程。该方法通过梯度基实体消歧优化知识图谱质量,在三大基准测试中取得SOTA性能,最高检索召回率达71.2%,QA准确率显著提升,同时保持高效响应速度和低token消耗。核心优势在于有效结合文档结构与语义信息,解决了传统RAG方法处理复杂文档的局限性。原创 2025-12-22 00:39:35 · 636 阅读 · 0 评论 -
Kimi聊天的人太多,要排队
Kimi K2思维模型技术解析:这款原生INT4量化模型采用1.04万亿参数的MoE架构,通过384个专家模块和MLA注意力机制实现高效推理。其关键技术包括:MuonClip优化器确保15.5万亿token训练的稳定性;创新的后训练方法结合3000+真实工具库;强化学习框架VerifiableRewards实现可验证奖励机制。相比同类模型,K2在长序列处理(256k上下文)和复杂任务(200-300步调用)上表现突出,GPU内存占用仅30GB,推理延迟降低50%。该模型在代码、数学等多领域展现出优异的Age原创 2025-11-09 23:59:03 · 2868 阅读 · 0 评论 -
[论文阅读笔记01]Neural Architectures for Nested NER through Linearization
[论文阅读笔记]Neural Architectures for Nested NER through Linearization题目 Neural Architectures for Nested NER through Linearization【基于线性化方法的嵌套NER神经结构】摘要 提出了两种结构与一个BILOU sckema.第一种结构,基于LSTM+CRF标准模型,把所有标签经过笛卡尔乘积的形式组合成多标签任务;第二种结构,把Nested NER任务看作为seq2seq任务来处理,由tok原创 2020-08-21 12:00:27 · 1510 阅读 · 3 评论 -
[论文阅读笔记02]Nested Named Entity Recognition via Second-best Sequence Learning and Decoding
题目Nested Named Entity Recognition via Second-best Sequence Learning and Decoding通过次优序列学习和解码嵌套命名实体识别摘要在训练神经模型上,设计了一个目标函数去处理嵌套实体的标签序列作为在双新实体跨度的次优路径;在解码预测上,使用从外部到内部的迭代提取实体的方式;效果为目前领先。问题背景这个句子来自GENIA dataset。主体中包含了三个实体。也从很多文献得到,实体嵌套是一个很普遍的现象。如果默认为实体命名原创 2020-08-26 11:53:21 · 1679 阅读 · 0 评论 -
[论文阅读笔记03]Multi-Graid Namened Entity Recognition
题目Multi-Grained Named Entity Recognition多粒度命名实体识别作者University of Illinois at Chicago,Tencent Medical AI Lab,Alibaba Group,University at Buffalo,Zhejiang Lab摘要主要提出MGNER框架(Multi-Grained Named Entity Recognition).相对于一般的实体识别任务,MGNER发现与识别多跨度的实体,无论是非重叠的或者完原创 2020-08-31 18:08:42 · 658 阅读 · 0 评论 -
[论文阅读笔记04]GFTE:Graph-based Financial Table Extraction
一,题目GFTE:Graph-based Financial Table Extraction 【GFTE:基于图方法的财务表格抽取】二,作者Yiren Li∗, Zheng Huang†, Junchi Yan‡, Yi Zhou§, Fan Ye¶ and Xianhui LiukShanghai Jiao Tong University,China Financial Fraud Research Center三,解决问题[问题前景]当前的工具对财务表格数据抽取不理想,从而提出一个对于原创 2020-12-25 11:39:20 · 1302 阅读 · 1 评论 -
[论文阅读笔记05]Deep Active Learning for Named Entity Recognition
一,题目Deep Active Learning for Named Entity Recognition【NER任务的深度主动学习】来源:ICLR 2018原文:DEEP ACTIVE LEARNING FOR NAMED ENTITY RECOGNITION二,作者Yanyao Shen,Hyokun Yun,Zachary C. Lipton,Yakov Kronrod,Animashree AnandkumarUniversity of Texas at Austin[得克萨斯大学奥斯汀原创 2020-12-30 18:05:08 · 1172 阅读 · 0 评论 -
[论文阅读笔记06]OpenUE:An Open Toolkit of Universal Extraction from Text
一,论文题目OpenUE: An Open Toolkit of Universal Extraction from TextOpenUE:一个开源的通用文本信息抽取工具发表会议:EMNLP 2020 (Demo)二,本文作者张宁豫,浙江大学讲师/alibaba,研究方向为自然语言处理、知识图谱;本文是浙江大学和阿里达摩院合作发表在EMNLP2020上的Demo论文。三, 摘要提出了大多数的NLP任务都可以用单一模型来表示的思想,提供了开源与可扩展的抽取工具OpenUE【3】;另外布署了re原创 2021-01-04 23:34:14 · 1702 阅读 · 0 评论 -
[论文阅读笔记07]Learning from Context or Names? An Empirical Study on Neural Relation Extraction
1. 题目Learning from Context or Names?An Empirical Study on Neural Relation Extraction从上下文学习还是从实体名称中学习?一个关于神经关系抽取的实证研究2. 作者Hao Peng1∗ , Tianyu Gao2∗ , Xu Han1 , Yankai Lin3 , Peng Li3 , Zhiyuan Liu1*†* ,Maosong Sun1 , Jie Zhou3单位:Tsinghua University,P原创 2021-01-07 14:54:19 · 1552 阅读 · 0 评论 -
[论文阅读笔记08]Generalizing from a Few Examples:A Survey on Few-Shot Learning
一,题目Generalizing from a Few Examples: A Survey on Few-Shot Learning从少样本中概括:少样本综述FSL: Few-Shot Learning二,作者YAQING WANG, Hong Kong University of Science and Technology and 4Paradigm IncQUANMING YAO, 4Paradigm IncJAMES T. KWOK, Hong Kong University of原创 2021-01-12 16:30:23 · 4006 阅读 · 0 评论 -
[论文阅读笔记09]A Frustratingly Easy Approach for Joint Entity and Relation Extraction
一,题目A Frustratingly Easy Approach for Joint Entity and Relation Extraction一种简单易行的联合实体和关系提取方法二,作者Zexuan ZhongDanqi Chen:https://www.cs.princeton.edu/~danqic/Email: danqic@cs.princeton.eduDepartment of Computer Science Princeton University 普林斯顿大学 世界排名原创 2021-01-15 16:49:44 · 3605 阅读 · 3 评论 -
[论文阅读笔记10]A General Framework for Information Extraction using Dynamic Span Graphs
1. 题目论文题目:A General Framework for Information Extraction using Dynamic Span Graphs使用动态跨度图提取信息的通用框架论文来源:NAACL 2019 Google AI Language, 华盛顿大学论文链接:https://www.aclweb.org/anthology/N19-1308/代码链接:https://github.com/luanyi/DyGIE关键词:信息抽取,dynamic span graph,原创 2021-01-19 11:13:30 · 1251 阅读 · 1 评论 -
[论文阅读笔记11]Entity,Relation,Event Extraction with Contextualized Span Representations
1. 题目论文题目:Entity, Relation, and Event Extraction with Contextualized Span Representations论文来源:EMNLP 2019 华盛顿大学, Google AI Language论文链接:https://www.aclweb.org/anthology/D19-1585/ https://arxiv.org/pdf/1909.03546.pdf代码链接:https://github.com/dwadden/dygie原创 2021-01-21 09:21:17 · 1881 阅读 · 0 评论 -
[论文阅读笔记12]An Effective Transition-based Model for Discontinuous NER
一, 题目《An Effective Transition-based Model for Discontinuous NER》论文:An Effective Transition-based Model for Discontinuous NER.pdf代码: https://github.com/daixiangau/acl2020-transition-discontinuous-ner**实验数据:**https://data.csiro.au/dap/landingpage?pid=csi原创 2021-01-21 18:15:09 · 2686 阅读 · 0 评论 -
[论文阅读笔记13]A Survey on Deep Learning for Named Entity Recognition
1. 题目A Survey on Deep Learning for Named Entity RecognitionNER的深度学习综述2. 作者Jing Li, Aixin Sun, Jianglei Han, and Chenliang LiNanyang Technological University 南洋理工大学SAPWuhan University 武汉大学Accepted in IEEE TKDETKDE:Transactions on Knowledge an原创 2021-01-27 15:47:01 · 2513 阅读 · 2 评论 -
[论文阅读笔记14]Nested named entity recognition revisited
一, 题目Nested Named Entity Recognition Revisited重访问的嵌套命名实体识别二, 作者Arzoo Katiyar and Claire CardieDepartment of Computer ScienceCornell University 康奈尔大学 (世界顶级私立研究型大学,2021QS世界大学排名世界第18)Ithaca, NY, 14853, USA三,摘要对RNN的创新,提出识别与检测嵌套NER的方法,从RNN中抽取出一个超图表示。原创 2021-01-28 17:26:15 · 1996 阅读 · 0 评论 -
[论文阅读笔记15]Recognizing Complex Entity Mentions:A Review and Future Directions
一,题目Recognizing Complex Entity Mentions:A Review and Future Directions识别复杂实体mentions:回顾与未来方向Dai X . Recognizing Complex Entity Mentions: A Review and Future Directions[C]// The ACL 2018 Student Research Workshop. 2018.二,作者Xiang DaiCSIRO Data61 and Sc原创 2021-01-29 16:30:32 · 667 阅读 · 0 评论 -
[论文阅读笔记16]More data,relations,context ,openness:A review and outlook for relation extraction
一. 题目More data, more relations, more context and more openness: A review and outlook for relation extraction.关系抽取的回顾与展望论文:https://arxiv.org/pdf/2004.03186.pdf2020年引用:Xu Han, Tianyu Gao, Yankai Lin, Hao Peng, Yaoliang Yang, Chaojun Xiao, Zhiyuan Liu,原创 2021-02-04 17:47:05 · 1027 阅读 · 0 评论 -
[论文阅读笔记17]A Survey on Knowledge Graph-Based Recommender Systems
一,题目TKDE 2020A Survey on Knowledge Graph-Based Recommender Systems综述:基于知识图谱的推荐系统In IEEE Transactions on Knowledge and Data Engineering (IEEE TKDE), 2020doi: 10.1109/TKDE.2020.3028705.二,作者Qingyu Guo, Fuzhen Zhuang, Chuan Qin, Hengshu Zhu, Xing Xie, H原创 2021-02-19 17:41:31 · 5372 阅读 · 1 评论 -
[论文阅读笔记18] Jointly Multiple EE via Attention-based Graph Information Aggregation
1. 论文题目Jointly Multiple Events Extraction via Attention-based Graph Information Aggregation论文来源:EMNLP 2018论文链接:https://arxiv.org/abs/1809.09078代码链接:https://github.com/lx865712528/EMNLP2018-JMEE关键词:多事件抽取,GCN,attention,句法依存结构2. 作者Xiao Liu†andZhunchen原创 2021-02-22 17:37:36 · 880 阅读 · 0 评论
分享