- 博客(1360)
- 收藏
- 关注

原创 【一千个论文合集】计算机科学的26个细分领域近年必读论文集合
AMiner必读论文是一个可以帮您了解某个领域、机构、期刊、会议的学术专辑,包括必读论文和代表学者,由AI初筛+学者复核后提供给您,您可以收藏为自己的论文清单
2022-05-11 15:17:34
21758
1
原创 打破近五年空白!复旦陈涛团队提出具身AI压缩新范式,斩获IJCAI杰出论文奖!
复旦大学团队在IJCAI 2025上发表的论文《Boost Embodied AI Models with Robust Compression Boundary》获得杰出论文奖,实现了中国团队在该奖项的突破。论文提出了一种增强压缩边界方法(BRCB),解决了具身AI在部署时效率与鲁棒性之间的矛盾。BRCB通过抗干扰机制和突破鲁棒性边界两大创新,使压缩后的模型在保持轻量化的同时,抗干扰能力甚至超越原始模型。实验表明,在自动驾驶和机器人应用中,BRCB在干扰场景下的表现优于现有方法,模型部署效率显著提升。
2025-09-15 10:10:31
530
原创 你的眼睛会撒谎,AI的“眼睛”也会!揭秘人类与机器的视错觉差异!
虽然当前的视觉语言模型越来越能够承担需要人类完成的任务,甚至与人类在某些“错误”上达成一致,但它们依然缺少一个强大的内部感知模型,也非常容易出现由语言驱动的偏差。人类与人工智能在视错觉方面的对比揭示出人与AI的本质差异,人类依赖经验和情景构建知觉,而AI则更注重数据和统计逻辑。如果我们能让AI理解视错觉背后的逻辑,解决AI特有的感知漏洞,减少无中生有的幻觉,才能让AI在更大程度上与人类建立更加互信的关系。毕竟,懂得彼此的“错误”,才是最深的理解。
2025-09-12 18:44:09
642
原创 诺贝尔奖但搞笑:当研究者给筷子通上电,吃货的未来亮了!
日本科学家凭借"能改变味道的通电筷子"获得2023年搞笑诺贝尔营养学奖。这项研究源自鲶鱼全身味蕾的启发,通过电流刺激味觉细胞,让普通食物产生"隐形调料"效果。实验显示通电筷子能使低盐食物的咸味提升1.5倍,已在减盐健康领域投入应用。该技术打破了人类味觉的生理局限,未来或将成为新型"健康调味料",让人们在享受美味的同时控制盐糖摄入。这项看似滑稽的研究,实则是科技重构健康饮食生态的重要突破。
2025-09-12 11:05:06
890
原创 我国正在规划撞击一颗小行星,小行星动能撞击与防御技术经历了怎样的发展?
中国将启动小行星防御验证任务,采用"伴飞+撞击+伴飞"创新模式。这是继6600万年前Chicxulub撞击事件后,人类主动防御小行星威胁的重要尝试。AMiner调研显示,该领域已积累多项关键技术成果,包括动量传递效率研究、自主导航系统等。中国将推动国际合作,共享监测数据与研究成果,共同应对这一全球性挑战。
2025-09-09 15:18:10
577
原创 警惕!你和ChatGPT的对话,可能正在制造分布式妄想
分布式妄想并非仅存在于精神疾病的案例中,普通人也有可能陷入与AI共构的幻觉。比如,一个对社会怀有不满的人可能会在人工智能伴侣身上找到完美的知己;一个确信政治选举被盗的人可能会使用人工智能聊天机器人来制定关于欺诈如何发生、谁负责以及哪些行动可以做出回应的详细理论。这些并不是简单的AI幻觉可以解释的,而是人机之间的互动对现实的扭曲。作者警示我们,AI早已不是外部工具,而是认知生态的参与者。当我们依赖它记忆、思考和叙事时,必须意识到,我们与AI的边界正在模糊,而真实感,可能正由算法和人类共同书写。
2025-09-05 15:21:00
1424
2
原创 5分钟检索百篇文献完成万字报告|AMiner沉思免费开放
近日,AMiner团队基于智谱自研GLM-Z1-Rumination沉思模型,正式推出「AMiner沉思」DeepResearch功能。
2025-09-02 11:04:03
1024
原创 港科大Aivilization登场,打造“AI版星露谷物语”!解锁多智能体互动新玩法!
港科大Aivilization项目让AI模拟人类活动,玩家可定制智能体。华盛顿大学MAC环境研究多智能体社交学习,二者均推动AI社交智能发展。
2025-09-01 13:21:53
678
原创 Kimi杨植麟署名新论文新注意力架构MoBA发布,代码公开
大模型(LLM)是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。这些模型通常基于深度学习架构,如转化器,这有助于它们在各种NLP任务上取得令人印象深刻的表现。
2025-02-25 11:32:38
977
原创 DeepSeek梁文锋挂名,公开新注意力架构NSA
大模型(LLM)是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。这些模型通常基于深度学习架构,如转化器,这有助于它们在各种NLP任务上取得令人印象深刻的表现。
2025-02-25 11:25:54
957
原创 上交大团队发布更精准的Less is More,删减84%数据反提升效果
大模型(LLM)是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。这些模型通常基于深度学习架构,如转化器,这有助于它们在各种NLP任务上取得令人印象深刻的表现。
2025-02-25 11:12:45
1089
原创 Kimi k1.5技术报告,深度长思考
大模型(LLM)是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。这些模型通常基于深度学习架构,如转化器,这有助于它们在各种NLP任务上取得令人印象深刻的表现。
2025-02-23 23:57:14
1089
原创 微软Phi-4技术报告,合成数据占比40%,14B小模型数学击败GPT-4o
大模型(LLM)是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。这些模型通常基于深度学习架构,如转化器,这有助于它们在各种NLP任务上取得令人印象深刻的表现。
2025-02-23 23:53:31
720
原创 苹果视频生成大模型STIV,87亿参数一统T2V、TI2V任务
大模型(LLM)是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。这些模型通常基于深度学习架构,如转化器,这有助于它们在各种NLP任务上取得令人印象深刻的表现。
2025-02-23 23:45:02
702
原创 DeepSeek-R1技术报告
大模型(LLM)是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。这些模型通常基于深度学习架构,如转化器,这有助于它们在各种NLP任务上取得令人印象深刻的表现。
2025-02-16 14:48:45
1140
原创 上交大新作,817样本激发7倍推理性能
大模型(LLM)是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。这些模型通常基于深度学习架构,如转化器,这有助于它们在各种NLP任务上取得令人印象深刻的表现。
2025-02-16 14:38:09
1160
原创 清华、港科大(广)和艾默里大学联合发布大模型推理技术综述
大模型(LLM)是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。这些模型通常基于深度学习架构,如转化器,这有助于它们在各种NLP任务上取得令人印象深刻的表现。
2025-01-20 18:56:36
1121
原创 腾讯开源AI视频修复工具SVFR,一键将黑白视频变彩色、高清
大模型(LLM)是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。这些模型通常基于深度学习架构,如转化器,这有助于它们在各种NLP任务上取得令人印象深刻的表现。
2025-01-20 16:44:54
1626
原创 MiniMax 01首次开源,400万上下文,性能比肩GPT-4o
大模型(LLM)是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。这些模型通常基于深度学习架构,如转化器,这有助于它们在各种NLP任务上取得令人印象深刻的表现。
2025-01-17 17:51:35
1322
原创 阿里Qwen团队发布全新的过程奖励模型PRM,并且开源
大模型(LLM)是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。这些模型通常基于深度学习架构,如转化器,这有助于它们在各种NLP任务上取得令人印象深刻的表现。
2025-01-16 21:08:15
801
原创 GAN已死?GAN永生!碾压扩散模型
大模型(LLM)是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。这些模型通常基于深度学习架构,如转化器,这有助于它们在各种NLP任务上取得令人印象深刻的表现。
2025-01-15 21:06:54
703
原创 微软提出rStar-Math,自我进化深度思考,数学能力直逼o1
大模型(LLM)是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。这些模型通常基于深度学习架构,如转化器,这有助于它们在各种NLP任务上取得令人印象深刻的表现。
2025-01-15 20:47:56
1177
原创 简单、高效!REINFORCE++,比PPO快,比GRPO稳
大模型(LLM)是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。这些模型通常基于深度学习架构,如转化器,这有助于它们在各种NLP任务上取得令人印象深刻的表现。
2025-01-15 20:32:01
1217
原创 测试时计算,从System-1到System-2,解锁AI潜能
大模型(LLM)是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。这些模型通常基于深度学习架构,如转化器,这有助于它们在各种NLP任务上取得令人印象深刻的表现。
2025-01-14 17:51:57
869
原创 75页报告,英伟达发布「世界基础模型」,开启物理AI新时代丨大模型周报
大模型(LLM)是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。这些模型通常基于深度学习架构,如转化器,这有助于它们在各种NLP任务上取得令人印象深刻的表现。
2025-01-14 17:27:42
1149
原创 论文综述、模型评测、DeepSeek-V3技术报告丨大模型周报
本周大模型周报,包括多篇论文综述,模型推理、多模态等;清华和微软分别发布了模型评测相关论文,其中微软论文“透露”了顶级模型参数,4o-mini只有8B,Claude 3.5 Sonnet有175B;DeepSeek-V3技术报告火爆全球,Github 狂吸17K Star。
2025-01-11 14:24:33
1174
原创 Meta探索大模型记忆层,1280亿个参数,优于MoE
大模型(LLM)是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。这些模型通常基于深度学习架构,如转化器,这有助于它们在各种NLP任务上取得令人印象深刻的表现。
2025-01-08 20:34:36
418
原创 CMU和DeepMind新工作,VLM 、代理生成自己的记忆
大模型(LLM)是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。这些模型通常基于深度学习架构,如转化器,这有助于它们在各种NLP任务上取得令人印象深刻的表现。
2025-01-08 20:32:50
1042
原创 字节新研究,参数减少99.5%,5GB显存可跑
大模型(LLM)是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。这些模型通常基于深度学习架构,如转化器,这有助于它们在各种NLP任务上取得令人印象深刻的表现。
2025-01-08 20:29:54
636
原创 DeepSeek-V3 技术报告
大模型(LLM)是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。这些模型通常基于深度学习架构,如转化器,这有助于它们在各种NLP任务上取得令人印象深刻的表现。
2025-01-08 20:27:30
953
原创 清华大学团队升级SageAttention,即插即用,4比特量化三倍加速不掉点!
大模型(LLM)是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。这些模型通常基于深度学习架构,如转化器,这有助于它们在各种NLP任务上取得令人印象深刻的表现。本周大模型周报精选了7篇论文,分别来自清华大学的SageAttention2,腾讯的DRT-o1…
2024-12-30 21:06:31
1008
原创 Meta和斯坦福大学等机构提出发展形式化数学推理作为AI数学应用新方向
大模型(LLM)是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。这些模型通常基于深度学习架构,如转化器,这有助于它们在各种NLP任务上取得令人印象深刻的表现。
2024-12-26 20:50:55
1174
原创 Anthropic提出Best-of-N算法,文本、视觉和音频等大模型全线溃败
大模型(LLM)是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。这些模型通常基于深度学习架构,如转化器,这有助于它们在各种NLP任务上取得令人印象深刻的表现。
2024-12-25 22:56:56
1298
3
原创 阿里开源语音合成工具CosyVoice 2,实时合成。
大模型(LLM)是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。这些模型通常基于深度学习架构,如转化器,这有助于它们在各种NLP任务上取得令人印象深刻的表现。
2024-12-24 23:12:23
1433
原创 Anthropic 137页长论文,Claude伪对齐率能高达78%丨大模型周报
大模型(LLM)是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。这些模型通常基于深度学习架构,如转化器,这有助于它们在各种NLP任务上取得令人印象深刻的表现。本周大模型周报整理了8篇热门论文,分别有Anthropic 137页长论文、李飞飞团队提出新型框架,利用多模态语言模型统一了言语和非言语语言,更多论文请查看专题!
2024-12-24 20:24:33
930
原创 Qwen2.5技术报告
大模型(LLM)是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。这些模型通常基于深度学习架构,如转化器,这有助于它们在各种NLP任务上取得令人印象深刻的表现。
2024-12-23 20:25:50
871
原创 DeepSeek开源DeepSeek-VL2系列,采用专家混合架构,显著提升多模态理解能力
大模型(LLM)是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。这些模型通常基于深度学习架构,如转化器,这有助于它们在各种NLP任务上取得令人印象深刻的表现。
2024-12-21 17:06:30
1080
原创 Meta 、芝加哥大学等机构联合发布无Token大语言模型BLT
大模型(LLM)是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。这些模型通常基于深度学习架构,如转化器,这有助于它们在各种NLP任务上取得令人印象深刻的表现。
2024-12-18 20:29:41
969
原创 Meta提出大型概念模型,在句子表示空间中的语言建模
大模型(LLM)是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。这些模型通常基于深度学习架构,如转化器,这有助于它们在各种NLP任务上取得令人印象深刻的表现。
2024-12-17 19:36:31
951
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人