RWKV元始智能-CSDN博客

大家好，我们在 2024 年底推出了 “RWKV 2025 生态内容征集大赛”，公开征集 RWKV 相关的作品，包括但不限于 RWKV 相关的论文、讲解 RWKV 的教程，以及基于 RWKV 的应用等。2025 年 8 月，活动共收到 RWKV 生态作品投稿 1 篇高质量论文和 2 个应用。本文将公布 2025 年 8 月的活动投稿作品及评审结果。

2025-09-02 15:42:03 589

原创 RWKV 社区八月动态：RWKV7s 0.1B 发布，G0 13B 训练中，6 篇论文

2025年8月，RWKV社区迎来多项重要进展：模型方面，开源发布RWKV-7s 0.1B版本，并启动了13.3B大模型的训练，在三分之一进度时MMLU测试已达63.21%。学术研究取得突破，5篇新论文发表于IEEE TCCN、Interspeech等顶级期刊会议，涵盖4G/5G服务预测、语音识别、骨签匹配、图像超分辨率等多个领域。社区还参与了全球互联网大会，展示了RWKV技术的最新应用成果。这些进展持续推动着RWKV在AI各领域的创新应用。

2025-09-01 11:25:59 845

原创 RWKV 社区七月动态：RWKV7-G0 7.2B 模型发布，8 篇高质量论文

欢迎大家收看《RWKV 社区最新动态》，本期内容收录了 RWKV 社区 2025 年 7 月的最新动态。只需 3 分钟，快速了解 RWKV 社区 7 月都有哪些新鲜事！

2025-07-31 16:23:11 915

原创全新高效模型架构！RWKV-7s闪耀WAIC

RWKV团队在2025世界人工智能大会上发布RWKV-7s高效大模型架构，荣获"镇馆之宝-未来之星"称号。该架构采用DeepEmbed和DeepEmbedAttention创新技术，显著提升端侧部署性能，已与移远通信等多家厂商达成合作。现场展示了包括离线聊天、音乐创作、图像识别等5款端侧应用，其中RWKV Chat在手机端推理速度达30 token/s。团队还透露下一代RWKV-8架构正在研发中，预计年内发布。这些进展彰显了RWKV在高效AI模型领域的领先地位和广阔应用前景。

2025-07-29 17:41:06 808

原创 WAIC首日 | RWKV-7s 新型高效大模型架构正式亮相

月26日，RWKV 携全球领先的大模型架构 RWKV-7 亮相 2025 世界人工智能大会暨人工智能全球治理高级别会议（以下简称 “ WAIC 2025”），并首次公开了 RWKV-7s 架构。元始智能作为企业代表向国务院总理李强、上海市委书记陈吉宁介绍 RWKV 架构、生态和产业化近况。

2025-07-28 15:12:13 517

原创 RWKV7-G0 7.2B 发布，最强纯 RNN 推理模型

RWKV7-G0 7.2B是2025年7月发布的开源纯RNN语言模型，可能是迄今最强的RNN推理模型。基于RWKV6训练2T tokens，融合大量指令和推理数据。MMLU准确度达62.7%，显著超越前代54.2%。具备出色的数学解题和代码生成能力，支持多轮验算和自我纠错。相比Transformer架构，RNN在抗干扰能力上表现更优，思考过程匀速稳定。模型已在Hugging Face等平台开源，支持本地部署和在线试用。

2025-07-25 13:46:28 978

原创 RWKV-7s 即将亮相 WAIC

RWKV团队将亮相2025世界人工智能大会（7月26-29日），重磅发布最新RWKV-7s混合架构。团队在上海世博展览馆1层Hall3-D701及B1层Hall4-FT305设有双展位，诚邀业界同仁现场交流，共同探讨人工智能领域的前沿技术突破。

2025-07-22 13:50:09 289

原创 RWKV 2025 生态内容征集大赛 | 6 月投稿作品及评审结果

2025 年 6 月，活动共收到 RWKV 生态作品投稿 3 篇高质量论文。本文将公布 2025 年 6 月的活动投稿作品及评审结果。

2025-07-07 17:02:22 904

原创 RWKV 社区六月动态：多次亮相高规格活动，适合混合架构的新特性发布

新特性发布、多篇高质量相关论文、大量高规格活动和高水平项目。欢迎大家收看《RWKV 社区最新动态》，本期内容收录了 RWKV 社区 2025 年 6 月的最新动态。

2025-07-01 16:19:54 1359

原创 RWKV-8 系列之 DeepEmbedAttention：精简 KV 缓存，尤其适合混合模型（RWKV-7s）

RWKV团队公开了新型注意力机制DeepEmbedAttention(DEA)，该技术基于RWKV-8的DeepEmbed设计，具有极小的KV缓存特性（仅需64个值），比现有高效注意力机制缓存缩小9倍。实验表明，加入DEA的RWKV-7s混合模型在处理长上下文时表现更优，loss差值随文本长度增加持续下降。该技术特别适合混合模型应用，能将长上下文性能提升至Transformer水平。团队表示RWKV-8最终目标是实现无需KV缓存仍保持强大上下文能力，更多技术细节将陆续公布。

2025-06-30 18:06:48 589

原创 Ollama 已支持 RWKV-7 模型，可灵活开关思考模式

Ollama现已支持RWKV7-G1和RWKV-7-World模型系列，用户可通过简单命令安装并运行这些模型。操作步骤包括下载Ollama、安装后运行指定模型命令，支持对话模式切换和上下文管理。推荐使用RWKV7-G1系列模型，还提供了RWKV Chat应用作为替代选择。用户可访问RWKV中文官网和社区获取更多资源与支持。

2025-06-20 17:20:12 635

原创 RWKV 2025 生态内容征集大赛 | 5 月投稿作品及评审结果

大家好，我们在 2024 年底推出了 “RWKV 2025 生态内容征集大赛”，公开征集 RWKV 相关的作品，包括但不限于 RWKV 相关的论文、讲解 RWKV 的教程，以及基于 RWKV 的应用等。2025 年 5 月，活动共收到 RWKV 生态作品投稿 2 份，包括 1 篇论文、1个教程。本文将公布 2025 年 5 月的活动投稿作品及评审结果。

2025-06-10 16:49:47 828

原创 RWKV 社区五月动态：多篇高质量论文、RWKV-8 第一个新特性公布！

欢迎大家收看《RWKV 社区最新动态》，本期内容收录了 RWKV 社区 2025 年 5 月的最新动态。

2025-05-30 15:57:10 1282

原创 RWKV-8 预览之 DeepEmbed：对端侧友好的稀疏设计，解决 MoE 显存占用

RWKV-8 "Heron" 是我们的下一代架构，具有多个全新技术。在此我们首先公布其中的 DeepEmbed 技术，它可以实现类似 MoE 的优秀推理性能，同时无需占用显存，甚至无需占用内存，可以让稀疏的大模型真正部署到所有端侧设备。

2025-05-28 10:54:52 772

原创 RWKV7-G1 2.9B 推理模型开源发布，展示数学/代码/全球语言能力，已适配手机 app

RWKV 基金会于2025年5月20日开源了RWKV7-G1 2.9B推理模型，该模型具备强大的推理和任务处理能力，支持100多种语言，并在多语言、数学和代码任务中表现出色。模型基于World v3.5数据集训练，包含5.16T tokens的数据。RWKV7-G1 2.9B在英语和多语言能力上显著优于同规模开源模型，MMLU准确度达到58%。此外，模型在Uncheatable Eval评测中表现优异，超越多个知名模型。RWKV还发布了端侧聊天APP，支持Android和iOS平台，并开源了相关代码。

2025-05-21 11:03:43 1156

空空如也

空空如也