HyperAI超神经-CSDN博客

原创【持续更新中！图像-文本对数据集汇总】Stable Diffusion 3 重磅开源，超全图像生成必备训练数据集、教程汇总

Stability AI 已经正式开源 Stable Diffusion 3（简称 SD3）！SD3 是一个图像生成模型，只要给定一段描述性的文字，就能够创造出与之匹配的视觉作品。下图就是由 SD3 生成的图像。* prompt史诗级动漫作品：一位巫师在夜晚的山顶上向黑暗的天空施放宇宙咒语，咒语上写着「Stable Diffusion 3」，由五彩缤纷的能量组成在 SD3 的背后，是庞大的图像-文...

2024-06-13 11:00:53 4707

原创【持续更新中！气象数据集汇总】气象局首次发布训练数据目录！CAMELS 美国天文气象数据集等上线官网

该数据集为论文「Global prediction of extreme floods in ungauged watersheds」的研究数据，主要内容为 AI 模型生成的洪水重新分析 (1984-2021) 和重新预测 (2014-2021) 数据以及相应的 GloFAS 基准数据。数据集可鼓励在天气领域进行机器学习研究，方便在理解和减轻气候变化影响方面的工作。SEVIR 将多种天气传感模式组合并整合成一个单一的、可访问的数据集，该数据集可在云端免费访问，可供气象学家、数据科学家和其他研究人员使用。

2024-05-30 16:18:00 2536

原创【持续更新中，图像分割数据集】字节发布 COCONut 入选 CVPR 2024，立即体验 Segment Anything 分割万物！｜持续更新中！

随着计算机视觉技术的不断发展，图像分割在诸多领域展现出重要的应用价值。近年来，各种图像分割数据集如雨后春笋般涌现。上个月，字节跳动发布了首个大规模全景图像分割数据集「COCONut」，为这一领域的研究注入了新鲜血液。HyperAI超神经本周汇总了 10 个优质的图像分割数据集进行汇总和分析，以更好地推动相关研究的进展。除此之外，GitHub 上超火的项目「Segment Anything 分割万物...

2024-05-09 15:09:25 1479 1

原创【持续更新中！数学数据集汇总】天才博士陶哲轩力荐数据集！含代码、中文竞赛题目、正向逆向问答对等

数学数据集持续更新中，建议收藏！欢迎投稿优质数据集

2024-04-23 20:19:00 2799

原创康奈尔大学开发多智能体平台EMSeek，仅需2-5分钟即可将电子显微镜图像转化为材料学见解

来自康奈尔大学的研究团队提出了一个模块化且具备溯源追踪能力的多智能体平台 EMSeek，在 20 种材料体系和五类任务上的评测结果表明，其在分割任务上实现了约两倍于 Segment Anything 的速度并具备更高精度，并且在仅约 2% 标注数据进行校准的情况下，在 3 个分布外性质预测基准上达到或超过强单一专家模型的表现。完整查询在每张图像上仅需 2 至 5 分钟，速度约为专家流程的 50 倍。

2026-04-09 13:38:38 306

原创仅需 3 秒音频实现「配音自由」，Mistral 开源语音大模型 Voxtral-4B-TTS-2603；多项全能！Capybara 一站式搞定图、视频生成与指令编辑

在实际应用中，语音智能体和内容播报不仅需要极高的语言理解力，还要求模型能在本地环境低延迟运行，并支持多语种的无缝切换。该数据集是一个用于大语言模型预训练的高质量教学数据集，由 Sutra 框架生成，创建了结构化的教育内容，优化了语言模型的预训练。该数据集是由 NVIDIA 联合 Pleias 公司于 2026 年发布的法国合成人物数据集，包含基于法国真实人口统计、地理和性格特征分布生成的合成人物数据，旨在通过反映法国的地理和人口分布，提供多样化的合成人物数据以支持模型开发。

2026-04-08 14:29:50 354

原创【vLLM 学习】Helm 图表

vLLM 是一款专为大语言模型推理加速而设计的框架，实现了 KV 缓存内存几乎零浪费，解决了内存管理瓶颈问题。

2026-04-07 10:51:27 204

原创【Triton 教程】triton-ops

Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境，以高效编写自定义 DNN 计算内核，并能够在现代 GPU 硬件上以最大吞吐量运行。

2026-04-07 10:49:03 231

原创【TVM教程】理解 Relax 抽象层

TVM 现已更新到 0.21.0 版本，TVM 中文文档已经和新版本对齐。Apache TVM 是一个深度的深度学习编译框架，适用于 CPU、GPU 和各种机器学习加速芯片。

2026-04-07 10:46:11 364

原创在线教程丨Qwen3.5 27B蒸馏Claude 4.6 Opus推理能力，兼顾高质量输出与低门槛部署

HyperAI 官网（hyper.ai）的教程板块已上线「一键部署 Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled」，快来体验高性能推理模型吧！

2026-04-03 15:16:39 380

原创基于2千种半导体材料的模拟光谱数据，MIT团队提出DefectNet，可解析6种共存的取代型缺陷

来自 MIT 的研究团队提出了一种基础型机器学习模型 DefectNet，能够直接从振动光谱中预测取代型点缺陷的化学种类及其浓度，即使在多元素共存的情况下亦可实现。模型在包含 56 种元素的未见晶体中展现出良好的泛化能力，并可通过实验数据进行微调。

2026-04-02 16:27:10 328

原创在线教程丨华中科大与小红书 hi lab开源dots.mocr，SOTA级OCR模型完美还原文档结构，图形也能转 SVG

华中科技大学与小红书hilab联合开源dots.mocr多模态文档解析工具，突破传统OCR局限，实现对复杂文档中文字、图表、表格等元素的统一结构化处理，支持SVG代码转换。HyperAI官网已上线配套教程，用户可通过克隆容器、选择GPU配置（含1美元20小时RTX5090新用户福利）在线体验。该技术显著提升文档理解深度，为自动化处理提供新范式。（99字）

2026-04-01 19:28:09 202

原创【Triton 教程】math-ops

Triton是一种基于Python的并行编程语言和编译器，专为高效编写DNN计算内核并最大化GPU吞吐量而设计。该语言提供丰富的数学运算函数，包括abs()求绝对值、cdiv()向上取整除、ceil()向上取整、clamp()数值限定、cos()/sin()三角函数、exp()/log()指数对数运算、floor()向下取整、fma()融合乘加、maximum()/minimum()极值运算、sqrt()平方根、sigmoid()激活函数等。这些函数支持逐元素运算，部分可作为张量的成员方法调用，并提供了IE

2026-04-01 18:37:20 387

原创【vLLM 学习】Api Client

LLM 是一款专为大语言模型推理加速而设计的框架，实现了 KV 缓存内存几乎零浪费，解决了内存管理瓶颈问题。

2026-04-01 12:49:40 27

原创【TVM教程】面向机器学习模型的图抽象

TVM 0.21.0版本已发布，中文文档同步更新。TVM是一个深度学习编译框架，支持多种硬件平台。文章重点介绍了机器学习编译中的图抽象技术，即将模型表示为有向图（节点为计算操作，边为数据流），以及Relax IR的关键特性：支持符号形状、多层次抽象和可组合变换。这些特性使TVM能够进行跨层次优化，提升模型性能。教程提供了在线学习链接和示例代码，展示如何用Relax IR表示简单神经网络。

2026-04-01 12:48:43 240

原创 AI发现118颗新系外行星！华威大学团队提出RAVEN，实现行星情景与每一种假阳性情景的逐一对比

来自华威大学的研究团队提出一个面向 TESS 候选体的全新筛选与验证流程 RAVEN，其引入了合成训练数据集，不再仅依赖任务本身产生的阈值越界事件（TCE）数据，这一改进大幅拓展并增强了机器学习模型所覆盖的行星与假阳性情景参数空间。在一个包含 1361 个预分类 TESS 候选体的独立外部测试集中，该流程实现了 91% 的总体准确率，展示了其在自动排序 TESS 候选体方面的有效性。

2026-03-31 12:44:47 362

原创 MIT提出首个端到端动力学蛋白质生成模型VibeGen，实现序列与振动的双向映射

MIT 与卡内基梅隆大学研究团队提出的蛋白质生成智能体模型 VibeGen，通过将序列生成与振动动力学预测相结合，实现了从头蛋白质设计。研究结果表明，该生成式智能体所设计的蛋白质，不仅能够折叠为稳定且新颖的结构，还可在主链层面上重现目标振动振幅的分布特征。

2026-03-30 12:32:00 373

原创数据集汇总丨英伟达/OpenAI及多所科研机构开源推理数据集，覆盖数学/全景空间/Wiki问答/科研任务/视觉常识等

HyperAI 整理了一批优质的推理数据集，覆盖多领域、多任务推理、合成推理训练数据，科研评测基准以及大规模问答数据，并支持下载或在线使用数据集。

2026-03-27 17:49:53 384

原创高精度重建完全遮挡物体，MIT团队利用生成式AI改进无线视觉系统，最高精度达85%

MIT 的研究人员提出了一种名为 Wave-Former 的新型方法，能够实现对完全被遮挡的、形态多样的日常物体进行高精度的三维形状重建。该方法不仅解决了信号噪声高、遮挡严重的问题，同时通过创新的物理感知训练框架，实现了基于合成数据训练而在真实环境中高保真重建的能力。在与最先进基线方法的直接对比中，Wave-Former 将召回率从 54% 提升至 72%，同时保持了 85% 的高精度。

2026-03-26 12:50:13 351

原创在线教程丨低门槛部署英伟达最新Physical AI模型，覆盖人形机器人/人体运动生成/扩散模型微调等

NVIDIA 在 GTC 2026 上发布了 NVIDIA Isaac GR00T、Kimodo 和 SOMA-X 三个开源项目，分别从决策、生成与表示三个层面，切入同一个问题——如何让机器更自然、更高效地完成复杂动作。同时还还发布了 FDFO 这一面向扩散模型的训练方法，从生成模型优化的角度，为上述能力提供底层支撑。

2026-03-25 13:49:56 376

原创【vLLM 学习】Vision Language Multi Image

vLLM框架实现大语言模型高效推理，通过优化KV缓存内存管理解决性能瓶颈。本文展示如何使用vLLM进行多图像输入的视觉语言模型离线推理，包括加载不同模型（如Aria、Deepseek-VL2、Gemma3等）的处理流程。示例提供了完整的代码实现，涵盖图像获取、提示构建和参数设置，特别针对多图像输入场景优化了内存分配。通过定义ModelRequestData数据类统一管理请求参数，并支持自定义停止标记和聊天模板。该方案已在L4 GPU上验证可行性，适用于各类视觉语言任务。

2026-03-24 14:44:00 41

原创【Triton 教程】triton_language.erf

Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境，以高效编写自定义 DNN 计算内核，并能够在现代 GPU 硬件上以最大吞吐量运行。*在线运行 Triton 学习教程 →。

2026-03-24 14:36:07 213

原创【TVM教程】Relax

TVM 0.21.0版本已发布，中文文档同步更新。TVM是一个深度学习编译框架，支持多种硬件平台。Relax是TVM中的高级抽象层，用于图优化和转换，常与TensorIR结合使用。文档提供了Relax的核心概念、创建方法和优化转换指南，包括图抽象、TVMScript编程、NNModule API等。可通过在线教程学习TVM使用。（字数：150字）

2026-03-24 14:32:18 33

原创洪水预报性能堪比美国国家气象局，知识引导型机器学习模型FHNN结合实时观测数据改进预测效果原创

来自明尼苏达大学双城分校的研究团队开发了一种创新知识引导型机器学习模型，该模型的算法结构直接受到水文学科学知识的启发，被称为因子化层级神经网络（FHNN）。研究表明，在预报发布后 2–7 天的时间尺度上，该模型的性能与美国国家气象局的洪水预报相当甚至更好，并且优于未在结构中融入物理科学知识的主流机器学习方法。

2026-03-24 12:38:01 393

原创洪水预报性能堪比美国国家气象局，知识引导型机器学习模型FHNN结合实时观测数据改进预测效果

在更早之前，来自 Google Research 的 Grey Nearing 及其团队还开发了一个基于机器学习的河流预报模型 (river forecast model)，该模型能够提前 5 天实现对洪水的可靠预测，在对 5 年一遇的洪水事件进行预测时，性能优于或相当于目前预测 1 年一遇的洪水事件，系统可覆盖 80 多个国家。研究表明，在预报发布后 2–7 天的时间尺度上，该模型的性能与美国国家气象局的洪水预报相当甚至更好，并且优于未在结构中融入物理科学知识的主流机器学习方法。

2026-03-24 11:05:29 291

原创 ICLR 2026丨英伟达/牛津大学等提出原子级蛋白质结合剂生成方法，性能达SOTA级别

英伟达、牛津大学、魁北克人工智能研究所等机构的联合研究团队提出了 Proteína-Complexa 框架，旨在弥合生成式与幻觉式方法之间的断层，将基础生成模型与推理时优化机制统一于同一体系之中，能够实现最优的从头结合剂设计，且无需额外的序列重新设计步骤。

2026-03-23 11:43:22 385

原创在线教程丨基于免费CPU部署OpenClaw，轻松接入飞书/Discord等社交软件

为了便于开发者体验 OpenClaw 在实际应用场景中的能力，HyperAI 上线了「🦞 OpenClaw：使用 Free-CPU 调用 API 运行」与「🦞 OpenClaw 的 GPU 运行教程」，将 OpenClaw 集成到各种社交应用中，实现丰富的自动化任务。

2026-03-20 21:46:34 488

原创在线教程丨狂揽7.7万stars，LLM Course覆盖从入门到进阶的干货知识与实战课程

一个名为 LLM Course 的开源项目自发布以来便受到广泛关注，至今已获得 7.7 万 stars，其将分散在论文、博客与代码实践中的知识，重新组织成一套结构清晰、路径明确的学习体系。HyperAI 将 LLM Course 中包含 Notebook 演示的部分内容，上线至「教程」版块，所有运行环境均已完整配置，可开箱即用。

2026-03-19 15:28:22 235

原创【vLLM 学习】Vision Language Embedding

vLLM是一款高效的大语言模型推理加速框架，专注于优化KV缓存内存管理，实现接近零浪费。该示例展示了如何使用vLLM进行离线推理，支持文本、图像及多模态嵌入生成。代码提供了两种模型(e5_v和VLM2Vec-Full)的实现方案，包含不同模态输入的处理逻辑和提示模板。通过EngineArgs配置模型参数，LLM类执行推理任务，支持图像获取和嵌入输出。该框架简化了多模态模型的应用开发，适合需要高效处理复杂输入的场景。

2026-03-18 17:00:03 76

原创【Triton 教程】triton_language.div_rn

Triton是一种基于Python的并行编程语言和编译器，专为高效编写自定义DNN计算内核而设计，可优化在现代GPU上的运行性能。其内置函数如triton.language.div_rn(x,y)能实现符合IEEE标准的精确除法运算，支持张量块级操作。Triton提供了在线学习教程，帮助开发者快速掌握这一高性能编程工具。

2026-03-18 16:58:29 43

原创【TVM教程】转换

TVM 0.21.0版本更新后，文档展示了如何使用TensorIR优化矩阵乘法ReLU函数(mm_relu)。通过TVM Schedule API实现了循环分块和重排序等转换技术，将原始实现(2.7253ms)进行性能优化。文章详细演示了获取循环引用、拆分循环因子(j分j0,j1)、重排序循环(j0,k,j1)等关键步骤，并提供了转换前后的代码对比和性能评估方法。这些优化技术适用于CPU、GPU及各类AI加速芯片，是深度学习编译框架的核心功能。

2026-03-18 16:57:33 195

原创基于Gemini处理150国新闻，谷歌开源洪水数据集Groundsource，覆盖超260万历史记录

Google Research 发布的开源洪水数据集 Groundsource，用于从非结构化数据中提取经过验证的地面实况信息，从而以前所未有的精度绘制出历史灾害的足迹。研究人员对来自 150 多个国家的 500 多万篇新闻报道进行自动化处理，最终整理出超过 260 万条历史洪水事件记录，为全球洪水研究提供了前所未有的数据规模与覆盖度。

2026-03-18 16:23:48 685

原创 GTC 2026丨从Vera Rubin到NemoClaw：英伟达的未来不止GPU？

黄仁勋在 GTC 2026 上激情输出 2 小时，发布了一系列新品及开源成果。

2026-03-17 15:43:13 1177

原创 AI驱动量子精修，卡内基梅隆大学等提出AQuaRef，首次用量子力学约束精修蛋白质全原子模型

卡内基梅隆大学、波兰弗罗茨瓦夫大学、佛罗里达大学等高校的联合研究团队提出了一种人工智能驱动的量子精修方法 AQuaRef。该方法基于 AIMNet2 机器学习原子势函数，并针对精修任务进行了定制训练，在接近经典力场计算效率的同时，能够较好地逼近量子力学计算结果，为生物大分子的全原子量子精修提供了新的技术路径。

2026-03-16 13:52:15 422

原创低延迟、多语种、轻量化，Voxtral Realtime 打破 ASR 全场景桎梏；可穿戴设备设计福音！Antenna Performance 构建天线性能与故障数据集

摘要：MistralAI开源VoxtralMini4BRealtime2602多语言实时语音转录模型，支持13种语言，延迟可低至240ms，准确率接近离线系统，适合边缘计算部署。HyperAI官网更新了4个优质数据集（包括STEM推理、肺癌临床等）、3个教程（含腾讯视频生成模型）及3篇社区文章（物理信息GNN、肽预测框架等），并提供免费CPU资源部署热门开源模型的教程。

2026-03-13 16:23:29 374

原创基于2.5万临床数据，斯坦福大学发布首个原生3D腹部CT视觉语言模型，Merlin在752类任务中全面领先

斯坦福大学的研究团队提出了首个针对腹部 CT 的原生三维视觉语言基础模型 Merlin，以及一个包含 25,494 例腹部 CT 扫描与放射学报告配对的数据集。

2026-03-12 15:26:05 399

原创溶血性预测准确率提升350%，港中文/浙大/澳门理工等团队提出通用框架Bi-TEAM，融合生物学语义与化学精度

香港中文大学联合澳门理工大学、浙江大学、中南大学湘雅第二医院、中国电子科技大学等提出了一种选择性融合建模范式，基于「化学变异是对生物语义空间的局部扰动」这一认知，设计了将局部化学变异注入全局蛋白质背景的通用框架 Bi-TEAM。

2026-03-11 12:25:56 376

原创在线教程丨免费CPU资源快速部署，覆盖Qwen3.5/DeepSeek-R1/Gemma 3/Llama 3.2等热门开源模型

HyperAI 的「教程」版块上线了 Qwen、DeepSeek、Gemma、Llama、GLM 等热门开源模型基于 CPU 的在线运行教程，提供从环境准备、模型下载到推理运行的完整部署流程，无需本地部署复杂环境，即可完成模型推理体验与基础开发测试。

2026-03-10 11:46:25 507

原创物理信息机器学习新突破！新型GNN架构可对复杂多体动力系统进行准确预测，赋能机器人/航空航天/材料科学

来自瑞士洛桑联邦理工学院研究人员提出了一种新的模型架构 DYNAMI-CAL GraphNet，通过将线动量和角动量守恒定律直接嵌入模型结构，显式保证这两种守恒。实验结果表明：DYNAMI-CAL GRAPHNET 在需要对复杂多体动力系统进行准确、可解释且实时建模的领域中具有显著优势，例如机器人技术、航空航天工程以及材料科学。

2026-03-09 13:47:39 399

原创【vLLM 学习】Vision Language

vLLM 是一款专为大语言模型推理加速而设计的框架，实现了 KV 缓存内存几乎零浪费，解决了内存管理瓶颈问题。更多 vLLM 中文文档及教程可访问 →。

2026-03-09 10:10:53 53

空空如也

空空如也