HyperAI超神经-CSDN博客

原创【持续更新中！图像-文本对数据集汇总】Stable Diffusion 3 重磅开源，超全图像生成必备训练数据集、教程汇总

Stability AI 已经正式开源 Stable Diffusion 3（简称 SD3）！SD3 是一个图像生成模型，只要给定一段描述性的文字，就能够创造出与之匹配的视觉作品。下图就是由 SD3 生成的图像。* prompt史诗级动漫作品：一位巫师在夜晚的山顶上向黑暗的天空施放宇宙咒语，咒语上写着「Stable Diffusion 3」，由五彩缤纷的能量组成在 SD3 的背后，是庞大的图像-文...

2024-06-13 11:00:53 4475

原创【持续更新中！气象数据集汇总】气象局首次发布训练数据目录！CAMELS 美国天文气象数据集等上线官网

该数据集为论文「Global prediction of extreme floods in ungauged watersheds」的研究数据，主要内容为 AI 模型生成的洪水重新分析 (1984-2021) 和重新预测 (2014-2021) 数据以及相应的 GloFAS 基准数据。数据集可鼓励在天气领域进行机器学习研究，方便在理解和减轻气候变化影响方面的工作。SEVIR 将多种天气传感模式组合并整合成一个单一的、可访问的数据集，该数据集可在云端免费访问，可供气象学家、数据科学家和其他研究人员使用。

2024-05-30 16:18:00 2375

原创【持续更新中，图像分割数据集】字节发布 COCONut 入选 CVPR 2024，立即体验 Segment Anything 分割万物！｜持续更新中！

随着计算机视觉技术的不断发展，图像分割在诸多领域展现出重要的应用价值。近年来，各种图像分割数据集如雨后春笋般涌现。上个月，字节跳动发布了首个大规模全景图像分割数据集「COCONut」，为这一领域的研究注入了新鲜血液。HyperAI超神经本周汇总了 10 个优质的图像分割数据集进行汇总和分析，以更好地推动相关研究的进展。除此之外，GitHub 上超火的项目「Segment Anything 分割万物...

2024-05-09 15:09:25 1403 1

原创【持续更新中！数学数据集汇总】天才博士陶哲轩力荐数据集！含代码、中文竞赛题目、正向逆向问答对等

数学数据集持续更新中，建议收藏！欢迎投稿优质数据集

2024-04-23 20:19:00 2650

原创在线教程丨 David Baker 团队开源 RFdiffusion3，实现全原子蛋白质设计的生成式突破

「RFdiffusion3：蛋白质设计模型」现已上线 HyperAI超神经官网（hyper.ai）的「教程」板块，快来一键部署体验！

2025-12-31 16:31:43 516

原创在线教程丨David Baker团队开源RFdiffusion3，实现全原子蛋白质设计的生成式突破

目前包括 RFdiffusion（RFD1）和 BindCraft 在内的大多数方法，均采用氨基酸残基水平的蛋白质表示，已能够成功设计蛋白质单体、组装体以及蛋白质-蛋白质相互作用体系，但其分辨率仍不足以精确设计与非蛋白质组分（如小分子配体与核酸）发生特异性侧链相互作用的结构。研究团队通过设计并实验表征 DNA 结合蛋白与半胱氨酸水解酶，展示了 RFD3 的广泛适用性，其能够基于任意非蛋白质原子环境快速生成受复杂原子级约束引导的蛋白质结构，将进一步拓展蛋白质设计所能实现的功能范围。

2025-12-31 11:01:06 364

原创「地质约束显式+数据驱动模型」的新路径，浙江大学团队实现跨区域矿产远景预测性能和可解释性提升

浙江大学的研究团队提出了一种地质约束的数据驱动成矿预测方法，通过将各向异性空间邻近关系与空间非平稳建模机制显式引入预测框架，实现对成矿异质性与方向性控制的定量表达。

2025-12-30 16:42:52 815

原创【vLLM 学习】Reproduciblity

源码 examples/offline_inference/reproduciblity.py。推理加速而设计的框架，实现了 KV 缓存内存几乎零浪费，解决了内存管理瓶颈问题。更多 vLLM 中文文档及教程可访问 →vllm.hyper.ai/

2025-12-30 16:28:57 158

原创【Triton 教程】triton_language.make_block_ptr

它旨在提供一个基于 Python 的编程环境，以高效编写自定义 DNN 计算内核，并能够在现代 GPU 硬件上以最大吞吐量运行。更多 Triton 中文文档可访问 →triton.hyper.ai/返回指向父张量中 1 个块的指针。

2025-12-30 16:22:59 95

原创【TVM教程】设计与架构

IRModule：包含 relay.Function 和 tir.PrimFuncruntime.Module：包含 runtime.PackedFunc编译基本是在进行关键数据结构之间的转换。relay/transform 和 tir/transform 是确定性的基于规则的转换meta-schedule 则包含基于搜索的转换最后，编译流程示例只是 TVM 堆栈的一个典型用例。将这些关键数据结构和转换提供给 Python 和 C++ API。

2025-12-29 18:35:19 1044

原创【vLLM 学习】Profiling

vLLM 是一款专为大语言模型推理加速而设计的框架，实现了 KV 缓存内存几乎零浪费，解决了内存管理瓶颈问题。更多 vLLM 中文文档及教程可访问 →。

2025-12-26 18:48:21 187

原创【Triton 教程】triton_language.store

它旨在提供一个基于 Python 的编程环境，以高效编写自定义 DNN 计算内核，并能够在现代 GPU 硬件上以最大吞吐量运行。triton.PointerType, 或 dtype=triton.PointerType 的块。应为 {“”, “evict_first”, “evict_last”} 中的一个。是 1 个 N 维指针张量，则会存储 1 个 N 维张量。定义的块指针，则会存储 1 个张量。是单元素指针，则加载 1 个标量。将数据张量存储到由指针定义的内存位置。triton.int1 的块。

2025-12-26 18:43:52 235

原创【TVM 教程】处理 TVM 错误

恭喜！你找到了这篇文档。下面是一些关于如何理解这些错误信息以及遇到错误时可以采取哪些措施的提示。

2025-12-26 18:38:42 401

原创在线教程｜精准图像分层，Qwen-Image-Layered突破目标图层编辑痛点，兼顾高保真与一致性

「Qwen Image Layered Interface 自动拆分多个图层」已上线至 HyperAI超神经官网（hyper.ai）的教程板块，一键部署即可在线体验图像分层编辑。

2025-12-26 16:19:59 761

原创在线教程｜精准图像分层，Qwen-Image-Layered突破目标图层编辑痛点，兼顾高保真与一致性

3.选择「NVIDIA GeForce RTX 5090-2」以及「PyTorch」镜像，按照需求选择「Pay As You Go（按量付费）」或「Daily Plan/Weekly Plan/Monthly Plan（包日/周/月」，点击「Continue job execution（继续执行）」。多数模型本质上仍以整图像素生成与重绘为核心，前景、背景、光影在隐空间中高度耦合，所谓「分层编辑」更多只是基于遮罩的局部重生成，并不具备可持续存在的对象与图层概念，亟需引入结构感知和对象级的图层建模能力。

2025-12-25 20:01:41 830

原创计算成本减半，化学反应发现工具ChemOntology将人类直觉「编码」到系统中，加速反应路径搜索

日本北海道大学开发的 ChemOntology 框架，实现了化学本体论从「描述性标注」到「指导性控制」的跨越。该框架在经典 Heck 反应机理研究中的成功应用，不仅验证了其加速路径搜索的有效性，也凸显出「化学知识」与「自动化计算」相融合的巨大潜力。

2025-12-24 14:43:38 602

原创入选NeurIPS 2025，智源/北大/北邮提出多流控制视频生成框架，基于音频解混实现精确音画同步

音频驱动视频生成的现有方法，往往面临音频整体性带来的处理限制，使音频与视觉之间的对应关系趋于模糊。对此，北京智源人工智能研究院、北京大学、北京邮电大学共同提出了一种基于解混音频的音画同步视频生成框架，将输入音频拆分为语音、音效和音乐三类音轨，验证了音频解混与多流控制在复杂视频生成任务中的有效性。

2025-12-23 14:30:59 770

原创三维视觉新突破：字节Seed推出DA3，实现任意视角重建视觉空间；7w+真实工业环境数据！CHIP 填补 6D姿态估计工业数据空白

HyperAI 超神经为大家整理了 12.15-12.19 期间一系列极具价值且应用广泛的教程和数据集，涵盖 3D 视觉、具身智能、OCR 等多个领域~

2025-12-23 14:09:54 628

原创在线教程丨基于AI手势识别，仅用CPU即可定制形态多变的3D圣诞树

「基于手势识别的 3D 圣诞树」已上线 HyperAI超神经官网（hyper.ai）的教程板块，随着圣诞节脚步临近，快来生成专属圣诞树吧！

2025-12-23 14:03:14 715

原创在线教程丨基于AI手势识别，仅用CPU即可定制形态多变的3D圣诞树

如果放入了更多照片（例如从默认的 31 张增加到 100 张），需要打开文件：dependencies.sh，将看到：export VITE_TOTAL_PHOTOS=31，修改数字「31」为实际图片数量，然后关闭容器再次启动即可。装饰圣诞树几乎成了每个家庭迎接节日时不可或缺的一环，彩灯一圈圈绕上树枝，挂件、照片慢慢填满空隙，灯亮起的那一刻，节日的氛围也随之到位。更有意思的是，这不仅是一棵普通的圣诞树，通过上传个性化、有意义的图片，用户还能将其装扮为一个充满回忆的交互式艺术画廊。

2025-12-22 20:54:37 561

原创三维视觉新突破：字节Seed推出DA3，实现任意视角重建视觉空间；7w+真实工业环境数据！CHIP填补6D姿态估计工业数据空白

从视觉输入中感知和理解三维空间信息的能力，是空间智能的基石，也是机器人与混合现实（Mixed Reality，ML）等应用的关键需求。Depth-Anything-3（DA3）是由 ByteDance-Seed 团队发布的突破性视觉几何模型，以「极简建模」理念革新视觉几何任务：仅采用单一普通 Transformer（如 vanilla DINO 编码器）作为骨干网络，通过「深度射线表示」替代复杂多任务学习，即可从任意视觉输入（已知/未知相机姿态均可）中预测空间一致的几何结构。

2025-12-22 20:54:37 649

原创 AI 论文周报丨英伟达开源模型/OpenAI基准测试/Agent系统/长上下文推理……AI 动态一文速递

12.8-12.12 AI 论文推荐

2025-12-19 13:08:08 809

原创预测精度可提升60%，清华李勇团队提出神经符号回归方法，自动推导高精度网络动力学公式

清华大学电子工程系李勇教授及团队提出了一种神经符号回归方法 ND²，通过从数据中自动推导出数学公式来刻画系统动力学。该方法将高维网络上的搜索问题等价地简化为一维系统，并利用预训练神经网络引导高精度的公式发现。

2025-12-19 12:47:53 753

原创 GPT-5全面领先，OpenAI发布FrontierScience，「推理+科研」双轨检验大模型能力

2025 年 12 月 16 日，OpenAI 推出了旨在衡量专家级科学能力的基准测试 FrontierScience，并以「FrontierScience：evaluating AI’s ability to perform expert-level scientific tasks」为题发布论文成果。根据初步评估，GPT-5.2 在 FrontierScience-Olympiad 和 Research 任务中分别得分 25% 和 77%，领先于其他前沿模型。

2025-12-18 15:08:42 1033

原创坚持提前监管，离开OpenAI后，Dario Amodei将AI安全写入公司使命

在全球 AI 竞速按下「加速键」的当下，Dario Amodei 却以「提前监管」的少数派立场成为硅谷最不可忽视的力量。从推动 Constitutional AI，到影响欧美监管框架，他试图为 AI 时代奠定一套类似 TCP/IP 的「治理协议」。这不仅关乎安全，更关乎未来十年 AI 能否从技术狂飙走向稳定应用。Amodei 的策略，正在重塑全球 AI 产业的底层逻辑。

2025-12-18 14:51:56 839

原创【vLLM 学习】vLLM TPU 分析

vLLM 是一款专为大语言模型推理加速而设计的框架，实现了 KV 缓存内存几乎零浪费，解决了内存管理瓶颈问题。更多 vLLM 中文文档及教程可访问 →源码此脚本用于分析 vLLM 在特定预填充(prefill)或解码(decode)令牌形状下的 TPU 性能表现。注意：实际运行的服务器会混合处理多种形状的预填充和解码请求。假设您已在使用 TPU 环境(本测试基于 TPU v6e)并已按照完成 vLLM 安装。

2025-12-17 17:21:56 454

原创【Triton 教程】triton_language.load

Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境，以高效编写自定义 DNN 计算内核，并能够在现代 GPU 硬件上以最大吞吐量运行。是 1 个 N 维指针张量，则加载 1 个 N 维张量。或 dtype=triton.PointerType 的块。是单元素指针，则加载 1 个标量。定义的块指针，则加载 1 个张量。应为 {“”, “ca”, “cg”} 中的一个。更多 Triton 中文文档可访问 →。triton.int1 的块。

2025-12-17 17:17:52 426

原创【TVM 教程】设置 RPC 系统

远程过程调用（RPC）是 Apache TVM 中非常重要和有用的功能，它允许我们在真实硬件上运行已编译好的神经网络（NN）模型，无需手动操作远程设备，输出结果会通过网络自动返回。通过省去一些人工操作，比如将输入数据转储到文件、将导出的神经网络模型拷贝到远程设备、设置设备用户环境、将输出结果拷贝回主机开发环境，RPC 极大地提升了开发效率。此外，由于只有已编译神经网络模型的执行部分运行在远程设备上，所有其他部分都运行在主机开发环境中，因此可以使用任何 Python 包来完成预处理和后处理工作。

2025-12-17 17:14:45 399

原创【vLLM 学习】Prithvi Geospatial Mae

vLLM 是一款专为大语言模型推理加速而设计的框架，实现了 KV 缓存内存几乎零浪费，解决了内存管理瓶颈问题。更多 vLLM 中文文档及教程可访问 →。

2025-12-17 17:10:29 363

原创【Triton 教程】triton_language.dot

Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境，以高效编写自定义 DNN 计算内核，并能够在现代 GPU 硬件上以最大吞吐量运行。这 2 个块必须都是二维或三维的并且有兼容的内部维度。对于三维的块，tl.dot 执行批量矩阵乘积，其中每个块的第一维度代表批量维度。更多 Triton 中文文档可访问 →。返回 2 个块的矩阵乘积。

2025-12-17 17:06:49 262

原创【TVM 教程】Python 目标参数化

对于任何支持的开发环境，TVM 都应该生成数值正确的结果。因此，在编写验证数值输出的单元测试时，这些单元测试应在所有受支持的开发环境上执行。由于这是一个非常常见的使用场景，TVM 提供了辅助函数来参数化单元测试，使它们可以在所有已启用且具有兼容设备的目标上运行。测试套件中的一个 Python 函数可以展开成多个参数化的单元测试，每个测试针对一个单一的目标设备。测试必须存在于已传递给 pytest 的文件或目录中。

2025-12-17 17:01:33 400

原创【vLLM 学习】Prefix Caching

vLLM 是一款专为大语言模型推理加速而设计的框架，实现了 KV 缓存内存几乎零浪费，解决了内存管理瓶颈问题。更多 vLLM 中文文档及教程可访问 →。

2025-12-17 16:54:42 389

原创【Triton 教程】triton_language.view

Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境，以高效编写自定义 DNN 计算内核，并能够在现代 GPU 硬件上以最大吞吐量运行。返回具有与输入相同元素但形状不同的张量，元素的顺序可能无法保持。更多 Triton 中文文档可访问 →。的成员函数调用，使用。

2025-12-17 16:46:28 370

原创【TVM 教程】交叉编译与 RPC

在远程设备上设置 RPC 服务器；在本地设置目标设备的交叉编译配置；通过 RPC API 上传并远程运行内核程序。可右键另存为下载。

2025-12-17 16:37:37 618

原创 CUDA初始团队成员锐评cuTile「专打」Triton，Tile范式能否重塑GPU编程生态竞争格局

2025 年 12 月，在 CUDA 发布近二十年后，NVIDIA 推出新的 GPU 编程入口「cuTile」，通过 Tile-based 编程模型重构 GPU 内核，使开发者无需深入 CUDA C++ 即可高效编写 Kernel，引发社区热议。尽管仍处早期，Tile 思维的抽象优势、社区探索迁移工具及实践尝试表明，cuTile 有潜力成为 GPU 编程新范式，其未来取决于生态成熟度、迁移成本及性能表现。

2025-12-17 16:09:10 407