- 博客(1623)
- 收藏
- 关注
原创 【持续更新中!图像-文本对数据集汇总】Stable Diffusion 3 重磅开源,超全图像生成必备训练数据集、教程汇总
Stability AI 已经正式开源 Stable Diffusion 3(简称 SD3)!SD3 是一个图像生成模型,只要给定一段描述性的文字,就能够创造出与之匹配的视觉作品。下图就是由 SD3 生成的图像。* prompt史诗级动漫作品:一位巫师在夜晚的山顶上向黑暗的天空施放宇宙咒语,咒语上写着「Stable Diffusion 3」,由五彩缤纷的能量组成在 SD3 的背后,是庞大的图像-文...
2024-06-13 11:00:53
4474
原创 【持续更新中!气象数据集汇总】气象局首次发布训练数据目录!CAMELS 美国天文气象数据集等上线官网
该数据集为论文 「Global prediction of extreme floods in ungauged watersheds」的研究数据,主要内容为 AI 模型生成的洪水重新分析 (1984-2021) 和重新预测 (2014-2021) 数据以及相应的 GloFAS 基准数据。数据集可鼓励在天气领域进行机器学习研究,方便在理解和减轻气候变化影响方面的工作。SEVIR 将多种天气传感模式组合并整合成一个单一的、可访问的数据集,该数据集可在云端免费访问,可供气象学家、数据科学家和其他研究人员使用。
2024-05-30 16:18:00
2375
原创 【持续更新中,图像分割数据集】字节发布 COCONut 入选 CVPR 2024,立即体验 Segment Anything 分割万物!|持续更新中!
随着计算机视觉技术的不断发展,图像分割在诸多领域展现出重要的应用价值。近年来,各种图像分割数据集如雨后春笋般涌现。上个月,字节跳动发布了首个大规模全景图像分割数据集「COCONut」,为这一领域的研究注入了新鲜血液。HyperAI超神经本周汇总了 10 个优质的图像分割数据集进行汇总和分析,以更好地推动相关研究的进展。除此之外,GitHub 上超火的项目「Segment Anything 分割万物...
2024-05-09 15:09:25
1403
1
原创 【持续更新中!数学数据集汇总】天才博士陶哲轩力荐数据集!含代码、中文竞赛题目、正向逆向问答对等
数学数据集持续更新中,建议收藏!欢迎投稿优质数据集
2024-04-23 20:19:00
2650
原创 在线教程丨 David Baker 团队开源 RFdiffusion3,实现全原子蛋白质设计的生成式突破
「RFdiffusion3:蛋白质设计模型」现已上线 HyperAI超神经官网(hyper.ai)的「教程」板块,快来一键部署体验!
2025-12-31 16:31:43
513
原创 「地质约束显式+数据驱动模型」的新路径,浙江大学团队实现跨区域矿产远景预测性能和可解释性提升
浙江大学的研究团队提出了一种地质约束的数据驱动成矿预测方法,通过将各向异性空间邻近关系与空间非平稳建模机制显式引入预测框架,实现对成矿异质性与方向性控制的定量表达。
2025-12-30 16:42:52
815
原创 【vLLM 学习】Reproduciblity
源码 examples/offline_inference/reproduciblity.py。推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。更多 vLLM 中文文档及教程可访问 →vllm.hyper.ai/
2025-12-30 16:28:57
158
原创 【Triton 教程】triton_language.make_block_ptr
它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。更多 Triton 中文文档可访问 →triton.hyper.ai/返回指向父张量中 1 个块的指针。
2025-12-30 16:22:59
94
原创 【TVM教程】设计与架构
IRModule:包含 relay.Function 和 tir.PrimFuncruntime.Module:包含 runtime.PackedFunc编译基本是在进行关键数据结构之间的转换。relay/transform 和 tir/transform 是确定性的基于规则的转换meta-schedule 则包含基于搜索的转换最后,编译流程示例只是 TVM 堆栈的一个典型用例。将这些关键数据结构和转换提供给 Python 和 C++ API。
2025-12-29 18:35:19
823
原创 【vLLM 学习】Profiling
vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。更多 vLLM 中文文档及教程可访问 →。
2025-12-26 18:48:21
187
原创 【Triton 教程】triton_language.store
它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。triton.PointerType, 或 dtype=triton.PointerType 的块。应为 {“”, “evict_first”, “evict_last”} 中的一个。是 1 个 N 维指针张量,则会存储 1 个 N 维张量。定义的块指针,则会存储 1 个张量。是单元素指针,则加载 1 个标量。将数据张量存储到由指针定义的内存位置。triton.int1 的块。
2025-12-26 18:43:52
235
原创 在线教程|精准图像分层,Qwen-Image-Layered突破目标图层编辑痛点,兼顾高保真与一致性
「Qwen Image Layered Interface 自动拆分多个图层」已上线至 HyperAI超神经官网(hyper.ai)的教程板块,一键部署即可在线体验图像分层编辑。
2025-12-26 16:19:59
760
原创 在线教程|精准图像分层,Qwen-Image-Layered突破目标图层编辑痛点,兼顾高保真与一致性
3.选择「NVIDIA GeForce RTX 5090-2」以及「PyTorch」镜像,按照需求选择「Pay As You Go(按量付费)」或「Daily Plan/Weekly Plan/Monthly Plan(包日/周/月」,点击「Continue job execution(继续执行)」。多数模型本质上仍以整图像素生成与重绘为核心,前景、背景、光影在隐空间中高度耦合,所谓「分层编辑」更多只是基于遮罩的局部重生成,并不具备可持续存在的对象与图层概念,亟需引入结构感知和对象级的图层建模能力。
2025-12-25 20:01:41
829
原创 计算成本减半,化学反应发现工具ChemOntology将人类直觉「编码」到系统中,加速反应路径搜索
日本北海道大学开发的 ChemOntology 框架,实现了化学本体论从「描述性标注」到「指导性控制」的跨越。该框架在经典 Heck 反应机理研究中的成功应用,不仅验证了其加速路径搜索的有效性,也凸显出「化学知识」与「自动化计算」相融合的巨大潜力。
2025-12-24 14:43:38
601
原创 入选NeurIPS 2025,智源/北大/北邮提出多流控制视频生成框架,基于音频解混实现精确音画同步
音频驱动视频生成的现有方法,往往面临音频整体性带来的处理限制,使音频与视觉之间的对应关系趋于模糊。对此,北京智源人工智能研究院、北京大学、北京邮电大学共同提出了一种基于解混音频的音画同步视频生成框架,将输入音频拆分为语音、音效和音乐三类音轨,验证了音频解混与多流控制在复杂视频生成任务中的有效性。
2025-12-23 14:30:59
768
原创 三维视觉新突破:字节Seed推出DA3,实现任意视角重建视觉空间;7w+真实工业环境数据!CHIP 填补 6D姿态估计工业数据空白
HyperAI 超神经为大家整理了 12.15-12.19 期间一系列极具价值且应用广泛的教程和数据集,涵盖 3D 视觉、具身智能、OCR 等多个领域~
2025-12-23 14:09:54
628
原创 在线教程丨基于AI手势识别,仅用CPU即可定制形态多变的3D圣诞树
「基于手势识别的 3D 圣诞树」已上线 HyperAI超神经官网(hyper.ai)的教程板块,随着圣诞节脚步临近,快来生成专属圣诞树吧!
2025-12-23 14:03:14
715
原创 在线教程丨基于AI手势识别,仅用CPU即可定制形态多变的3D圣诞树
如果放入了更多照片(例如从默认的 31 张增加到 100 张),需要打开文件:dependencies.sh,将看到:export VITE_TOTAL_PHOTOS=31,修改数字「31」为实际图片数量,然后关闭容器再次启动即可。装饰圣诞树几乎成了每个家庭迎接节日时不可或缺的一环,彩灯一圈圈绕上树枝,挂件、照片慢慢填满空隙,灯亮起的那一刻,节日的氛围也随之到位。更有意思的是,这不仅是一棵普通的圣诞树,通过上传个性化、有意义的图片,用户还能将其装扮为一个充满回忆的交互式艺术画廊。
2025-12-22 20:54:37
560
原创 三维视觉新突破:字节Seed推出DA3,实现任意视角重建视觉空间;7w+真实工业环境数据!CHIP填补6D姿态估计工业数据空白
从视觉输入中感知和理解三维空间信息的能力,是空间智能的基石,也是机器人与混合现实(Mixed Reality,ML)等应用的关键需求。Depth-Anything-3(DA3)是由 ByteDance-Seed 团队发布的突破性视觉几何模型,以「极简建模」理念革新视觉几何任务:仅采用单一普通 Transformer(如 vanilla DINO 编码器)作为骨干网络,通过「深度射线表示」替代复杂多任务学习,即可从任意视觉输入(已知/未知相机姿态均可)中预测空间一致的几何结构。
2025-12-22 20:54:37
649
原创 预测精度可提升60%,清华李勇团队提出神经符号回归方法,自动推导高精度网络动力学公式
清华大学电子工程系李勇教授及团队提出了一种神经符号回归方法 ND²,通过从数据中自动推导出数学公式来刻画系统动力学。该方法将高维网络上的搜索问题等价地简化为一维系统,并利用预训练神经网络引导高精度的公式发现。
2025-12-19 12:47:53
753
原创 GPT-5全面领先,OpenAI发布FrontierScience,「推理+科研」双轨检验大模型能力
2025 年 12 月 16 日,OpenAI 推出了旨在衡量专家级科学能力的基准测试 FrontierScience,并以「FrontierScience:evaluating AI’s ability to perform expert-level scientific tasks」为题发布论文成果。根据初步评估,GPT-5.2 在 FrontierScience-Olympiad 和 Research 任务中分别得分 25% 和 77%,领先于其他前沿模型。
2025-12-18 15:08:42
1033
原创 坚持提前监管,离开OpenAI后,Dario Amodei将AI安全写入公司使命
在全球 AI 竞速按下「加速键」的当下,Dario Amodei 却以「提前监管」的少数派立场成为硅谷最不可忽视的力量。从推动 Constitutional AI,到影响欧美监管框架,他试图为 AI 时代奠定一套类似 TCP/IP 的「治理协议」。这不仅关乎安全,更关乎未来十年 AI 能否从技术狂飙走向稳定应用。Amodei 的策略,正在重塑全球 AI 产业的底层逻辑。
2025-12-18 14:51:56
839
原创 【vLLM 学习】vLLM TPU 分析
vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。更多 vLLM 中文文档及教程可访问 →源码此脚本用于分析 vLLM 在特定预填充(prefill)或解码(decode)令牌形状下的 TPU 性能表现。注意:实际运行的服务器会混合处理多种形状的预填充和解码请求。假设您已在使用 TPU 环境(本测试基于 TPU v6e)并已按照完成 vLLM 安装。
2025-12-17 17:21:56
454
原创 【Triton 教程】triton_language.load
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。是 1 个 N 维指针张量,则加载 1 个 N 维张量。或 dtype=triton.PointerType 的块。是单元素指针,则加载 1 个标量。定义的块指针,则加载 1 个张量。应为 {“”, “ca”, “cg”} 中的一个。更多 Triton 中文文档可访问 →。triton.int1 的块。
2025-12-17 17:17:52
426
原创 【TVM 教程】设置 RPC 系统
远程过程调用(RPC)是 Apache TVM 中非常重要和有用的功能,它允许我们在真实硬件上运行已编译好的神经网络(NN)模型,无需手动操作远程设备,输出结果会通过网络自动返回。通过省去一些人工操作,比如将输入数据转储到文件、将导出的神经网络模型拷贝到远程设备、设置设备用户环境、将输出结果拷贝回主机开发环境,RPC 极大地提升了开发效率。此外,由于只有已编译神经网络模型的执行部分运行在远程设备上,所有其他部分都运行在主机开发环境中,因此可以使用任何 Python 包来完成预处理和后处理工作。
2025-12-17 17:14:45
399
原创 【vLLM 学习】Prithvi Geospatial Mae
vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。更多 vLLM 中文文档及教程可访问 →。
2025-12-17 17:10:29
363
原创 【Triton 教程】triton_language.dot
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。这 2 个块必须都是二维或三维的并且有兼容的内部维度。对于三维的块,tl.dot 执行批量矩阵乘积,其中每个块的第一维度代表批量维度。更多 Triton 中文文档可访问 →。返回 2 个块的矩阵乘积。
2025-12-17 17:06:49
262
原创 【TVM 教程】Python 目标参数化
对于任何支持的开发环境,TVM 都应该生成数值正确的结果。因此,在编写验证数值输出的单元测试时,这些单元测试应在所有受支持的开发环境上执行。由于这是一个非常常见的使用场景,TVM 提供了辅助函数来参数化单元测试,使它们可以在所有已启用且具有兼容设备的目标上运行。测试套件中的一个 Python 函数可以展开成多个参数化的单元测试,每个测试针对一个单一的目标设备。测试必须存在于已传递给 pytest 的文件或目录中。
2025-12-17 17:01:33
400
原创 【vLLM 学习】Prefix Caching
vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。更多 vLLM 中文文档及教程可访问 →。
2025-12-17 16:54:42
388
原创 【Triton 教程】triton_language.view
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。返回具有与输入相同元素但形状不同的张量,元素的顺序可能无法保持。更多 Triton 中文文档可访问 →。的成员函数调用,使用。
2025-12-17 16:46:28
369
原创 【TVM 教程】交叉编译与 RPC
在远程设备上设置 RPC 服务器;在本地设置目标设备的交叉编译配置;通过 RPC API 上传并远程运行内核程序。可右键另存为下载。
2025-12-17 16:37:37
618
原创 CUDA初始团队成员锐评cuTile「专打」Triton,Tile范式能否重塑GPU编程生态竞争格局
2025 年 12 月,在 CUDA 发布近二十年后,NVIDIA 推出新的 GPU 编程入口「cuTile」,通过 Tile-based 编程模型重构 GPU 内核,使开发者无需深入 CUDA C++ 即可高效编写 Kernel,引发社区热议。尽管仍处早期,Tile 思维的抽象优势、社区探索迁移工具及实践尝试表明,cuTile 有潜力成为 GPU 编程新范式,其未来取决于生态成熟度、迁移成本及性能表现。
2025-12-17 16:09:10
407
原创 在线教程丨微软开源VibeVoice,可实现90分钟4角色自然对话
微软开源 VibeVoice,能够在 64K 上下文窗口中合成长达 90 分钟、包含最多 4 名说话人的语音,音色更为丰富、语调更趋自然,并捕捉真实对话氛围。「VibeVoice-Realtime TTS:实时语音合成服务」已上线 HyperAI 官网(hyper.ai)的教程版块,欢迎前来体验!
2025-12-16 12:05:07
700
原创 低门槛试用Open-AutoGLM:屏幕理解+自动执行的智能体体验;Spatial-SSRL-81k构建空间感知的自监督提升路径
HyperAI 超神经为大家整理了 12.8-12.12 期间一系列极具价值且应用广泛的教程和数据集,涵盖智能体、计算机视觉、TTS 等多个领域~
2025-12-15 15:10:51
774
原创 以不足10万结构数据训练,瑞士洛桑联邦理工提出PET-MAD,原子模拟精度媲美专业模型
瑞士洛桑联邦理工学院提出的 PET-MAD 模型,依托覆盖广泛原子多样性的数据集,在使用远少于传统规模的训练样本的情况下,仍实现了与专用模型相当的精度,为原子模拟向更高效、更普适的方向发展提供了有力示范。
2025-12-15 14:40:55
637
原创 AI 论文周报丨Attention机制/英伟达VLA模型/TTS模型/图神经网络……一文了解 AI 最新进展
12.8-12.12 AI 论文精选
2025-12-12 15:23:57
893
原创 活动回顾丨 北大/清华/Zilliz/MoonBit共话开源,覆盖视频生成/视觉理解/向量数据库/AI原生编程语言
HyperAI超神经作为 COSCon’25 的联合出品社区,于 12 月 7 日举办了「产研开源协同论坛」。本文为 4 位讲师的深度分享精华摘要,后续我们还会以视频的形式分享完整演讲,敬请期待!
2025-12-12 14:02:24
978
原创 卡内基跨学科团队利用随机森林模型,基于406份样本成功捕捉33亿年前生命遗迹
美国卡内基科学研究所联合全球多所院校组成跨领域团队,精进了热解气相色谱-质谱+监督机器学习的「技术融合」解决方案,可在混乱的分子碎片中捕捉古老的生命遗迹。
2025-12-11 13:50:46
1052
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅