- 博客(1316)
- 收藏
- 关注

原创 【持续更新中!图像-文本对数据集汇总】Stable Diffusion 3 重磅开源,超全图像生成必备训练数据集、教程汇总
Stability AI 已经正式开源 Stable Diffusion 3(简称 SD3)!SD3 是一个图像生成模型,只要给定一段描述性的文字,就能够创造出与之匹配的视觉作品。下图就是由 SD3 生成的图像。* prompt史诗级动漫作品:一位巫师在夜晚的山顶上向黑暗的天空施放宇宙咒语,咒语上写着「Stable Diffusion 3」,由五彩缤纷的能量组成在 SD3 的背后,是庞大的图像-文...
2024-06-13 11:00:53
3354

原创 【持续更新中!气象数据集汇总】气象局首次发布训练数据目录!CAMELS 美国天文气象数据集等上线官网
该数据集为论文 「Global prediction of extreme floods in ungauged watersheds」的研究数据,主要内容为 AI 模型生成的洪水重新分析 (1984-2021) 和重新预测 (2014-2021) 数据以及相应的 GloFAS 基准数据。数据集可鼓励在天气领域进行机器学习研究,方便在理解和减轻气候变化影响方面的工作。SEVIR 将多种天气传感模式组合并整合成一个单一的、可访问的数据集,该数据集可在云端免费访问,可供气象学家、数据科学家和其他研究人员使用。
2024-05-30 16:18:00
1823

原创 【持续更新中,图像分割数据集】字节发布 COCONut 入选 CVPR 2024,立即体验 Segment Anything 分割万物!|持续更新中!
随着计算机视觉技术的不断发展,图像分割在诸多领域展现出重要的应用价值。近年来,各种图像分割数据集如雨后春笋般涌现。上个月,字节跳动发布了首个大规模全景图像分割数据集「COCONut」,为这一领域的研究注入了新鲜血液。HyperAI超神经本周汇总了 10 个优质的图像分割数据集进行汇总和分析,以更好地推动相关研究的进展。除此之外,GitHub 上超火的项目「Segment Anything 分割万物...
2024-05-09 15:09:25
1119
1

原创 【持续更新中!数学数据集汇总】天才博士陶哲轩力荐数据集!含代码、中文竞赛题目、正向逆向问答对等
数学数据集持续更新中,建议收藏!欢迎投稿优质数据集
2024-04-23 20:19:00
1994
原创 在线教程丨刷新TTS模型SOTA,OpenAudio S1基于200万小时音频数据训练,深刻理解情感及语音细节
HyperAI超神经官网(hyper.ai)的教程板块现已上线了「OpenAudio-s1-mini:高效文本转语音生成工具」。
2025-06-13 13:29:11
807
原创 基于8.6万蛋白质结构数据,融合量子力学计算的机器学习方法挖掘69个全新氮-氧-硫键
针对 Gly - NOS - Cys 连接,∠CSN 是区分可能的 NOS 连接聚类的主要描述符,多数可能样本的 ∠CSN >80°,优化的 Gly - NOS - Cys 复合物的∠CSN值约为 94°;正如论文中所提到,快速发展的机器学习和人工智能技术在解决生物化学中的复杂问题方面,已经展现出了超越传统生物化学方法的优越性,它以低廉的计算成本和高效的方式,促使着科研界展开了一场关于「生产方式」的大变革,也推动者机器学习驱动的技术在破译蛋白质功能和识别新的蛋白质相互作用发挥更大的潜力。
2025-06-12 11:13:50
570
原创 【vLLM 学习】Data Parallel
vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。更多 vLLM 中文文档及教程可访问 →https://vllm.hyper.ai/
2025-06-12 10:16:41
115
原创 入选 ICML 2025,清华/人大提出统一生物分子动力学模拟器 UniSim
清华大学刘洋老师组、人民大学高瓴人工智能学院黄文炳老师组共同提出了一种统一的生物分子时间粗化(time-coarsened)动力学模拟器 UniSim。该方法在大量 3D 分子结构数据上通过去噪 + 力场混合预训练获得统一的全原子表示模型,基于随机差值(stochastic interpolant)生成式框架学习分子在长时间步长下的转移向量场(vector field),并引入力引导核快速适配不同化学环境。UniSim 首次实现了跨分子类型(小分子、多肽、蛋白质)、跨化学环境的统一时间粗化动力学模拟框架,推
2025-06-11 12:44:32
537
原创 【Triton 教程】triton_language.arange
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。
2025-06-10 17:06:16
193
原创 活动预告 | AMD/沐曦/字节/北京大学/上海创智齐聚北京,从底层编译到场景应用的多视角探索
2025 Meet AI Compiler 第 7 期技术沙龙将于 7 月 5 日在北京市车库咖啡举办。
2025-06-10 15:56:49
1557
原创 【TVM 教程】如何使用 TVM Pass Infra
Apache TVM 是一个深度的深度学习编译框架,适用于 CPU、GPU 和各种机器学习加速芯片。更多 TVM 中文文档可访问 →<https://tvm.hyper.ai/>
2025-06-09 14:03:29
655
原创 8k长序列建模,蛋白质语言模型Prot42仅利用目标蛋白序列即可生成高亲和力结合剂
阿布扎比 Inception AI 研究所与硅谷 Cerebras Systems 公司的联合研究团队开发了 Prot42 ——首个仅依赖蛋白质序列信息、无需 3D 结构输入的蛋白质语言模型(PLMs)家族,实现了长序列建模与高亲和力结合剂生成,为蛋白质设计领域带来颠覆性突破。
2025-06-09 13:18:24
1205
原创 【vLLM 学习】Cpu Offload Lmcache
vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。
2025-06-06 20:25:28
240
原创 告别代码烦恼!Seed-Coder 解锁高效编程;Mixture-of-Thoughts 涵盖多领域数据,实现高质量推理
Seed-Coder-8B-Instruct 仅需极少的人力投入,即可让 LLM 自行高效地管理代码训练数据,从而显著提升编码能力。通过自身生成和筛选高质量训练数据,可大幅提升模型代码生成能力。
2025-06-06 13:49:12
992
原创 获1.3亿美元融资,NewLimit利用机器学习指导表观遗传程序设计,延长人类健康寿命研究已有初级成果
生物科技公司 NewLimit 宣布完成 1.3 亿美元 B 轮融资,其利用单细胞组学、池化扰动筛选和机器学习技术,基于「AI + 实验室」闭环,已经研发出 3 种原型药物,能够对肝细胞进行重编程。
2025-06-06 11:55:41
1286
原创 在线教程|新加坡国立大学 Show Lab 发布 OmniConsistency 模型,实现即插即用的图像风格迁移
OmniConsistency 显著提升了视觉连贯性和美学质量,实现了与 GPT-4o 相当的性能
2025-06-05 13:38:18
714
原创 覆盖2亿分子质谱图,捷克科学院发布DreaMS模型,构建全球最大规模质谱数据集GeMS
捷克科学院有机化学与生物化学研究所研究团队,借鉴了 GPT 系列在语言领域取得的突破性进展,从全球天然产物社交分子网络(GNPS)中挖掘出 7 亿条 MS/MS 谱图,成功构建起史上规模最大的质谱数据集 GeMS,并训练出拥有 1.16 亿参数的 Transformer 模型 DreaMS。
2025-06-05 12:08:27
903
原创 【Triton 教程】triton_language.num_programs
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。更多 Triton 中文文档可访问 →https://triton.hyper.ai/
2025-06-05 08:34:43
146
原创 Meet AI Compiler丨跨硬件的统一编译生态,TVM/Triton/TileLang 各展所长
TVM/Triton/TileLang 各展所长
2025-06-04 13:56:59
1706
1
原创 深度强化学习赋能城市消防优化,中科院团队提出DRL新方法破解设施配置难题
中国科学院空天信息创新研究院的梁浩健博士在以「基于分层深度强化学习的城市应急消防设施配置优化方法研究」为题做了演讲报告
2025-06-03 13:07:34
1313
原创 【TVM 教程】编写自定义 Pass
Apache TVM 是一个深度的深度学习编译框架,适用于 CPU、GPU 和各种机器学习加速芯片。更多 TVM 中文文档可访问 →https://tvm.hyper.ai/
2025-06-03 10:53:25
788
原创 一键部署丨DeepSeek-R1 新版本小幅升级便登顶开源王座,多项评测超越 Qwen3
「一键部署 DeepSeek-R1-0528-Qwen3-8B」已上线至 HyperAI超神经官网的「教程」板块,快来体验吧!
2025-05-30 20:22:10
586
原创 内含教程丨微软Aurora计算速度提升5000倍,可预测极端天气/空气质量/海浪/气旋路径等
HyperAI超神经官网的「教程」板块现已上线了「Aurora 大规模大气基础模型 Demo」,快来体验吧!
2025-05-29 20:18:49
494
原创 入选ICML 2025,清华/人大/字节提出首个跨分子种类统一生成框架UniMoMo,实现多类型药物分子设计
清华大学刘洋老师组联合人大黄文炳老师组和字节 AI 制药团队,共同提出了一种跨分子种类统一生成框架 UniMoMo。
2025-05-28 13:41:31
644
原创 【vLLM 学习】Chat With Tools
vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。更多 vLLM 中文文档及教程可访问 →https://vllm.hyper.ai/
2025-05-28 10:46:21
190
原创 【Triton 教程】triton_language.program_id
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。更多 Triton 中文文档可访问 →https://triton.hyper.ai/
2025-05-27 13:49:36
214
原创 牛津大学等深挖746万成年人健康数据开发早筛算法,基于血液指标实现15种癌症早期预测
伦敦玛丽女王大学与牛津大学研究团队合作,基于英格兰地区 746 万成年人的匿名电子健康记录,开发了 2 种新型癌症预测算法:基础算法整合传统临床因素与症状变量,进阶算法纳入全血细胞计数、肝功能检测等血液指标,为优化临床决策流程、推进癌症早期诊断提供了科学依据。
2025-05-27 12:07:32
1031
原创 英伟达开源语音识别模型,ParaKeet-tdt-0.6b-v2仅需1秒可转录1小时音频,精准识别劈柴哥演讲
3.选择「NVIDIA GeForce RTX 4090」以及「PyTorch」镜像,OpenBayes 平台提供了 4 种计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。点击「Microphone」,然后点击「录制」,录制完成后点击「Transcribe Uploaded File」识别。1.进入 hyper.ai 首页后,选择「教程」页面,并选择「ParaKeet-tdt-0.6b-v2 语音识别」,点击「在线运行此教程」。仅需 1 秒即可处理 60 分钟的音频内容,
2025-05-27 11:01:15
911
原创 登Nature子刊!华中科技大学提出融合策略AI模型,实现多中心、跨专科感染性休克死亡风险的精准预测
华中科技大学同济医学院附属同济医院、医药卫生管理学院研究团队开创性地提出了一个基于 TOPSIS 的分类融合(TCF)模型,用来预测 ICU 中感染性休克患者 28 天内的死亡风险。
2025-05-26 13:36:23
943
原创 【TVM 教程】开发环境中加入 microTVM
Apache TVM 是一个深度的深度学习编译框架,适用于 CPU、GPU 和各种机器学习加速芯片。更多 TVM 中文文档可访问 →https://tvm.hyper.ai/
2025-05-26 11:44:13
920
1
原创 ComfyUI Chroma解锁文生图新维度;OpenMathReasoning数学推理数据集,首个专注数学推理的高质量数据集
该数据集涵盖了多种化学成分和物理属性,每条数据对应一种独特的材料。该数据集重点关注 5-9 级难度的数学问题,涵盖代数、微积分、数论、几何、概率、离散数学等多个领域,侧重挑战复杂推理能力,该数据集还通过语义匹配针对常见基准进行了细致的去污染处理,最大限度减少测试集泄露并促进模型公平评估。该数据集将图像和文本数据相结合,模拟真实场景中的信息检索与生成任务,例如新闻事件分析、视觉问答等,着重评估 MLLMs 在多模态上下文中利用检索文档知识的能力,包括对图像内容的理解、图文关联推理以及事实判断等方面。
2025-05-23 16:08:58
863
原创 谷歌发布MedGemma,基于Gemma 3构建,专攻医学文本与图像理解
HyperAI超神经官网的「教程」板块现已上线了「一键部署 MedGemma-27b-text-it 医学推理大模型」,快来体验 AI 医生问诊吧!
2025-05-23 14:18:20
1213
原创 融合蛋白质语言模型和图像修复模型,麻省理工与哈佛联手提出PUPS ,实现单细胞级蛋白质定位
麻省理工学院和哈佛大学的团队提出了一种结合了蛋白质序列和细胞图像来进行未知蛋白质亚细胞定位的预测框架 PUPS。该框架创新地结合了蛋白质语言模型和图像修复模型来预测蛋白质定位,使其兼并推向未知蛋白预测的泛化能力和捕获细胞可变性的细胞类型特定预测。
2025-05-22 12:01:38
1048
转载 融合蛋白质语言模型和图像修复模型,麻省理工与哈佛联手提出PUPS,实现单细胞级蛋白质定位
给定联合表示空间中每个细胞系的质心,从质心到特定蛋白质的向量在所有细胞系中大部分是平行的,即在给定序列表示的情况下,预测特定蛋白质的图像需要再表示空间中以相同方向移动,而不管细胞系是什么,为进一步证明模型能识别有意义的蛋白质序列模式以及预测定位,研究团队使用 Positional Shapley 方法计算了特定蛋白质中每个氨基酸残基对预测各细胞区室标签预测的重要性,如成功解释了 N4BP2 核定位的预测变异性,也与 CUE 结构域通泛素结合可能改变亚细胞定位的报道相符。这对蛋白质行使其生物学功能至关重要。
2025-05-22 11:00:58
29
原创 浙大团队研发Earth Explorer系统,探索深时演化/地学剖面/科研场景,赋能深时地球科学研究
近日,浙江大学地球科学学院的专职研究员戚劲在中国地理学会地理模型与地理信息分析专业委员会 2025 年学术年会上,就「深时地球群智协同创新平台」进行了专题分享。从深时可视化分析系统(Earth Explorer)的总体概述、研发进展以及应用成效三个方面介绍了团队成果。本文为戚劲老师的分享精华实录。
2025-05-21 15:07:06
1023
原创 在线教程|支持 19 种语言,生成速度快 15 倍!ACE-Step 音乐生成模型上线
「ACE-Step:音乐生成基础模型」已上线至 HyperAI超神经官网的「教程」板块,仅需 20 秒即可合成长达 4 分钟的音乐,比基于 LLM 的基线方法快 15 倍,快来体验吧!
2025-05-20 13:39:49
1098
原创 【Triton 教程】triton_language.tensor
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。更多 Triton 中文文档可访问 →https://triton.hyper.ai/
2025-05-20 11:03:03
612
原创 基于800万真实数据,康奈尔大学团队利用图神经网络精准预测肺癌患者生存期,发现3类致命亚型
美国康奈尔大学与再生元制药公司提出图编码混合生存模型(GEMS),通过图神经网络编码患者电子健康记录复杂关系并与生存分析模型结合,识别具有一致特征和生存结局的亚表型。
2025-05-19 15:44:32
678
转载 黄仁勋最新演讲!开放生态的NVLink Fusion支持半定制AI基础设施;开源人形机器人基础模型
黄仁勋表示,「我们正迎来一场计算架构的剧变:几十年来,数据中心首次面临根本性的重构——AI 正被融入每一个计算平台。「AI 已彻底重塑了计算堆栈的每一个层面 —— 从芯片到软件」,黄仁勋表示,「作为引爆 AI 革命的 DGX-1 系统的直系后代,DGX Spark 与 DGX Station 从零开始打造,旨在推动下一代 AI 研发」。从为机器人打造的 AI 大脑,到用于训练的仿真世界,再到基础模型训练的 AI 超级计算机,英伟达提供了机器人开发全周期所需的构建模块」。
2025-05-19 14:01:44
34
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人