- 博客(1307)
- 收藏
- 关注

原创 【持续更新中!图像-文本对数据集汇总】Stable Diffusion 3 重磅开源,超全图像生成必备训练数据集、教程汇总
Stability AI 已经正式开源 Stable Diffusion 3(简称 SD3)!SD3 是一个图像生成模型,只要给定一段描述性的文字,就能够创造出与之匹配的视觉作品。下图就是由 SD3 生成的图像。* prompt史诗级动漫作品:一位巫师在夜晚的山顶上向黑暗的天空施放宇宙咒语,咒语上写着「Stable Diffusion 3」,由五彩缤纷的能量组成在 SD3 的背后,是庞大的图像-文...
2024-06-13 11:00:53
3319

原创 【持续更新中!气象数据集汇总】气象局首次发布训练数据目录!CAMELS 美国天文气象数据集等上线官网
该数据集为论文 「Global prediction of extreme floods in ungauged watersheds」的研究数据,主要内容为 AI 模型生成的洪水重新分析 (1984-2021) 和重新预测 (2014-2021) 数据以及相应的 GloFAS 基准数据。数据集可鼓励在天气领域进行机器学习研究,方便在理解和减轻气候变化影响方面的工作。SEVIR 将多种天气传感模式组合并整合成一个单一的、可访问的数据集,该数据集可在云端免费访问,可供气象学家、数据科学家和其他研究人员使用。
2024-05-30 16:18:00
1804

原创 【持续更新中,图像分割数据集】字节发布 COCONut 入选 CVPR 2024,立即体验 Segment Anything 分割万物!|持续更新中!
随着计算机视觉技术的不断发展,图像分割在诸多领域展现出重要的应用价值。近年来,各种图像分割数据集如雨后春笋般涌现。上个月,字节跳动发布了首个大规模全景图像分割数据集「COCONut」,为这一领域的研究注入了新鲜血液。HyperAI超神经本周汇总了 10 个优质的图像分割数据集进行汇总和分析,以更好地推动相关研究的进展。除此之外,GitHub 上超火的项目「Segment Anything 分割万物...
2024-05-09 15:09:25
1113
1

原创 【持续更新中!数学数据集汇总】天才博士陶哲轩力荐数据集!含代码、中文竞赛题目、正向逆向问答对等
数学数据集持续更新中,建议收藏!欢迎投稿优质数据集
2024-04-23 20:19:00
1979
原创 【vLLM 学习】Cpu Offload Lmcache
vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。
2025-06-06 20:25:28
218
原创 告别代码烦恼!Seed-Coder 解锁高效编程;Mixture-of-Thoughts 涵盖多领域数据,实现高质量推理
Seed-Coder-8B-Instruct 仅需极少的人力投入,即可让 LLM 自行高效地管理代码训练数据,从而显著提升编码能力。通过自身生成和筛选高质量训练数据,可大幅提升模型代码生成能力。
2025-06-06 13:49:12
969
原创 获1.3亿美元融资,NewLimit利用机器学习指导表观遗传程序设计,延长人类健康寿命研究已有初级成果
生物科技公司 NewLimit 宣布完成 1.3 亿美元 B 轮融资,其利用单细胞组学、池化扰动筛选和机器学习技术,基于「AI + 实验室」闭环,已经研发出 3 种原型药物,能够对肝细胞进行重编程。
2025-06-06 11:55:41
1117
原创 在线教程|新加坡国立大学 Show Lab 发布 OmniConsistency 模型,实现即插即用的图像风格迁移
OmniConsistency 显著提升了视觉连贯性和美学质量,实现了与 GPT-4o 相当的性能
2025-06-05 13:38:18
709
原创 覆盖2亿分子质谱图,捷克科学院发布DreaMS模型,构建全球最大规模质谱数据集GeMS
捷克科学院有机化学与生物化学研究所研究团队,借鉴了 GPT 系列在语言领域取得的突破性进展,从全球天然产物社交分子网络(GNPS)中挖掘出 7 亿条 MS/MS 谱图,成功构建起史上规模最大的质谱数据集 GeMS,并训练出拥有 1.16 亿参数的 Transformer 模型 DreaMS。
2025-06-05 12:08:27
889
原创 【Triton 教程】triton_language.num_programs
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。更多 Triton 中文文档可访问 →https://triton.hyper.ai/
2025-06-05 08:34:43
142
原创 Meet AI Compiler丨跨硬件的统一编译生态,TVM/Triton/TileLang 各展所长
TVM/Triton/TileLang 各展所长
2025-06-04 13:56:59
1681
1
原创 深度强化学习赋能城市消防优化,中科院团队提出DRL新方法破解设施配置难题
中国科学院空天信息创新研究院的梁浩健博士在以「基于分层深度强化学习的城市应急消防设施配置优化方法研究」为题做了演讲报告
2025-06-03 13:07:34
1299
原创 【TVM 教程】编写自定义 Pass
Apache TVM 是一个深度的深度学习编译框架,适用于 CPU、GPU 和各种机器学习加速芯片。更多 TVM 中文文档可访问 →https://tvm.hyper.ai/
2025-06-03 10:53:25
784
原创 一键部署丨DeepSeek-R1 新版本小幅升级便登顶开源王座,多项评测超越 Qwen3
「一键部署 DeepSeek-R1-0528-Qwen3-8B」已上线至 HyperAI超神经官网的「教程」板块,快来体验吧!
2025-05-30 20:22:10
530
原创 内含教程丨微软Aurora计算速度提升5000倍,可预测极端天气/空气质量/海浪/气旋路径等
HyperAI超神经官网的「教程」板块现已上线了「Aurora 大规模大气基础模型 Demo」,快来体验吧!
2025-05-29 20:18:49
493
原创 入选ICML 2025,清华/人大/字节提出首个跨分子种类统一生成框架UniMoMo,实现多类型药物分子设计
清华大学刘洋老师组联合人大黄文炳老师组和字节 AI 制药团队,共同提出了一种跨分子种类统一生成框架 UniMoMo。
2025-05-28 13:41:31
638
原创 【vLLM 学习】Chat With Tools
vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。更多 vLLM 中文文档及教程可访问 →https://vllm.hyper.ai/
2025-05-28 10:46:21
187
原创 【Triton 教程】triton_language.program_id
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。更多 Triton 中文文档可访问 →https://triton.hyper.ai/
2025-05-27 13:49:36
214
原创 牛津大学等深挖746万成年人健康数据开发早筛算法,基于血液指标实现15种癌症早期预测
伦敦玛丽女王大学与牛津大学研究团队合作,基于英格兰地区 746 万成年人的匿名电子健康记录,开发了 2 种新型癌症预测算法:基础算法整合传统临床因素与症状变量,进阶算法纳入全血细胞计数、肝功能检测等血液指标,为优化临床决策流程、推进癌症早期诊断提供了科学依据。
2025-05-27 12:07:32
1026
原创 英伟达开源语音识别模型,ParaKeet-tdt-0.6b-v2仅需1秒可转录1小时音频,精准识别劈柴哥演讲
3.选择「NVIDIA GeForce RTX 4090」以及「PyTorch」镜像,OpenBayes 平台提供了 4 种计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。点击「Microphone」,然后点击「录制」,录制完成后点击「Transcribe Uploaded File」识别。1.进入 hyper.ai 首页后,选择「教程」页面,并选择「ParaKeet-tdt-0.6b-v2 语音识别」,点击「在线运行此教程」。仅需 1 秒即可处理 60 分钟的音频内容,
2025-05-27 11:01:15
902
原创 登Nature子刊!华中科技大学提出融合策略AI模型,实现多中心、跨专科感染性休克死亡风险的精准预测
华中科技大学同济医学院附属同济医院、医药卫生管理学院研究团队开创性地提出了一个基于 TOPSIS 的分类融合(TCF)模型,用来预测 ICU 中感染性休克患者 28 天内的死亡风险。
2025-05-26 13:36:23
938
原创 【TVM 教程】开发环境中加入 microTVM
Apache TVM 是一个深度的深度学习编译框架,适用于 CPU、GPU 和各种机器学习加速芯片。更多 TVM 中文文档可访问 →https://tvm.hyper.ai/
2025-05-26 11:44:13
916
1
原创 ComfyUI Chroma解锁文生图新维度;OpenMathReasoning数学推理数据集,首个专注数学推理的高质量数据集
该数据集涵盖了多种化学成分和物理属性,每条数据对应一种独特的材料。该数据集重点关注 5-9 级难度的数学问题,涵盖代数、微积分、数论、几何、概率、离散数学等多个领域,侧重挑战复杂推理能力,该数据集还通过语义匹配针对常见基准进行了细致的去污染处理,最大限度减少测试集泄露并促进模型公平评估。该数据集将图像和文本数据相结合,模拟真实场景中的信息检索与生成任务,例如新闻事件分析、视觉问答等,着重评估 MLLMs 在多模态上下文中利用检索文档知识的能力,包括对图像内容的理解、图文关联推理以及事实判断等方面。
2025-05-23 16:08:58
848
原创 谷歌发布MedGemma,基于Gemma 3构建,专攻医学文本与图像理解
HyperAI超神经官网的「教程」板块现已上线了「一键部署 MedGemma-27b-text-it 医学推理大模型」,快来体验 AI 医生问诊吧!
2025-05-23 14:18:20
1205
原创 融合蛋白质语言模型和图像修复模型,麻省理工与哈佛联手提出PUPS ,实现单细胞级蛋白质定位
麻省理工学院和哈佛大学的团队提出了一种结合了蛋白质序列和细胞图像来进行未知蛋白质亚细胞定位的预测框架 PUPS。该框架创新地结合了蛋白质语言模型和图像修复模型来预测蛋白质定位,使其兼并推向未知蛋白预测的泛化能力和捕获细胞可变性的细胞类型特定预测。
2025-05-22 12:01:38
1044
转载 融合蛋白质语言模型和图像修复模型,麻省理工与哈佛联手提出PUPS,实现单细胞级蛋白质定位
给定联合表示空间中每个细胞系的质心,从质心到特定蛋白质的向量在所有细胞系中大部分是平行的,即在给定序列表示的情况下,预测特定蛋白质的图像需要再表示空间中以相同方向移动,而不管细胞系是什么,为进一步证明模型能识别有意义的蛋白质序列模式以及预测定位,研究团队使用 Positional Shapley 方法计算了特定蛋白质中每个氨基酸残基对预测各细胞区室标签预测的重要性,如成功解释了 N4BP2 核定位的预测变异性,也与 CUE 结构域通泛素结合可能改变亚细胞定位的报道相符。这对蛋白质行使其生物学功能至关重要。
2025-05-22 11:00:58
23
原创 浙大团队研发Earth Explorer系统,探索深时演化/地学剖面/科研场景,赋能深时地球科学研究
近日,浙江大学地球科学学院的专职研究员戚劲在中国地理学会地理模型与地理信息分析专业委员会 2025 年学术年会上,就「深时地球群智协同创新平台」进行了专题分享。从深时可视化分析系统(Earth Explorer)的总体概述、研发进展以及应用成效三个方面介绍了团队成果。本文为戚劲老师的分享精华实录。
2025-05-21 15:07:06
976
原创 在线教程|支持 19 种语言,生成速度快 15 倍!ACE-Step 音乐生成模型上线
「ACE-Step:音乐生成基础模型」已上线至 HyperAI超神经官网的「教程」板块,仅需 20 秒即可合成长达 4 分钟的音乐,比基于 LLM 的基线方法快 15 倍,快来体验吧!
2025-05-20 13:39:49
1098
原创 【Triton 教程】triton_language.tensor
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。更多 Triton 中文文档可访问 →https://triton.hyper.ai/
2025-05-20 11:03:03
608
原创 基于800万真实数据,康奈尔大学团队利用图神经网络精准预测肺癌患者生存期,发现3类致命亚型
美国康奈尔大学与再生元制药公司提出图编码混合生存模型(GEMS),通过图神经网络编码患者电子健康记录复杂关系并与生存分析模型结合,识别具有一致特征和生存结局的亚表型。
2025-05-19 15:44:32
673
转载 黄仁勋最新演讲!开放生态的NVLink Fusion支持半定制AI基础设施;开源人形机器人基础模型
黄仁勋表示,「我们正迎来一场计算架构的剧变:几十年来,数据中心首次面临根本性的重构——AI 正被融入每一个计算平台。「AI 已彻底重塑了计算堆栈的每一个层面 —— 从芯片到软件」,黄仁勋表示,「作为引爆 AI 革命的 DGX-1 系统的直系后代,DGX Spark 与 DGX Station 从零开始打造,旨在推动下一代 AI 研发」。从为机器人打造的 AI 大脑,到用于训练的仿真世界,再到基础模型训练的 AI 超级计算机,英伟达提供了机器人开发全周期所需的构建模块」。
2025-05-19 14:01:44
31
原创 【TVM 教程】创建使用 microTVM 的 MLPerfTiny 提交
Apache TVM 是一个深度的深度学习编译框架,适用于 CPU、GPU 和各种机器学习加速芯片。更多 TVM 中文文档可访问 →https://tvm.hyper.ai/
2025-05-19 10:41:16
1044
原创 10 大医学数据集汇总:覆盖问答/推理/真实临床记录/超声图像/CT 影像……
HyperAI超神经为大家整理了目前热度较高的医学数据集,覆盖医学问答、医学推理、医疗影像等多方面数据,包括癌症、心脏、骨 X 光等多个医学专业领域。一键即可下载,快来体验吧~
2025-05-16 13:23:46
1202
原创 谷歌DeepMind发布AlphaEvolve,解决300年数学难题,为近40个数学问题找到更优解决方案
谷歌 DeepMind 公布了编程 AI Agent AlphaEvolve,可以用于通用算法发现和优化。
2025-05-15 16:26:04
501
原创 首次实现纳米晶体端到端解析,哥大团队提出PXRDnet,成功解析200种复杂模拟纳米晶体
哥伦比亚大学、斯坦福大学的研究人员提出了一种基于扩散模型的生成式人工智能结构解析方法 PXRDnet。即便仅以化学式和信息稀缺的有限尺寸展宽粉末衍射图为条件,该模型也能成功解析 200 种不同对称性和复杂性的模拟纳米晶体,涵盖来自所有七个晶体系统的结构,最小粒径可至 10 Å。
2025-05-15 14:24:54
895
原创 【vLLM 学习】基础教程
vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。更多 vLLM 中文文档及教程可访问 →https://vllm.hyper.ai/
2025-05-14 19:16:52
980
原创 在线教程丨9 秒处理一张图!In-Context Edit 高效图像编辑框架上线
「In-Context Edit:指令驱动图像生成与编辑」已上线至 HyperAI超神经官网的「教程」板块,仅需极少的文本指令即可实现精准的图像修改,快来体验吧!
2025-05-14 12:48:26
372
原创 David Baker 团队最新研究,利用蛋白质序列生成模型实现重叠基因设计,成功率极高
美国华盛顿大学 David Baker 团队近期利用先进生成模型,通过合成 OLG 设计研究,从工程化角度验证其可行性。研究团队针对 2 个蛋白家族设计重叠序列,编码高度有序的从头设计蛋白结构,计算机模拟与实验验证均显示出极高成功率。
2025-05-13 14:28:09
858
原创 【Triton 教程】triton.Config
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。– 在为 GPU 编译时内核使用的线程数。例如,如果 num_warps=8,则每个内核实例将自动并行化,使用 8 * 32 = 256 个线程协作执行。– 编译器在软件流水线循环时应使用的阶段数。对于 SM80+ GPU 上的矩阵乘法工作负载非常有用。- 单个线程可以使用的最大寄存器数。– 在调用内核之前将被调用的函数。
2025-05-13 11:12:38
220
原创 登Nature子刊,俄罗斯研究团队基于机器学习实现万亿级质谱数据搜索,发现未知化学反应
俄罗斯科学院的研究人员,开发出一种基于机器学习的搜索引擎 MEDUSA Search,能够对太字节规模的高分辨率质谱数据进行分析,助力发现未知的化学反应!
2025-05-12 13:45:50
1029
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人