OpenBayes 一周速览|Hunyuan3D 极速生成 3D 资产,轻松驾驭多视角场景;HelpSteer2 助力 LLMs 更贴近人类偏好

公共资源速递

This Weekly Snapshots !

5 个数据集:

* Jester 笑话评分数据集

* HelpSteer2 人类偏好对齐数据集

* MPII Human Shape 人体模型数据集

* MedScribble 多图像分割生物医学任务数据集

* Traditional Chinese Medicine Dataset SFT 中医诊断数据集

1 个模型:

* Qwen2.5-Coder-7B-Instruct

3 个教程:

* Hunyuan3D 仅需 10 秒生成 3D 资产

* SynthID-Text AI 文本生成水印工具 Demo

* Evo:从分子到基因组规模的序列预测和生成

访问官网立即使用:openbayes.com

公共数据集

1. Jester 笑话评分数据集

Jester 数据集是一个在线笑话评分数据集,它收集了来自 Reddit 笑话板块的笑话,以及用户对这些笑话的评分。共包含 73,421 名用户对 100 个笑话的评分数据,共计 410 万条连续评分。

* 直接使用:

https://go.openbayes.com/RxPaM

2. HelpSteer2 人类偏好对齐数据集

HelpSteer2 是一个开源数据集,包含约 1 万对回答,它在训练奖励模型方面非常高效,旨在训练能够指导大型语言模型 (LLMs) 生成符合人类偏好的高质量回答的奖励模型。

* 直接使用:

https://go.openbayes.com/kWsQj

3. MPII Human Shape 人体模型数据集

MPII Human Shape 数据集包含了超过 4.5k 名美国和欧洲受试者的 3D 扫描数据,这些数据在标准姿势下被捕捉,提供了丰富的人体体型样本。旨在提供一系列富有表现力的 3D 人体形状模型和工具,用于构建、操作和评估人体形状空间。

* 直接使用:

https://go.openbayes.com/NBOQz

4. MedScribble 多图像分割生物医学任务数据集

MedScrible 数据集总共包含 64 个 2D 图像分割对,每个图像分割对有 3 组涂鸦注释,这些数据是从 14 个不同的开放存取的生物医学图像分割数据集中获取的。

* 直接使用:

https://go.openbayes.com/iuF4y

5. Traditional Chinese Medicine Dataset SFT 中医诊断数据集

Traditional-Chinese-Medicine-Dataset-SFT 是一个专注于中医领域的高质量数据集,包含约 1GB 的中医各个领域临床案例、名家典籍、医学百科、名词解释等优质内容。数据集主要由非网络来源的内部数据构成,99% 为简体中文内容,质量优异,信息密度可观,适用于预训练或继续预训练用途。

直接使用:

https://go.openbayes.com/EMi4Q

公共模型

1. Qwen2.5-Coder-7B-Instruct

* 发布机构:阿里云

Qwen2.5-Coder 是一款具备强大代码生成能力的人工智能助手,支持逻辑清晰且语法规范的代码输出,并提供 Artifacts 功能,帮助用户快速构建和实现各种视觉化项目。在迷你游戏开发方面,Qwen2.5-Coder 能够根据游戏规则、画面风格和用户体验要求生成游戏代码,开发者可以在此基础上进行定制和优化,快速推出自己的游戏作品。

* 直接使用:

https://go.openbayes.com/mZ1fd

公共教程

1.Hunyuan3D:仅需 10 秒生成 3D 资产

Hunyuan3D-1.0 是一个 3D 生成扩散模型,支持从文本和图像输入生成高质量的 3D 资产,轻量版模型能在大约 10 秒内生成 3D 物体,而标准版则在大约 25 秒内完成,标准版本比精简版和其他现有模型多 3 倍参数。Hunyuan3D-1.0 在几何细节、纹理细节、纹理-几何一致性、3D 合理性、指令遵循等方面的表现都非常出色。

本教程是 Hunyuan3D-1.0 轻量版,只需按照示例步骤运行,即可生成高质量的 3D 资产。

* 在线运行:

https://go.openbayes.com/DftHl

图片

文本转 3D 示例

2. SynthID-Text AI 文本生成水印工具  Demo

该模型是一种用于识别和验证由大语言模型 (LLM) 生成文本的水印技术,它的核心在于在不损害文本质量和用户体验的前提下,通过细微调整生成过程中的 Token 概率分数来嵌入几乎无法察觉的水印,从而实现高检测精度。

该项目通过 Gradio 接口可以生成前端交互界面,相关模型和依赖已经部署完毕,一键启动即可生成水印文本。

* 在线运行

https://go.openbayes.com/JBKeP

图片

模型示例

3. Evo:从分子到基因组规模的序列预测和生成

Evo 是一个生物基础模型,能够跨越生物学的基本语言:DNA、RNA 和蛋白质进行泛化,执行预测任务和生成设计,涵盖从分子到整个基因组的规模的序列预测和生成。

点击下方链接,按照教程指引即可预测基因组规模序列。

* 在线运行

https://go.openbayes.com/YREEC

图片

预测的蛋白质结构示例


以上就是小贝上周在 OpenBayes 的全部更新内容啦~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值