OpenBayes 一周速览丨图像生成评估新基准 DreamBench++ 上线,清华强推!立即启动 Fish Speech 克隆专属声音

公共资源速递

This Weekly Snapshots !

5 个数据集:

* DreamBench++ 图像自动评估基准数据集

* DreamBooth 图像数据集

* HellaSwag 大模型常识推理数据集

* MMDU 超长多图多轮对话理解数据集

* Test of Time 大模型时间推理能力的基准测试数据集

1 个模型:

* Gemma-2-9B-Chinese-Chat

2 个教程:

* 腾讯 HunyuanDiT Demo

* Fish Speech 声音克隆-文本转语音工具 Demo

访问官网立即使用:openbayes.com

公共数据集

1. DreamBench++ 图像自动评估基准数据集

DreamBench++ 是一个包含 200 个关键词的个性化数据集,涵盖物体、活物和风格化图片三种类型。该数据集旨在解决个性化图像生成技术评估中存在的问题,它通过引入支持多模态的 GPT-4o,实现了与人类偏好的深度对齐和自动化评估。

* 直接使用:

https://go.openbayes.com/XEo0V

2. DreamBooth 图像数据集

该数据集包含 30 个不同类别的主体,包括 9 个活体主体(例如狗和猫)和 21 个对象,每个主体有 4 到 6 张图片。这些图片通常在不同的条件、环境和角度下拍摄,以确保模型能够学习到主体在不同情境下的外观。

* 直接使用:

https://go.openbayes.com/cekhr

3. HellaSwag 大模型常识推理数据集

HellaSwag 数据集是一个用于测试常识性自然语言推理的挑战数据集,包含 7 万个问题,旨在通过构建一个对现有最先进模型具有挑战性的数据集,来探索深度预训练模型在常识推理方面的表现。相关论文已被 ACL 2019 接受。

* 直接使用:

https://go.openbayes.com/nNBW5

4. MMDU 超长多图多轮对话理解数据集

该数据集包括 110 个高质量的多图像多轮对话,其中包含 1.6k 个问题,每个问题都附有详细的长篇答案。MMUD 中的问题涉及 2 到 20 张图像,平均图像和文本标记长度为 8.2k 个标记,最大图像和文本长度达到 18K 个标记,对现有的多模态大型模型提出了重大挑战。

* 直接使用:

https://go.openbayes.com/e7qBQ

5. Test of Time 大模型时间推理能力的基准测试数据集

该数据集简称 ToT,分为三个子集:ToT-semantic 包含 1,850 个示例、ToT-arithmetic 包含 2,800 个示例、ToT-semantic-large 包含 46,480 个示例,ToT 数据集能够在更大的尺度上衡量时间理解的语义和逻辑。

* 直接使用:

https://go.openbayes.com/Y2LCq

公共模型

1. Gemma-2-9B-Chinese-Chat

该模型是首个基于 Google/Gemma-2-9B-it 构建的指令调优语言模型,专门针对中文和英文用户进行了微调,显著减少了「中文问题带英文答案」和中英文混合的问题,还提升了逻辑推理、编程、数学及写作能力。

* 直接使用:

https://go.openbayes.com/3E33M

公共教程

1. 腾讯 HunyuanDiT Demo

HunyuanDiT 是首个中英双语 DiT 架构的文本到图像生成模型,具有中英文细粒度理解能力,能够与用户进行多轮对话、根据上下文生成并完善图像。该教程已经为大家搭建好了相关环境,一键克隆即可体验。

* 在线运行:

https://go.openbayes.com/Eno9t

2. Fish Speech 声音克隆-文本转语音工具 Demo

Fish Speech 是由 Fish Audio 开发的开源文本转语音模型,能熟练掌握中文、日语和英语,其语言处理接近人类水平且声音表现多样。该教程是其 Demo,并安装好了相关依赖,欢迎克隆容器生成专属音频。

* 在线运行:

https://go.openbayes.com/HP7OI

以上就是小贝上周在 OpenBayes 的全部更新内容啦~

  • 3
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值