Meta 最大视频分割数据集已上线,规模超同类 50 倍;狂揽 9K 星!快手数字人 Demo 一键启动!

AI 如何赋予静态人像生命力,使其微笑、眨眼、甚至微妙的面部表情都栩栩如生?近日,快手团队开源了 LivePortrait,只需上传一张静态照片,它就能变身为表情丰富的动态肖像,在 GitHub 上已狂揽 9K stars。

7 月 29 日-8 月 2 日,hyper.ai 官网更新速览:

  • 优质公共数据集:11 个

  • 优质教程精选:3 个

  • 社区文章精选:4 篇

  • 热门百科词条:5 条

  • 8 月截稿顶会:4 个

访问官网:hyper.ai

公共数据集精选

1. SA-V 视频分割数据集

SA-V 数据集是由 Meta 公司于 2024 年构建的一个大规模视频分割数据集,用于训练和评估 Meta Segment Anything Model 2,包含了约 51,000 个真实世界视频和 643K 个时空遮罩注释,在大小上比其他同类数据集大 50 倍左右。

直接使用: https://go.hyper.ai/X4DGI

2. LAB Bench 生物学基准数据集丨覆盖 8 大任务,超 2.4K 选择题

为促进生物学领域对 AI 系统的有效开发,FutureHouse Inc. 的研究人员推出了语言 Agent 生物学基准数据集 LAB-Bench,该数据集用于评估 AI 系统在文献检索和推理、图表解释、DNA 和蛋白质序列的理解和处理等实际生物学研究的表现,成果已提交至顶会 NeurlPS 2024。

直接使用: https://go.hyper.ai/UznkS

3. NuminaMath-CoT 数学竞赛问题数据集

该数据集包含 860k+ 数学竞赛问题-解答对,每个解答都使用了思维链 (Chain of Thought, CoT) 推理模板。数据集的来源包括中国高中数学练习题、美国和国际数学奥林匹克竞赛题。数据主要收集自在线试卷 PDF 和数学讨论论坛。

直接使用: https://go.hyper.ai/svElx

4. Taptap reviews 游戏评论数据集

该数据集包含手游 App TapTap 上约 300 款游戏的标签评论,共 4,888 个数据示例,可用于情感分析的任务。其中用户评论低于 3 星(最多 5 星)被视为 0(不满意),其他为 1(满意)。这两个类别的比例大约是 1:1 。

直接使用: https://go.hyper.ai/ISf7c

5. CCPD Dataset 中国车牌检测数据集

CCPD 数据集是一个大型的、多样化的、经过仔细标注的车牌识别数据集。该数据集主要在中国合肥市的停车场采集得到,包含了多种复杂环境下的车牌照片,例如模糊、倾斜、阴雨天和雪天等,使得数据集在车牌识别任务中更具挑战性。

直接使用: https://go.hyper.ai/gZ37Y

6. TinyStories 短篇故事合成数据集

该数据集是一个由 GPT-3.5 和 GPT-4 生成的短篇故事合成数据集,包含的词汇量限定在 3 至 4 岁儿童理解的范围内。可以使用该数据集训练模型生成流畅、一致、多样化且语法近乎完美的短故事。

直接使用: https://go.hyper.ai/m9ouS

7. Wildfire Smoke 野火烟雾检测数据集

该数据集由 AI for Mankind 与 HPWREN 于 2019 年合作发布,共包含 737 张图片,其中有 516 张训练图片、147 张验证图片和 74 张测试图片,标注格式为 COCO。旨在提高模型区分云/雾和烟雾的能力,建立端到端反馈循环。

直接使用: https://go.hyper.ai/ofGHZ

8. LJSpeech Dataset 语音数据集

这是一个公共领域语音数据集,包含 13,100 个简短的音频片段,其中单个说话者朗读 7 本非小说类书籍中的段落。每个片段都提供转录。片段的长度从 1 秒到 10 秒不等,总长度约为 24 小时。

直接使用: https://go.hyper.ai/Eo1bK

9. Chinese Zodiac Signs 十二生肖数据集

该数据集包含中国十二个生肖类别,共 8,508 张图片。数据集已事先分割为训练、验证和测试,比例为 85:7.5:7.5 。

直接使用: https://go.hyper.ai/ps2es

10. DISC-Law-SFT 高质量中文法律监督微调数据集

该数据集包含近 30 万条训练数据,专为中文法律领域设计,旨在提高模型在法律文本处理、法律推理思维以及司法领域知识检索遵循等方面的能力。

直接使用: https://go.hyper.ai/zh9Ij

11. Free Spoken Digit Dataset (FSDD) 数字识别音频数据集

Free Spoken Digit Dataset (FSDD) 是一个音频数据集,由 8kHz 采样率的 wav 文件中的数字语音录音组成。这些录音经过裁剪,以尽量减少开头和结尾的沉默时间。

直接使用: https://go.hyper.ai/HZ00d

更多公共数据集,请访问:

https://hyper.ai/datasets

公共教程精选

1. 教程上新 | 文生图、图生图、图像修复三合一神器,HiDiffusion 一键启动教程现已上线!

HiDiffusion 是旷世科技开源的高分辨率框架,不仅支持文生图、图生图,还具备图像修复功能。HyperAI超神经现已上线「HiDiffusion 可快速生成高质量 8k 图像 Demo」教程,无需输入任何命令,一键克隆即可启动。

在线运行: https://go.hyper.ai/yZ5K5

2. LivePortrait 快手开源图生视频数字人 Demo

LivePortrait 是一个人像视频生成框架,主要功能包括从单一图像生成生动动画、精确控制眼睛和嘴唇的动作、处理多个人物肖像的无缝拼接、支持多风格肖像、生成高分辨率动画等。该教程为 LivePortrait 一键运行 Demo,相关环境和依赖已经安装完毕,一键克隆启动即可体验。

在线运行: https://go.hyper.ai/oTs66

3. AuraSR 基于 GAN 的超分辨率图像放大 Demo

AuraSR 是一款基于深度学习的图片高清修复模型,能够智能识别图片中的细节信息,并在放大图片的同时,自动补充缺失的细节。与传统的图片放大方法相比,AuraSR 不仅效果更加出色,而且操作简便,无需专业技能即可轻松上手。一键克隆即可体验模型。

在线运行: https://go.hyper.ai/y2wIU

社区文章精选

1.Meta/东京电子/FPT 软件等共同贡献,Aitomatic 发布首个半导体行业开源大模型,「锁死」企业技术自主权

工业领域 AI 革新领军企业 Aitomatic 宣布推出世界上首个专为半导体行业设计的开源 AI 大语言模型 SemiKong。该公司此前还曾推出名为 aiKO 的 AI Agent,基于企业用户的专业知识、数据,为其构建专属 Agent,企业对于其 Agent 拥有「完全所有权」。

查看完整报道: https://go.hyper.ai/A7eCi

2.精华片段集锦丨黄仁勋与扎克伯格的「世纪对谈」

7 月 30 日凌晨,在第 51 届 SIGGRAPH 图形大会上,英伟达创始人兼 CEO 黄仁勋和 Meta 创始人兼 CEO 马克·扎克伯格进行了一次「围炉夜话」。HyperAI超神经为汇总了精华片段和完整中文字幕视频。

查看完整报道: https://go.hyper.ai/rbU2u

3. 入选 ICML!麻省理工团队基于 AlphaFold 实现新突破,揭示蛋白质动态多样性

麻省理工学院的研究团队重新利用 AlphaFold 和 ESMFold 等高精度的单态预测器,并在自定义流匹配 (Flow Matching) 框架下对其进行微调,以获得序列条件的蛋白质结构生成模型,称为 AlphaFLOW 和 ESMFLOW。本文是对相关论文的详细解读与分享。

查看完整报道: https://go.hyper.ai/qupG9

4. 水平直逼高级病理学家!清华团队提出AI基础模型ROAM,实现胶质瘤精准诊断

清华大学自动化系生命基础模型实验室与中南大学湘雅医院合作,提出了一种基于大区域兴趣和金字塔 Transformer 的精准病理诊断 AI 基础模型 ROAM,用于胶质瘤的临床级诊断和分子标志物发现,并可拓展到其他类型肿瘤的病理诊断。

查看完整报道: https://go.hyper.ai/w4tsr

热门百科词条精选

1. 神经辐射场 NeRF

2. 分组查询注意力 GQA

3. 数据增强 Data Augmentation

4. 大规模多任务语言理解 MMLU

5. 长短期记忆 Long Short-Term Memory

这里汇编了数百条 AI 相关词条,让你在这里读懂「人工智能」:

https://go.hyper.ai/wiki
在这里插入图片描述](https://i-blog.csdnimg.cn/direct/84608e2de4514f52b78b4923ae74b33a.png#pic_center)

一站式追踪人工智能学术顶会:https://go.hyper.ai/event

以上就是本周编辑精选的全部内容,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们哦!

下周再见!

  • 20
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值