Meta 最大视频分割数据集已上线，规模超同类 50 倍；狂揽 9K 星！快手数字人 Demo 一键启动！-CSDN博客

本文链接：https://blog.csdn.net/HyperAI/article/details/141223804

AI 如何赋予静态人像生命力，使其微笑、眨眼、甚至微妙的面部表情都栩栩如生？近日，快手团队开源了 LivePortrait，只需上传一张静态照片，它就能变身为表情丰富的动态肖像，在 GitHub 上已狂揽 9K stars。

7 月 29 日-8 月 2 日，hyper.ai 官网更新速览：

优质公共数据集：11 个
优质教程精选：3 个
社区文章精选：4 篇
热门百科词条：5 条
8 月截稿顶会：4 个

访问官网：hyper.ai

公共数据集精选

SA-V 数据集是由 Meta 公司于 2024 年构建的一个大规模视频分割数据集，用于训练和评估 Meta Segment Anything Model 2，包含了约 51,000 个真实世界视频和 643K 个时空遮罩注释，在大小上比其他同类数据集大 50 倍左右。

直接使用： https://go.hyper.ai/X4DGI

2. LAB Bench 生物学基准数据集丨覆盖 8 大任务，超 2.4K 选择题

为促进生物学领域对 AI 系统的有效开发，FutureHouse Inc. 的研究人员推出了语言 Agent 生物学基准数据集 LAB-Bench，该数据集用于评估 AI 系统在文献检索和推理、图表解释、DNA 和蛋白质序列的理解和处理等实际生物学研究的表现，成果已提交至顶会 NeurlPS 2024。

直接使用： https://go.hyper.ai/UznkS

3. NuminaMath-CoT 数学竞赛问题数据集

该数据集包含 860k+ 数学竞赛问题-解答对，每个解答都使用了思维链 (Chain of Thought, CoT) 推理模板。数据集的来源包括中国高中数学练习题、美国和国际数学奥林匹克竞赛题。数据主要收集自在线试卷 PDF 和数学讨论论坛。

直接使用： https://go.hyper.ai/svElx

4. Taptap reviews 游戏评论数据集

该数据集包含手游 App TapTap 上约 300 款游戏的标签评论，共 4,888 个数据示例，可用于情感分析的任务。其中用户评论低于 3 星（最多 5 星）被视为 0（不满意），其他为 1（满意）。这两个类别的比例大约是 1:1 。

直接使用： https://go.hyper.ai/ISf7c

5. CCPD Dataset 中国车牌检测数据集

CCPD 数据集是一个大型的、多样化的、经过仔细标注的车牌识别数据集。该数据集主要在中国合肥市的停车场采集得到，包含了多种复杂环境下的车牌照片，例如模糊、倾斜、阴雨天和雪天等，使得数据集在车牌识别任务中更具挑战性。

直接使用： https://go.hyper.ai/gZ37Y

6. TinyStories 短篇故事合成数据集

该数据集是一个由 GPT-3.5 和 GPT-4 生成的短篇故事合成数据集，包含的词汇量限定在 3 至 4 岁儿童理解的范围内。可以使用该数据集训练模型生成流畅、一致、多样化且语法近乎完美的短故事。

直接使用： https://go.hyper.ai/m9ouS

7. Wildfire Smoke 野火烟雾检测数据集

该数据集由 AI for Mankind 与 HPWREN 于 2019 年合作发布，共包含 737 张图片，其中有 516 张训练图片、147 张验证图片和 74 张测试图片，标注格式为 COCO。旨在提高模型区分云/雾和烟雾的能力，建立端到端反馈循环。

直接使用： https://go.hyper.ai/ofGHZ

8. LJSpeech Dataset 语音数据集

这是一个公共领域语音数据集，包含 13,100 个简短的音频片段，其中单个说话者朗读 7 本非小说类书籍中的段落。每个片段都提供转录。片段的长度从 1 秒到 10 秒不等，总长度约为 24 小时。

直接使用： https://go.hyper.ai/Eo1bK

9. Chinese Zodiac Signs 十二生肖数据集

该数据集包含中国十二个生肖类别，共 8,508 张图片。数据集已事先分割为训练、验证和测试，比例为 85:7.5:7.5 。

直接使用： https://go.hyper.ai/ps2es

10. DISC-Law-SFT 高质量中文法律监督微调数据集

该数据集包含近 30 万条训练数据，专为中文法律领域设计，旨在提高模型在法律文本处理、法律推理思维以及司法领域知识检索遵循等方面的能力。

直接使用： https://go.hyper.ai/zh9Ij

11. Free Spoken Digit Dataset (FSDD) 数字识别音频数据集

Free Spoken Digit Dataset (FSDD) 是一个音频数据集，由 8kHz 采样率的 wav 文件中的数字语音录音组成。这些录音经过裁剪，以尽量减少开头和结尾的沉默时间。

直接使用： https://go.hyper.ai/HZ00d

更多公共数据集，请访问：

https://hyper.ai/datasets

公共教程精选

1. 教程上新 | 文生图、图生图、图像修复三合一神器，HiDiffusion 一键启动教程现已上线！

HiDiffusion 是旷世科技开源的高分辨率框架，不仅支持文生图、图生图，还具备图像修复功能。HyperAI超神经现已上线「HiDiffusion 可快速生成高质量 8k 图像 Demo」教程，无需输入任何命令，一键克隆即可启动。

在线运行： https://go.hyper.ai/yZ5K5

2. LivePortrait 快手开源图生视频数字人 Demo

LivePortrait 是一个人像视频生成框架，主要功能包括从单一图像生成生动动画、精确控制眼睛和嘴唇的动作、处理多个人物肖像的无缝拼接、支持多风格肖像、生成高分辨率动画等。该教程为 LivePortrait 一键运行 Demo，相关环境和依赖已经安装完毕，一键克隆启动即可体验。

在线运行： https://go.hyper.ai/oTs66

3. AuraSR 基于 GAN 的超分辨率图像放大 Demo

AuraSR 是一款基于深度学习的图片高清修复模型，能够智能识别图片中的细节信息，并在放大图片的同时，自动补充缺失的细节。与传统的图片放大方法相比，AuraSR 不仅效果更加出色，而且操作简便，无需专业技能即可轻松上手。一键克隆即可体验模型。

在线运行： https://go.hyper.ai/y2wIU

社区文章精选

1.Meta/东京电子/FPT 软件等共同贡献，Aitomatic 发布首个半导体行业开源大模型，「锁死」企业技术自主权

工业领域 AI 革新领军企业 Aitomatic 宣布推出世界上首个专为半导体行业设计的开源 AI 大语言模型 SemiKong。该公司此前还曾推出名为 aiKO 的 AI Agent，基于企业用户的专业知识、数据，为其构建专属 Agent，企业对于其 Agent 拥有「完全所有权」。

查看完整报道： https://go.hyper.ai/A7eCi

2.精华片段集锦丨黄仁勋与扎克伯格的「世纪对谈」

7 月 30 日凌晨，在第 51 届 SIGGRAPH 图形大会上，英伟达创始人兼 CEO 黄仁勋和 Meta 创始人兼 CEO 马克·扎克伯格进行了一次「围炉夜话」。HyperAI超神经为汇总了精华片段和完整中文字幕视频。

查看完整报道： https://go.hyper.ai/rbU2u

3. 入选 ICML！麻省理工团队基于 AlphaFold 实现新突破，揭示蛋白质动态多样性

麻省理工学院的研究团队重新利用 AlphaFold 和 ESMFold 等高精度的单态预测器，并在自定义流匹配 (Flow Matching) 框架下对其进行微调，以获得序列条件的蛋白质结构生成模型，称为 AlphaFLOW 和 ESMFLOW。本文是对相关论文的详细解读与分享。

查看完整报道： https://go.hyper.ai/qupG9

4. 水平直逼高级病理学家！清华团队提出AI基础模型ROAM，实现胶质瘤精准诊断

清华大学自动化系生命基础模型实验室与中南大学湘雅医院合作，提出了一种基于大区域兴趣和金字塔 Transformer 的精准病理诊断 AI 基础模型 ROAM，用于胶质瘤的临床级诊断和分子标志物发现，并可拓展到其他类型肿瘤的病理诊断。

查看完整报道： https://go.hyper.ai/w4tsr

热门百科词条精选

1. 神经辐射场 NeRF

2. 分组查询注意力 GQA

3. 数据增强 Data Augmentation

4. 大规模多任务语言理解 MMLU

5. 长短期记忆 Long Short-Term Memory

这里汇编了数百条 AI 相关词条，让你在这里读懂「人工智能」：

https://go.hyper.ai/wiki
在这里插入图片描述](https://i-blog.csdnimg.cn/direct/84608e2de4514f52b78b4923ae74b33a.png#pic_center)

一站式追踪人工智能学术顶会：https://go.hyper.ai/event

以上就是本周编辑精选的全部内容，如果你有想要收录 hyper.ai 官方网站的资源，也欢迎留言或投稿告诉我们哦！

下周再见！