公共资源速递
This Weekly Snapshots !
5 个数据集:
* Deepfake Detection 视频数据集
* Wildfire Smoke 野火烟雾检测数据集
* PubMedVision 医学 VQA 数据集
* LAV-DF 多模态音频视觉数据集
* DISC-Law-SFT 中文法律监督微调数据集
3 个教程:
* 一键部署 Phi-3.5-vision-instruct
* LLaVA OneVision 多模态全能视觉模型
* LongWriter-glm4-9b:1 分钟生成万字悬疑小说
访问官网立即使用:openbayes.com
公共数据集
该数据集专为深度伪造检测任务而设计,包含超过 363 个原创片段,其中有 28 位演员在 16 个不同的场景中的表演。
* 直接使用:
https://go.openbayes.com/ij1rv
该数据集包含 737 张图片,其中有 516 张训练图片、147 张验证图片和 74 张测试图片,标注格式为 COCO,旨在提高模型区分云/雾和烟雾的能力,建立端到端反馈循环。
* 直接使用:
https://go.openbayes.com/5FBxf
此数据集包含 130 万个医学 VQA 样本,通过精细的数据处理方法,从 PubMed 国际医学期刊的论文中筛选出与医疗相关的图片及其描述,有效过滤了大量与医疗无关的图片和上下文不相关内容。
* 直接使用:
https://go.openbayes.com/kOwhf
4. LAV-DF 多模态 DeepFake 音频视觉数据集
LAV-DF 是一个多模态(视频篡改和音频篡改)数据集,源自 VoxCeleb2 数据集,包含 136,304 段视频,其中 36,431 段真实视频,99,873 段伪造视频。
* 直接使用:
https://go.openbayes.com/54osR
5. DISC-Law-SFT 高质量中文法律监督微调数据集
该数据集包含两个子集:DISC-Law-SFT-Pair 和 DISC-Law-SFT-Triplet。DISC-Law-SFT-Pair 子集通过法律三段论的指令对构造方法,引入法律推理能力;而 DISC-Law-SFT-Triplet 子集则通过构造包含输入、输出和参考信息的三元组,增强模型利用外部知识的能力。
* 直接使用:
https://go.openbayes.com/S8WYc
公共教程
1. 一键部署 Phi-3.5-vision-instruct
该模型具备广泛的图像理解、光学字符识别 (OCR)、图表和表格解析、视频剪辑摘要等功能,非常适合多种 AI 驱动的应用。在图像和视频处理相关的基准测试中表现出显著的性能提升。模型与环境已经部署完毕,大家可根据教程指引直接使用大模型进行推理生成。
* 在线运行:
https://go.openbayes.com/oFK2y
LLaVA-OneVision 的特点在于其能够处理多样化的视觉任务,无论是静态图像的分析还是动态视频的解析,它都能够提供高质量的输出。只需克隆并启动该容器,直接复制生成的 API 地址,即可对模型进行推理体验。
* 在线运行:
https://go.openbayes.com/L9pqO
3. 教程上新 | 1 分钟生成万字悬疑小说,LongWriter-glm4-9b 上线!
清华大学联合智谱 AI 构建了一个能够生成超过 10,000 字连贯文本的模型 LongWriter-glm4-9b,显著扩展了大型语言模型的输出潜力,在文学创作、新闻报道等实际应用中表现出极大的广泛性。目前,「一键部署 LongWriter-glm4-9b」已上线至 OpenBayes 公共教程界面,一键克隆即可开启对话。
* 在线运行:
https://go.openbayes.com/GXQMm
以上就是小贝上周在 OpenBayes 的全部更新内容啦!