Hugging Face 每周速递: Chatbot Hackathon；FLAN-T5 XL 微调；构建更安全的 LLM

Hugging Face

于 2023-03-10 22:55:56 发布

阅读量250

点赞数

本文链接：https://blog.csdn.net/HuggingFace/article/details/129458055

版权

本周HuggingFace带来了HACKATHON活动，联合推出AI聚会；FLAN-T5模型在多个任务中表现出色，现支持DeepSpeed微调；同时，更新了一键风格迁移的文生图模型和红队方法以提升大语言模型的安全性。此外，DiffusersforMac1.1发布，提供更好的图像生成和用户体验，Gradio引入事件监听器功能，而ChatRWKVv2展示了最新的对话效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

每一周，我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新，包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等，我们将其称之为「Hugging News」，本期 Hugging News 有哪些有趣的消息，快来看看吧！

🚀HACKATHON🚀 造个 🤖️ 去瀛海威广场聚会啦！

百姓 AI 和 Hugging Face 联合推出，就在下周末。大伙儿造/燥起来呀

使用 DeepSpeed 和 HuggingFace Transformers 对 FLAN-T5 XL/XXL 进行微调

《Scaling Instruction-Finetuned Language Models》论文中发布的 FLAN-T5 是 T5 的增强版本，它已经在多种任务中进行了微调。相同参数数量下，FLAN-T5 的表现比 T5 提高了两位数。Google 已经在 Hugging Face 上开源了 5 个版本，参数范围从 80M 到 11B 不等。本文介绍了如何使用 Transformers 对其进行微调。

https://www.philschmid.de/fine-tune-flan-t5-deepspeed