OpenBayes 一周速览|在 OpenBayes 上一键运行通义千问大模型、PAWS-X 跨语言对抗数据集上线

公共资源速递

This Weekly Snapshots !

3 个数据集:

* PKU 简体中文分词数据集

* 1,823 张花卉图像数据集

* PAWS-X :用于释义识别的跨语言对抗数据集

1 个模型:

* Yi-34B-Chat-4bits

2 个教程:

通义千问 14B Chat Int4 模型 Gradio Demo

在 OpenBayes 运行通义千问 Qwen-1.8B-Chat 模型并进行微调

访问官网立即使用:openbayes.com

公共数据集

1. PKU 简体中文分词数据集

SIGHAN 2005 数据集由国际中文自动分词评测(简称 SIGHAN 评测)整合了多个机构的分词数据集构成。该数据集由中国微软研究所、北京大学、香港城市大学、台湾中央研究院联合发布,用以进行中文分词模型的训练与评测。其中 PKU 为简体中文分词数据集。

* 直接使用:https://reurl.cc/2zApgn

2. 1,823 张花卉图像数据集

该数据集包含 1,823 张蒲公英和雏菊花等多种花卉品种的图像,可以用于分类检测任务。

* 直接使用:https://reurl.cc/rrbMgx

3.PAWS-X :用于释义识别的跨语言对抗数据集

该数据集包含 23,659 个人工翻译的 PAWS 评估对和 296,406 个机器翻译的训练对,采用了六种类型不同的语言:法语、西班牙语、德语、中文、日语和韩语。所有翻译对均源自 PAWS-Wiki 中的示例。

* 直接使用:https://reurl.cc/qrbQ1y

公共模型

1. Yi-34B-Chat-4bits

「Yi-34B-Chat」是零一万物开源的大语言模型。本模型是「Yi-34B-Chat」的 4bits 量化版本,该版本可以直接在 RTX 3090 等消费级显卡上使用。

* 直接使用:https://reurl.cc/zlGxO0

公共教程

1. 通义千问 1.8B Chat API FT Demo

本教程主要演示了在 OpenBayes 平台运行「通义千问 Qwen-1.8B-Chat 模型」并进行微调的具体流程。

* 一键克隆:https://reurl.cc/4jDZGK

2. 通义千问 14B Chat Int4 模型 Gradio Demo

本教程主要演示了如何在 OpenBayes 上运行「通义千问 14B Chat」的 Int4 量化模型。

* 一键克隆:https://reurl.cc/bDb0oX

以上就是小贝上周在 OpenBayes 的全部更新内容啦~

此外,OpenBayes 平台还提供超过 500 个精选公共数据集、模型、教程等优质资源,并已经整合到「公共资源」模块中。OpenBayes 平台支持一键 Input,开箱即用!

更多详细教程,请观看:

【OpenBayes 官方教程】计算资源介绍_哔哩哔哩_bilibili

  • 7
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
腾讯和阿里都在大模型迁移方面有一些研究和实践经验。以下是两家公司的一些方法和实践: 腾讯: 1. ELMo(Embeddings from Language Models):腾讯提出了ELMo模型过预训练语言模型来学习词汇和句子的表示,然后将这些表示用于下游任务的微调。ELMo模型利用了多层双向LSTM来建模上下文信息,并过预测下一个词的任务进行预训练。 2. MT-DNN(Multi-Task Deep Neural Network):腾讯提出了MT-DNN模型过在多个任务上进行预训练和微调,实现了模型的迁移学习。MT-DNN模型采用了多任务学习的方式,共享底层的编码器,并在每个任务上使用任务特定的输出层。 阿里: 1. DAM(Deep Attention Matching Network):阿里提出了DAM模型,用于文本匹配任务。DAM模型利用自注意力机制和多层双向GRU来建模句子之间的关系,并过预测相似度的任务进行预训练。然后,过在具体文本匹配任务上微调模型来提高性能。 2. PAWS-X(Paraphrase Adversaries from Word Scrambling - Cross-lingual):阿里开源了PAWS-X数据集,用于语言的文本相似度任务。这个数据集包含了多种语言的句子对,可以用于训练和评估大模型语言任务上的迁移能力。 腾讯和阿里都在大模型迁移方面进行了一系列的研究和实践,过预训练和微调的方式,将大规模预训练模型应用于具体的下游任务,并取得了一定的成果。这些方法和实践都旨在提升模型在各种自然语言处理任务上的性能,并推动相关技术的发展。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值