大模型评测数据集:MMLU、MMCU、C-Eval

甲骨易AI研究院推出MMCU数据集,用于评测大语言模型对中文的理解能力,填补中文大模型能力测试空白。同时,C-Eval数据集作为中文知识和推理型测试集,包含13948道题目,覆盖人文、社科、理工等多个学科,旨在助力中文大模型的研发与进步。
摘要由CSDN通过智能技术生成

面对国内大语言模型万箭齐发的局面,如何更好地提升大语言模型对中文的理解能力,更好地服务于全球的中文用户,甲骨易AI研究院首创性地推出了高质量中文评测数据集——一款名为“超越”(Massive Multitask Chinese Understanding,简称MMCU)的大规模的多任务测试数据集,填补了中文大语言模型能力测试缺失的一大空白。

ChatGPT 的出现,使中文社区意识到与国际领先水平的差距。近期,中文大模型研发如火如荼,但中文评价基准却很少。在 OpenAI GPT 系列 / Google PaLM 系列 / DeepMind Chinchilla 系列 / Anthropic Claude 系列的研发过程中,MMLU / MATH / BBH 这三个数据集发挥了至关重要的作用,因为它们比较全面地覆盖了模型各个维度的能力。最值得注意的是 MMLU 这个数据集,它考虑了 57 个学科,从人文到社科到理工多个大类的综合知识能力。DeepMind 的 Gopher 和 Chinchilla 这两个模型甚至只看 MMLU 的分数,因此我们想要构造一个中文的,有足够区分度的,

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
v-usb 是一个开源的 USB 软件库,可以用于在 AVR 微控制器上实现 USB 设备功能。下面是一个简单的 v-usb 编译成功的案例: 1. 安装 AVR 工具链:你需要安装 AVR 工具链来编译和烧录代码。你可以从官方网站下载并安装 AVR 工具链。 2. 下载 v-usb 库:你可以从 v-usb 的官方网站或 GitHub 上下载最新的 v-usb 库。 3. 创建一个新的项目文件夹:在你的工作目录中创建一个新的文件夹,用于存放你的 v-usb 项目。 4. 复制 v-usb 文件到项目文件夹:将下载的 v-usb 文件夹中的所有文件复制到你创建的项目文件夹中。 5. 创建你的 USB 设备代码:在项目文件夹中创建一个新的 C 文件,用于编写你的 USB 设备代码。你可以参考 v-usb 提供的示例代码来编写你自己的代码。 6. 编写 Makefile:在项目文件夹中创建一个名为 Makefile 的文件,用于配置编译选项和规则。以下是一个简单的示例 Makefile: ```makefile MCU = atmega328p F_CPU = 16000000 TARGET = main CC = avr-gcc OBJCOPY = avr-objcopy AVRDUDE = avrdude CFLAGS = -mmcu=$(MCU) -DF_CPU=$(F_CPU) -Os all: $(TARGET).hex $(TARGET).hex: $(TARGET).elf $(OBJCOPY) -O ihex -R .eeprom $< $@ $(TARGET).elf: $(TARGET).c usbdrv.c usbdrvasm.S $(CC) $(CFLAGS) -o $@ $^ program: $(TARGET).hex $(AVRDUDE) -p $(MCU) -c usbasp -U flash:w:$(TARGET).hex clean: rm -f $(TARGET).hex $(TARGET).elf .PHONY: all program clean ``` 在 Makefile 中,你需要根据你的项目修改 MCU、F_CPU 和 TARGET 变量,以及 avrdude 命令的参数。 7. 编译和烧录代码:打开终端,进入到你的项目文件夹,并执行以下命令: ``` make all make program ``` 这将编译你的代码,并使用 usbasp 烧录器将程序烧录到 AVR 微控制器中。 这只是一个简单的 v-usb 编译成功的案例,你可以根据你的需求和硬件平台进行更复杂的开发。希望对你有帮助!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值