【大模型理论基础】(大模型的能力)学习笔记

本文探讨了语言模型如何转化为适应特定任务的模型,涉及几何平均方法,以及以PennTreeBank等经典数据集为基础的多个NLP任务,如问答、翻译、算术和新闻文章生成,同时强调新词处理和英语语法纠错的应用.
摘要由CSDN通过智能技术生成

学习教程文档【大模型理论基础

语言模型的适应性:从语言模型到任务模型的转化

在这里插入图片描述
在这里插入图片描述

Language Modeling

在这里插入图片描述

采用几何平均,每个词标记的概率都被同等看待,并且一个极低的概率(如0)将会导致整个几何平均大幅度下降
在这里插入图片描述

数据集

  • Penn Tree Bank
    自然语言处理中的一个经典数据集,最初是为了进行句法解析而标注的
  • LAMBADA
    在这里插入图片描述
  • HellaSwag
    在这里插入图片描述
  • Question answering
    (闭卷)问答题,其中输入是一个问题,输出是一个答案
  • TriviaQA
    任务:给定一问题后生成答案
  • WebQuestions
    任务:和TriviaQA类似是问答任务
  • NaturalQuestions
    任务:回答问题
  • Translation
    翻译任务是将源语言(例如,德语)中的句子翻译成目标语言(例如,英语)中的句子
  • Arithmetic
    任务:做算术题(2-5位数的加法,减法,乘法)
  • News article generation
    任务:给定标题和副标题,生成新闻文章
  • Novel tasks
    使用新词;纠正英语语法
  • 6
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值