【01-大模型基础——语言模型】

本文介绍了语言模型在自然语言处理中的重要性,包括自回归语言模型的概念,以及语言模型的发展历程,从语法规则模型到统计语言模型,再到神经网络语言模型如RNN和Transformer架构的Bert、GPT等。
摘要由CSDN通过智能技术生成


前言

随着chatGPT从2023年春季受到越来越多的人关注,以chatGPT为首的大模型开始逐渐走入大众视野,也有越来越多的学习者开始了解大模型,本文就介绍了大模型的基础内容——语言模型。


一、什么是语言模型(Language Models)?

在自然语言处理(NLP)中,语言模型是其关键部件,而大模型是建立在这个语言模型的基础之上的。语言模型的任务是在预测一段话中句子(词的序列)出现的概率。语言模型是通过对特定序列的单词的存在的概率进行计算的模型。

二、自回归语言模型(Autoregressive Language Models)

假设m个单词的序列为 { ω 1 , ω 2 , . . . , ω m } \{\omega_1, \omega_2, ... , \omega_m\} { ω1,ω2,...,ωm},他们的概率记为 P ( ω 1 , ω 2 , . . . , ω m ) P(\omega_1, \omega_2, ... , \omega_m) P(ω1,ω2,...,ωm)

由概率的链式法则,以及序列中单词出现的概率是独立事件,可以得到序列 { ω 1 , ω 2 , . . . , ω m } \{\omega_1, \omega_2, ... , \omega_m\} { ω1,ω2,...,ωm}的联合分布:
P ( ω 1 , ω 2 , . . . , ω m ) = P ( ω 1 ) P ( ω 2 ∣ ω 1 ) P ( ω 3 ∣ ω 1 , ω 2 )

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值