【大语言模型基础】GPT（Generative Pre-training ）生成式无监督预训练模型原理

AI大模型探索者

于 2024-06-06 16:02:08 发布

阅读量562

点赞数 20

文章标签：语言模型 gpt 人工智能深度学习机器学习 ai

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_53880910/article/details/139502987

版权

前言

ELMo：将上下文当作特征，但是无监督的语料和我们真实的语料还是有区别的，不一定符合我们特定的任务，是一种双向的特征提取。

OpenAI GPT: 通过transformer decoder学习出来一个语言模型，不是固定的，通过任务 fine-tuning,用transfomer代替ELMo的LSTM。

OpenAI GPT其实就是缺少了encoder的transformer：当然也没了encoder与decoder之间的attention。

OpenAI GPT虽然可以进行fine-tuning,但是有些特殊任务与pre-training输入有出入，单个句子与两个句子不一致的情况，很难解决，还有就是decoder只能看到前面的信息。

GPT适用于生成任务（自回归语言模型，任务更难但潜力更大）， BERT适合判别。

GPT1大概1亿参数，BERT-base类似， BERT-large大概3.4亿

类似GPT2大概13亿参数

True LM （预训练没有句子级别任务）

有监督微调时：

拿Transformer Encoder的输出的最后一个向量，送入前馈网络+Softmax

下游任务损失 + alpha 预训练损失

初始词元，间隔词元，抽取词元，构成输入序列，Transformer抽取特征，送入线性层，分类

四个任务

分类：句子A
蕴含：句子A, 句子B假设， True， False, None, 3分类
相似性： Text1，Text2，相不似相似True/False；交换顺序Text2，Text1，相不似相似True/False（单向的，交换顺序不一样，有必要）。抽取特征相加，线性，分类
多选择（QA，摘要）：一个上下文，多个答案, 分别用Transformer编码，多分类

Bert-Base对标GPT1, 12层，768维，12头

WordsCorpus 800M words

最后的最后

感谢你们的阅读和喜欢，我收藏了很多技术干货，可以共享给喜欢我文章的朋友们，如果你肯花时间沉下心去学习，它们一定能帮到你。

因为这个行业不同于其他行业，知识体系实在是过于庞大，知识更新也非常快。作为一个普通人，无法全部学完，所以我们在提升技术的时候，首先需要明确一个目标，然后制定好完整的计划，同时找到好的学习方法，这样才能更快的提升自己。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

一、全套AGI大模型学习路线

AI大模型时代的学习之旅：从基础到前沿，掌握人工智能的核心技能！

二、640套AI大模型报告合集

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。

四、AI大模型商业化落地方案

五、面试资料

我们学习AI大模型必然是想找到高薪的工作，下面这些面试题都是总结当前最新、最热、最高频的面试题，并且每道题都有详细的答案，面试前刷完这套面试题资料，小小offer，不在话下。
在这里插入图片描述

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

AI大模型探索者

关注

20
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
【大语言模型基础】GPT（Generative Pre-training ）生成式无监督预训练模型原理

ELMo：将上下文当作特征，但是无监督的语料和我们真实的语料还是有区别的，不一定符合我们特定的任务，是一种双向的特征提取。
复制链接

扫一扫

AI大模型探索者 CSDN认证博客专家 CSDN认证企业博客

码龄4年

56: 原创

3万+: 周排名

2万+: 总排名

4万+: 访问

: 等级

1743: 积分

793: 粉丝

1109: 获赞

4: 评论

876: 收藏

私信

关注

热门文章

最新评论

生成模型的两大代表：VAE和GAN
Kwan的解忧杂货铺@新空间代码工作室: 博主的博客每一篇博文都如一本启发书，我从中汲取灵感，希望博主继续为我们献上这些珍宝。是我的学习良师，每篇文章都充满见解，让我茅塞顿开，你的文章总是让我对复杂的主题有更深入的理解，非常感激你的专业分享。期待更多分享。
【AI大模型】Python基础
怒放de生命2010: 请问那个脑图的路线是什么课程，有链接吗
生成模型的两大代表：VAE和GAN
百锦再@新空间代码工作室: 这篇文章简直堪称是生成模型领域的灵感之光，以VAE和GAN为代表，深刻揭示了这两大模型的优秀特性和巧妙设计。仿佛是一场精妙的交响乐，每一个音符都奏响着创新和智慧的交响曲，让人沉醉其中，感叹于人类智慧的无限可能。VAE和GAN，如同两位璀璨的明星，闪耀着灵感的火花，引领着生成模型的未来之路。愿我们能够深刻领会这两大代表的魅力所在，不断挖掘其潜力，开创更加美好的未来！
揭开大模型prompt提示工程的神秘面纱，助力轻松驾驭AI
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。