大家好,我是微学AI,今天给大家介绍一下深度学习实战29-AIGC项目:利用GPT-2(CPU环境)进行文本续写与生成歌词任务。在大家没有GPU算力的情况,大模型可能玩不动,推理速度慢,那么我们怎么才能跑去生成式的模型呢,我们可以试一下GPT-2完成一些简单的任务,让大家在CPU环境下也能进行生成式模型的推理。
一、GPT2模型
GPT-2是一种基于Transformer结构的大规模预训练语言模型,由OpenAI研发。Transformer模型之前讲过可以查看《深度学习实战24-人工智能(Pytorch)搭建transformer模型》。
GPT2它可以通过对大量文本数据进行预训练学习,然后针对不同任务进行微调,以实现更好的表现。GPT-2的预训练采用了无监督的方式,利用海量的文本数据构建语言模型。预训练过程中,输入的文本序列首先经过Token Embedding层和Positional Encoding层,然后输入到多个Transformer Deco