Chinchilla:训练计算利用率最优的大语言模型
《Training Compute-Optimal Large Language Models》
论文地址:https://arxiv.org/pdf/2203.15556.pdf
相关博客
【自然语言处理】【大模型】CodeGeeX:用于代码生成的多语言预训练模型
【自然语言处理】【大模型】LaMDA:用于对话应用程序的语言模型
Chinchilla:训练计算利用率最优的大语言模型
《Training Compute-Optimal Large Language Models》
论文地址:https://arxiv.org/pdf/2203.15556.pdf
相关博客
【自然语言处理】【大模型】CodeGeeX:用于代码生成的多语言预训练模型
【自然语言处理】【大模型】LaMDA:用于对话应用程序的语言模型