人工智能技术笔记-CSDN博客

原创大规模语言模型构建流程

根据 OpenAI 联合创始人 Andrej Karpathy 在微软 Build 2023 大会上所公开的信息，OpenAI所使用的大规模语言模型构建流程如图1.3所示。主要包含四个阶段：预训练、有监督微调、奖励建模、强化学习。这四个阶段都需要不同规模数据集合以及不同类型的算法，会产出不同类型的模型，同时所需要的资源也有非常大的差别。

2024-04-19 13:53:24 2332 1

正常影响薪酬的因素有很多，比如所处的城市、行业、公司、职务等等，如果把这些因素都考虑进去，模型就会更加靠谱。输入x变成了一个具备5个特征的向量，相对应的，仅仅一个参数w就不够用了，我们应该使用5个参数，每个特征对应一个(因为每个特征对薪酬的影响程度不同，所以权重参数不同)。数学上有很多方法来表示两者的接近程度，比如我们可以用两者的的差的平方的1/2来表示它们的接近程度（乘1/2，是为了后面计算方便）。比如，x可以是一个人的工作年限，y可以是他的月薪，我们可以用某种算法来根据一个人的工作年限来预测他的收入。

2024-01-18 18:37:05 241 1

原创人工智能技术体系概览

人工智能是当今科技领域中备受关注的前沿技术之一。它涵盖了广泛的知识领域，作为学习者每个人的学习路径不同，但是基本包含数学基础、计算机基础、基础与算法、开发框架、模型训练、机器视觉、自然语言、语音识别、商业智能、机器人等多个方面。我们将按照以下目录探讨人工智能技术的体系结构，简要介绍每个模块要掌握的知识体系。

2024-01-16 08:00:00 2903 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

cary_share的博客

原创大规模语言模型构建流程

转载神经网络基础之线性运算模型

原创人工智能技术体系概览

空空如也

空空如也

原创 大规模语言模型构建流程

转载 神经网络基础之线性运算模型

原创 人工智能技术体系概览

空空如也

空空如也

原创大规模语言模型构建流程

转载神经网络基础之线性运算模型

原创人工智能技术体系概览