- 博客(3)
- 收藏
- 关注
原创 大规模语言模型构建流程
根据 OpenAI 联合创始人 Andrej Karpathy 在微软 Build 2023 大会上所公开的信息,OpenAI所使用的大规模语言模型构建流程如图1.3所示。主要包含四个阶段:预训练、有监督微调、奖励建模、强化学习。这四个阶段都需要不同规模数据集合以及不同类型的算法,会产出不同类型的模型,同时所需要的资源也有非常大的差别。
2024-04-19 13:53:24
2034
1
转载 神经网络基础之线性运算模型
正常影响薪酬的因素有很多,比如所处的城市、行业、公司、职务等等,如果把这些因素都考虑进去,模型就会更加靠谱。输入x变成了一个具备5个特征的向量,相对应的,仅仅一个参数w就不够用了,我们应该使用5个参数,每个特征对应一个(因为每个特征对薪酬的影响程度不同,所以权重参数不同)。数学上有很多方法来表示两者的接近程度,比如我们可以用两者的的差的平方的1/2来表示它们的接近程度(乘1/2,是为了后面计算方便)。比如,x可以是一个人的工作年限,y可以是他的月薪,我们可以用某种算法来根据一个人的工作年限来预测他的收入。
2024-01-18 18:37:05
144
1
原创 人工智能技术体系概览
人工智能是当今科技领域中备受关注的前沿技术之一。它涵盖了广泛的知识领域,作为学习者每个人的学习路径不同,但是基本包含数学基础、计算机基础、基础与算法、开发框架、模型训练、机器视觉、自然语言、语音识别、商业智能、机器人等多个方面。我们将按照以下目录探讨人工智能技术的体系结构,简要介绍每个模块要掌握的知识体系。
2024-01-16 08:00:00
2491
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人