自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 大规模语言模型构建流程

根据 OpenAI 联合创始人 Andrej Karpathy 在微软 Build 2023 大会上所公开的信息,OpenAI所使用的大规模语言模型构建流程如图1.3所示。主要包含四个阶段:预训练、有监督微调、奖励建模、强化学习。这四个阶段都需要不同规模数据集合以及不同类型的算法,会产出不同类型的模型,同时所需要的资源也有非常大的差别。

2024-04-19 13:53:24 2034 1

转载 神经网络基础之线性运算模型

正常影响薪酬的因素有很多,比如所处的城市、行业、公司、职务等等,如果把这些因素都考虑进去,模型就会更加靠谱。输入x变成了一个具备5个特征的向量,相对应的,仅仅一个参数w就不够用了,我们应该使用5个参数,每个特征对应一个(因为每个特征对薪酬的影响程度不同,所以权重参数不同)。数学上有很多方法来表示两者的接近程度,比如我们可以用两者的的差的平方的1/2来表示它们的接近程度(乘1/2,是为了后面计算方便)。比如,x可以是一个人的工作年限,y可以是他的月薪,我们可以用某种算法来根据一个人的工作年限来预测他的收入。

2024-01-18 18:37:05 144 1

原创 人工智能技术体系概览

人工智能是当今科技领域中备受关注的前沿技术之一。它涵盖了广泛的知识领域,作为学习者每个人的学习路径不同,但是基本包含数学基础、计算机基础、基础与算法、开发框架、模型训练、机器视觉、自然语言、语音识别、商业智能、机器人等多个方面。我们将按照以下目录探讨人工智能技术的体系结构,简要介绍每个模块要掌握的知识体系。

2024-01-16 08:00:00 2491 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除