AI大模型技术
文章平均质量分 93
大模型(预训练模型、基础模型等)是“大算力+ 强算法”结合的产物。大模型通常在大规模无标注数据上进行训练,以学习某种特征。在大模型进行开发应用时,将大模型进行微调,如对某些下游任务进行小规模标注数据的二次训练或不进行微调就可以完成。
常耀斌
CTO,AI科学家。清华大学出版的《大数据架构之道和项目实战》,《AI赋能企业数字化转型》,《深度学习和大模型实战》
展开
-
AI大模型系列之九:人脸识别技术
图像识别的过程总结如下:信息的获取:是通过传感器,将光或声音等信息转化为电信息。信息可以是二维的图象如文字,图象等;可以是一维的波形如声波,心电图,脑电图;也可以是物理量与逻辑值。 预处理:包括A\D,二值化,图象的平滑,变换,增强,恢复,滤波等, 主要指图象处理。 特征抽取和选择:在模式识别中,需要进行特征的抽取和选择,例如,一幅64x64的图象可以得到4096个数据,这种在测量空间的原...原创 2018-12-03 09:28:59 · 14588 阅读 · 1 评论 -
AI大模型系列之八:YoloV3的整体框架介绍
YOLOV到底做了什么?YOLO核心思想把目标检测转变成一个回归问题。将整个图像作为网络的输入,仅仅经过一个神经网络,得到边界框的位置及其所属的类别。原创 2022-05-13 16:37:57 · 1387 阅读 · 0 评论 -
AI大模型系列之七:Transformer架构讲解
Transformer模型设计之初,用于解决机器翻译问题,是完全基于注意力机制构建的编码器-解码器架构,编码器和解码器均由若干个具有相同结构的层叠加而成,每一层的参数不同。编码器主要负责将输入序列转化为一个定长的向量表示,解码器则将这个向量解码为输出序列。Transformer总体架构可分为四个部分:输入部分、编码器、解码器、输出部分。原创 2024-05-13 19:28:34 · 967 阅读 · 1 评论 -
AI大模型系列之六:基于LLM的Agent架构图解
Agent是什么?Agent是一种能够自主决策、采取行动以达到某种目标的实体。AI Agent则被明确定义为:基于人工智能(尤其是大模型)技术,能够感知和理解环境,并采取行动以完成目标的智能实体。Agent能干什么?AI Agent 主要依托LLM模型和具体的业务场景来调用相应的工具来完成任务目标,智能化程度和行业贴合度会更明显。原创 2024-05-12 17:38:43 · 916 阅读 · 0 评论 -
AI大模型系列之三:Swin Transformer 最强CV图解(深度好文)
SwinTransformer是一种为视觉领域设计的分层Transformer结构。它的两大特性是滑动窗口和分层表示。滑动窗口在局部不重叠的窗口中计算自注意力,并允许跨窗口连接。分层结构允许模型适配不同尺度的图片,并且计算复杂度与图像大小呈线性关系。Swin Transformer借鉴了CNN的分层结构,不仅能够做分类,还能够和CNN一样扩展到下游任务,用于计算机视觉任务的通用主干网络,可以用于图像分类、图像分割、目标检测等一系列视觉下游任务。原创 2024-03-30 21:24:57 · 1313 阅读 · 0 评论 -
AI大模型系列之五:BERT技术详解(深度好文)
BERT(Bidirectional Encoder Representations from Transformers)是由 Google 开发的一个预训练模型,通过无监督的学习方式,可以学习出一种通用的语言表征,即每个词汇的向量表示,这些向量表示可以应用到各种自然语言处理任务中,例如句子分类、命名实体识别、问答等任务。BERT 的主要贡献是提出了一种双向 Transformer 模型,可以通过对上下文的建模来更好地表示词汇。原创 2020-10-19 16:09:32 · 20437 阅读 · 2 评论 -
AI大模型系列之一:技术原理科普(深度好文)
如何深入浅出理解大模型,一下子认识AI大模型的家族:生成式AI、监督学习、无监督学习、强化学习、深度学习、大语言模型和Transformer架构,你值得拥有!原创 2024-04-09 10:23:03 · 1383 阅读 · 1 评论 -
AI大模型系列之四:深入浅出CNN
与传统机器学习相比,深度学习是从数据中学习,而大模型则是通过使用大量的模型来训练数据。深度学习可以处理任何类型的数据,例如图片、文本等等;但是这些数据很难用机器完成。大模型可以训练更多类别、多个级别的模型,因此可以处理更广泛的类型。原创 2019-09-17 10:15:31 · 6623 阅读 · 1 评论 -
AI大模型系列之二:ChatGPT科普(深度好文)
ChatGPT是人工智能研究实验室OpenAI研发的聊天机器人程序,通俗讲,ChatGPT是人工智能里程碑,你可以把它当做一个人工智能聊天软件。可能你会问,这类人工智能产品,市面上不是有吗?有是有,可若是跟ChatGPT比起来,其他的产品都是不值一提。ChatGPT厉害到什么程度呢?举例:ChatGPT能把项目文件的要点总结出来,还能附上数据来源,还可以帮你制作图表,还能帮你撰写论文、设计图片、翻译、撰写代码等等。因此,ChatGPT会较快影响各行各业,一是文字类工作,这是首当其冲,特别是内容创作以及归纳性原创 2024-04-10 14:24:59 · 1655 阅读 · 2 评论