大模型概要介绍

hao_wujing

已于 2025-01-02 10:52:32 修改

阅读量753

点赞数 25

文章标签：人工智能

于 2025-01-02 10:46:40 首次发布

本文链接：https://blog.csdn.net/hao_wujing/article/details/144878569

版权

大家读完之后觉得有意义和帮助记得关注和点赞！！！

一、大模型概述

1.1、什么是大模型

AI大模型是“大数据+大算力+强算法”结合的产物，是一种能够利用大数据和神经网络来模拟人类思维和创造力的人工智能算法。它利用海量的数据和深度学习技术来理解、生成和预测新内容，通常情况下有数百亿乃至数万亿个参数，可以在不同的领域和任务中表现出智能。

1.2、大模型分类

按照输入数据类型的不同，大模型主要可以分为以下三大类：

语言大模型（NLP）：是指在自然语言处理（Natural Language Processing，NLP）领域中的一类大模型，通常用于处理文本数据和理解自然语言。这类大模型的主要特点是它们在大规模语料库上进行了训练，以学习自然语言的各种语法、语义和语境规则。例如：GPT系列（OpenAI）、Bard（Google）、文心一言（百度）、Deep_Seek_V3 。

视觉大模型（CV）：是指在计算机视觉（Computer Vision，CV）领域中使用的大模型，通常用于图像处理和分析。这类模型通过在大规模图像数据上进行训练，可以实现各种视觉任务，如图像分类、目标检测、图像分割、姿态估计、人脸识别等。例如：VIT系列（Google）、文心UFO、华为盘古CV、INTERN（商汤）。

多模态大模型：是指能够处理多种不同类型数据的大模型，例如文本、图像、音频等多模态数据。这类模型结合了NLP和CV的能力，以实现对多模态信息的综合理解和分析，从而能够更全面地理解和处理复杂的数据。例如：DingoDB多模向量数据库（九章云极DataCanvas）、DALL-E(OpenAI)、悟空画画（华为）、midjourney。

按照应用领域的不同，大模型主要可以分为L0、L1、L2三个层级：

通用大模型L0：是指可以在多个领