AIGC（Artificial Intelligence Generated Content）

四问四不知

于 2024-09-16 17:03:55 发布

阅读量145

点赞数

文章标签： AIGC

原文链接：https://baike.baidu.com/item/AIGC/59988381?fr=ge_ala#reference-4

版权

Artificial Intelligence Generated Content

概念定义

人工智能生成内容，是指基于生成对抗网络、大型预训练模型等人工智能的技术方法，通过已有数据的学习和识别，以适当的泛化能力生成相关内容的技术。

AIGC技术的核心思想是利用人工智能算法生成具有一定创意和质量的内容。通过训练模型和大量数据的学习，AIGC可以根据输入的条件或指导，生成与之相关的内容。例如，通过输入关键词、描述或样本，AIGC可以生成与之相匹配的文章、图像、音频等。

发展历程

在这里插入图片描述

产业结构

AI产业链主要由基础层、技术层、应用层三大层构成。其中基础层侧重于基础支撑平台的搭建，包含传感器、AI芯片、数据服务和计算平台；技术层侧重核心技术的研发，主要包括算法模型、基础框架、通用技术；应用层注重产业应用发展主要包含行业解决方案服务、硬件产品和软件产品。

企业AIGC商业落地应用研究报告（链接3）显示，国内AIGC产业链结构主要由基础大模型、行业/场景中模型、业务/领域小模型，AI基础设施、AIGC配套服务五部分构成，并且已经形成了丰富的产业链。

关键技术能力

实现AIGC更加智能化、实用化的三大要素是：数据、算力、算法。

数据：AIGC人有我优的核心基础，包括存储（集中式数据库、分布式数据库、云原生数据库、向量数据库）、来源（用户数据、公开域数据、私有域数据）、形态（结构化数据、非结构化数据）、处理（筛选、标注、处理、增强…）
算力：为AIGC提供基础算力的平台，包括半导体（CPU、GPU、DPU、TPU、NPU）、服务器、大模型算力集群、基于IaaS搭建分布式训练环境、自建数据中心部署。
算法：通过模型设计、模型训练、模型推理、模型部署步骤，完成从机器学习平台、模型训练平台到自动建模平台的构建，实现对实际业务的支撑与覆盖。

落地方式与路径

目前企业/机构端在使用相关的AIGC能力时，主要有五种方式：直接使用、Prompt、LoRA、Finetune、Train。

直接使用：顾名思义，直接使用基础大模型厂商发布的产品服务，通过接口调用方式嵌入自身业务或系统当中。
Prompt：通过提示工程，通过微调少量参数，引导预训练语言模型做特定下游任务。利用文本对话方式操控语言大模型，引导生成结果。
LoRA：仅训练低秩矩阵（low rank matrics），使用时将LoRA模型的参数注入基础大模型，在不修改大模型的前提下，改变模型的生成风格。所需的训练资源比训练基础大模型要小很多，非常适合社区使用者和个人开发者。
FineTune：Finetune是应用或利用迁移学习的一种方式。对基础大模型进行微调，以适应特定任务。当数据集相似，但数据量又很少的情况下，微调省去大量计算资源和计算时间，提高了计算效率,甚至提高准确率。具体来说，微调是一个过程，它采用已经针对一项给定任务训练过的模型，然后调整或微调模型以使其执行第二个类似任务。
Train：调用数据、算力、算法从头训练大模型，从头开始训练大模型。除非特殊领域和特定要求，一般商业公司不会从头开始训练基础大模型。

AIGC发展存在的问题

法律法规完善程度低：目前AIGC相关的法律法规不完善是主要问题，想要实现对AIGC技术的有效发挥，必须对其相关的法律法规进行完善。就当前的AIGC技术在目前的应用来看，其缺乏完善的安全性标准，没有明确AIGC技术服务、内容传播与技术应用各相关方面的法律和社会责任。其次，缺乏完善的AIGC技术相关立法，与分级分类的监管手段，AIGC技术的安全性难以得到保障。
数据要素问题突出：在AIGC技术的使用中，没有明确划分公有数据和专有数据的使用界限，使基础大模型训练的数据合规性、安全性、权属产生问题。例如，专有数据的泄露可能会导致用户数据安全的问题，同时数据要素也很难有效的发挥出自己的价值。
技术保密性问题：技术保密性是AIGC的首要问题。比如，在与AIGC交互的过程中，企业的专有资源被泄露等。如果技术保密性不足就可能严重影响到信息资源的所有者。

完善措施

法律准入：随着AIGC技术的不断发展，AI应用的领域日益广泛，为了更好地规范市场发展，建议逐步完善保障AIGC良性发展的法律法规体系，建立法律准入体系。开展针对AIGC模型市场准入方面的法律法规研究，从而明确AIGC技术服务、内容传播与技术应用各相关方面的法律和社会责任。同时，鼓励立法研究的多方参与、监管手段的分级分类、行业治理的公私合作。
数据服务产业链纳入统一管理体系：数据是AIGC发展的三大根基之一，加强数据要素安全，是AI技术安全落地的基础。首先，可以加强各级单位对于数据要素的治理，分级分层建立数据要素安全标准，如网络安全等级保护、数据分类分级管理、合规管理体系的搭建以及安全事件的防范等方面建立完善的解决方案。
技术标准统一和完善：技术是AIGC发展的核心，加强技术的独立可控是AIGC发展的重要手段。可以在基础大模型阶段开始实施技术标准、业务标准的制定，从起步阶段完善产业链体系的标准化。
同时加强数据归集、算力统筹、算法开源等平台和基础能力建设等；同时优化AIGC技术的发展环境，通过技术创新、理念创新，进一步适应新的发展环境，提高技术的应用价值，是未来AIGC技术的发展重点。

机器学习的方法及分类

在这里插入图片描述

参考链接：
1、https://max.book118.com/html/2024/0328/7025026166006056.shtm
2、https://zhuanlan.zhihu.com/p/667916299
3、https://www.doc88.com/p-10987609999510.html