一、大型语言模型(LLM)理论简介
①LLM概念
LLM定义与特点:处理海量文本,多者可具备数百亿参数,理解语言深度,展现涌现能力。
②核心模块:transformer
能够聚焦于输入序列中的重要部分,类似于人类阅读时关注关键词。
③LLM的能力
涌现能力简介,基座模型的多元应用能力,支持对话统一入口。
④LLM的特点
规模巨大,预训练与微调机制,上下文感知能力
⑤LLM的广泛应用
1.自然语言处理的革新
2.改进信息检索
3.探索通用人工智能
二、建立自己的大模型
三、Stable Diffusion:
是一种基于深度学习的文本得到图像的生成模型。
主要组成部分:文本编码器,图像解码器,噪声预测器。、
优势:1.稳定性与训练速度
2.易于优化与多样性控制
缺点:模型训练数据不足,模型参数设置不足,模型结构设计问题。
应用与前景:创意性与多样性扩展,
未来发展趋势与潜力:图像生成技术,人工智能应用,创意产业。