大模型学习笔记一：大模型应开发基础（模型归类选型、安全因素选型、）

谢白羽

已于 2024-07-23 00:47:37 修改

阅读量1k

点赞数 4

分类专栏：大语言模型文章标签：学习笔记 python

于 2024-01-25 20:10:29 首次发布

谢白羽专属

本文链接：https://blog.csdn.net/weixin_43679037/article/details/135852037

版权

大语言模型专栏收录该内容

25 篇文章

订阅专栏

文章目录

一、大模型一些概念介绍

1）产品和大模型的区别（产品通过调用大模型来具备的能力）
2）AGI定义
概念：一切问题可以用AI解决
3）大模型通俗原理
根据上文，猜测下一个词
4）大模型测试代码

from openai import OpenAI

from dotenv import load_dotenv,find_dotenv
_ = load_dotenv(find_dotenv())


client = OpenAI()
prompt = "今天我很"
# prompt = "下班了，今天我很"
# prompt = "放学了，今天我很"
# prompt = "AGI 实现了，今天我很"

response = client.completions.create(
	model      = "gpt-3.5-turbo-instruct",
	propt      = prompt,
	max_tokens = 512,
	stream     = True
)

for chunk in response:
	print(chunk.choices[0].text,end='')

二、市面上大模型对比

在这里插入图片描述

三、大模型使用安全选型

在这里插入图片描述

四、使用大模型的方式（一问一答、Agent+ Function Calling、RAG、Fine-tuning

）
①一问一答
在这里插入图片描述
②Agent+ Function Calling

③RAG

④Fine-tuning
努力记住考试内容，长期记住，活学活用（在基础大模型之上加一层微调，该百年模型的权重）

五、大模型使用路线

1）是否要补充知识？
是—使用RAG
2）是否要对接其他系统
是—Function Calling
3）值得尝试微调？
是—用旧数据做fine-tune，有几大好处
①提高大模型的稳定性
②用户量大，降低推理的成本
③提高大模型生成速度

九、补充说明

1）注意力机制讲解

文本举例讲解
有没有注意力机制的区别图

①RNN会有一个隐藏状态，是AI用来理解一个中文词义的作用，可以看到JE和SUIS通过神经网络变成了一个向量

注意力网络的实现

注意力网络做的事：
①每个同学h(x)都听一遍
②同时还要找出其重点
非注意网络做的事：
①线性传播一个人只能传递给下一个人
注意力网络的方式
上下文的向量：

c2 = a21h1+a22h2+a23h3

①x(数字)是输入的语言，通过RNN神经网络变成一个状态h1，
②α是输入的加权平均（attention weight）
③c是每一个词权重的重点

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。