1.大语言模型如何从专才走向通才2.GPT4的核心是可以写并执行代码,还可以接受文件读取并应用于代码中（比如中文字资料包），完全是个工程师了

wonag

已于 2024-08-03 03:38:21 修改

阅读量379

点赞数 4

文章标签：语言模型人工智能自然语言处理

于 2024-08-02 22:45:17 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45124463/article/details/140873647

版权

1.大语言模型如何从专才（机器翻译）走向通才2.GPT4的核心是可以写并执行代码,还可以接受文件读取并应用于代码中（比如中文字资料包），完全是个工程师了

总纲：大语言模型就是做文字接龙游戏!

大模型为了得到更好结果的两个方向：prompt（改变自己）和 finetune（改变模型）

prompt engineer：

1.神奇咒语可能有用，提高数学问题正确率:lets think step by step

2.提供教科书作为输入文件,让它直接现在“学习”(in-context learning，不是真的learning)似乎就是把prompt和教科书读完之后继续文字接龙...

3.回答后叫模型反思一下对不对

4.语言模型只是在做预测下一个token的游戏，1.自然做不了数学。。。

2.也不适合做搜索引擎，因为训练资料里没有最新新闻（搜索引擎功能是大模型外集成进去的,kimi自动决定用不用联网搜索）。但是我们可以为大语言模型配备工具！如搜索引擎，计算器

比如gpt4会自己写程序并执行，上面的算数例子无法通过文字接龙给出答案，但是可以调用程序运行得到正确结果，所以大语言模型可以经常写程序，保证输出的正确性

语言模型是如何使用工具的呢？模型自己决定什么时候call工具,将工具结果复制进来继续文字接龙

RAG：

模型合作？小镇村民？

LLM的训练启示我们初始化参数极其重要！

LLM training:第一阶段就相当于是init_weight初始化model参数,让模型有一组好的权重，而不是随机权重(self-supervised learning),这个时候的模型并不受控，给他输入一些文字，他就不受控的一直输出下去了，因为网上的文字资料也没有教他如何“回答”问题

(以上为内力阶段，model并没有回答问题的概念，只是个无情的文字接龙机器，各种评价效果都比较垃圾)

第二阶段fine-tune：人类老师教导，supervised learning(资料较少，因为人力标注很贵)

chatgpt界面的prompt没有USER AI是因为省略了，model看到的是带有说话者的输入文字

第一阶段训练了好的参数作为基石，碰巧源于人类的梯度下降法会在附近找参数

此时训练会使用adapter技术(lora)：固定pretrain model的大量参数，加入少量新参数，对新加入的参数进行训练。（全部参数训练会非常耗时间）

BERT,CHATGPT，LLAMA这些名字本身都是pretrain model

BERT通过fine-tune打造一堆专才

fine-tune就是用一堆有标签的task去全方位训练pretrain model(依我看，专才通才没区别，无非是通才训练的更多罢了)

第三阶段：是强化学习....chatgpt生成两句话人类判断哪个更好，反馈微调参数调整两句话的出现概率(向人类喜好RL学习也至关重要，小参数经过三个阶段后可以打爆大参数模型只pretrain+instruct finetune),启示：RL是机器学习的基础方法，必须学习，RL一般用在最抽象，最难以有训练标准，只有好坏评价的那种终极任务中，即监督学习等方法都失效的情况下

Mamba:一种类似RNN的东西，想取代attention

2024generative ai断点：explain，大模型的可解释性

关注

4
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。