![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大模型
文章平均质量分 57
南宫凝忆
这个作者很懒,什么都没留下…
展开
-
Attention 注意力机制
Attention和人观测的思考方式很像;Lstm 借鉴了人看时序数据的思考方式。Cnn借鉴人看图片的思考方式;原创 2024-01-24 10:32:20 · 406 阅读 · 0 评论 -
大模型微调实战笔记
大模型微调经验原创 2024-01-21 14:46:48 · 1360 阅读 · 0 评论 -
ChatGLM vs ChatGPT
国内大模型nb公司:百度、清华智谱。原创 2024-01-20 16:33:21 · 1154 阅读 · 0 评论 -
羊驼系列大模型LLaMa、Alpaca、Vicuna
羊驼系列大模型LLaMa、Alpaca、Vicuna原创 2024-01-20 15:46:35 · 736 阅读 · 0 评论 -
大模型Agent
大模型Agent一、背景知识1.会产生幻觉。2.结果并不总是真实的。3.对时事的了解有限或一无所知。4.很难应对复杂的计算。•Google搜索:获取最新信息•Python REPL:执行代码•Wolfram:进行复杂的计算•外部API:获取特定信息大模型 + 插件 + 执行流程 = Agent二、Agent框架LLM-based Agent 框架包含三个组成部分:控制端(Brain)、感知端(Perception)和行动端 (Action)。1、控制端:Brain。原创 2024-01-17 18:13:35 · 6117 阅读 · 0 评论 -
大模型多卡训练原理
大模型多卡训练原理原创 2024-01-17 16:20:22 · 926 阅读 · 0 评论