Task01-大模型简介-动手学习大模型应用开发

最新推荐文章于 2024-11-15 10:30:52 发布

Karry12138

最新推荐文章于 2024-11-15 10:30:52 发布

阅读量107

点赞数

分类专栏：大模型 # 大模型应用开发文章标签：学习 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Karry12138/article/details/134391294

版权

大模型同时被 2 个专栏收录

7 篇文章 0 订阅

订阅专栏

大模型应用开发

5 篇文章 0 订阅

订阅专栏

20231113-1114 by 老年人elderman

Task01 大模型简介

### 概述

Large Language Model,指的是参数达到百亿及以上的语言模型。其与参数在亿及以下量级的类似架构小语言模型相比，最大的特点是”涌现”出了解决复杂问题的能力，诸如上下文学习，遵循并完成用户自然语言指令输入，以及逐步的逻辑推理。国外常见的大模型为GPT-3,GPT-4,PaLM,LLaMA等，国内的有清华与智谱AI开发的GLM,百度文心一言，科大讯飞的讯飞星火等。它们的出现使得通用人工智能AGI变得可能。

### 常见大模型

#### 开源

Baichuan - 百川智能可商用参数量7B/13B 上下文4K 中英双语

基底模型(开发者可微调)+对话模型 https://github.com/baichuan-inc

GLM系列 - 清华大学+智谱AI 截止20231114已发布到ChatGLM3，中文社群好

有相当数量的变种大模型，很惊艳。部分变种如下

===

CogVLM 多模态(语言+图片)，可以理解图片并基于此进行推理和对话。也包含OCR功能。部分情况下识别的图片细节比GPT-4-vision模型更多

模型推理: 1*A100(80g) / 2*RTX 3090 (24g)

微调:4*A100(80g) / 8*RTX 3090 (24g)

https://github.com/THUDM/CogVLM

VisualGLM-6B 使用显存小(15G,可INT4),发布时间比CogVLM早的多模态大模型

https://github.com/THUDM/VisualGLM-6B

ChatGLM3-6B 双语对话可api调用上下文8k-32k 所需显存默认13G(可INT4量化)。DEMO项目中提供了对话，外部工具调用和代码解释器3种模式。

https://github.com/THUDM/ChatGLM3

CodeGeeX2 代码生成大模型支持多种编程语言支持vscode等多种常见IDE的插件上下文8K,量化后仅需6G显存

https://github.com/THUDM/CodeGeeX2

===

LLaMA系列使用公开数据集进行训练的代表,使用的数据集有Common Crawl、Wikipedia、OpenWebText2、RealNews、Books 。参数量7B-70B

(英文看着头疼)

https://github.com/facebookresearch/llama

通义千问阿里巴巴

#### 闭源

GPT系列 OpenAI - 应用：chatGPT

Claude系列 OpenAI离职人员极高的上下文 claude-1:100K/claude-2:200K

使用地址：https://claude.ai/chats

PaLM系列 Google - 应用：Bard

https://ai.google/discover/palm2/

文心一言百度

星火大模型 - 科大讯飞

### Langchain简介

产生于用api或者本地私有大模型构建应用的需求。是一个方便使用大模型的框架，其包含

* 模型输入/输出（Model I/O）：与语言模型交互的接口

* 数据连接（Data connection）：与特定应用程序的数据进行交互的接口

* 链（Chains）：将组件组合实现端到端应用。

* 记忆（Memory）：用于链的多次运行之间持久化应用程序状态；

* 代理（Agents）：扩展模型的推理能力。用于复杂的应用的调用序列；

* 回调（Callbacks）：扩展模型的推理能力。用于复杂的应用的调用序列；

https://github.com/langchain-ai/langchain

官方文档 https://python.langchain.com/docs/get_started/introduction

Karry12138 CSDN认证博客专家 CSDN认证企业博客

码龄3年

15: 原创

112万+: 周排名

12万+: 总排名

1万+: 访问

: 等级

302: 积分

95: 粉丝

129: 获赞

3: 评论

131: 收藏

私信

关注

热门文章

分类专栏

最新评论

Datawhale AI 夏令营 task01 关于deepfake 人脸合成识别攻防赛-cv
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
【点子】UML Helper 使用大模型辅助绘制UML图-Task06-dw动手学大模型应用开发
紫菜包饭1104: 密码是什么呀怎么登录呀博主
【点子】UML Helper 使用大模型辅助绘制UML图-Task06-dw动手学大模型应用开发
CSDN-Ada助手: 恭喜博主第10篇博客的问世，看来UML Helper对于绘制UML图确实有很大的帮助。不过我觉得下一步可以考虑分享一些实际应用案例，或者是在大模型辅助下的一些实际开发经验，这样能让读者更加深入地了解UML Helper的实际作用。希望博主能继续分享更多有价值的内容，加油！
Task05-【缺】验证迭代与前后端搭建-动手学大模型应用开发
CSDN-Ada助手: 恭喜你完成了第9篇博客！看到你在探索大模型应用开发的过程中遇到了一些挑战，但你仍然坚持不懈地学习和尝试，这种精神令人钦佩。希望你在接下来的创作中能够更多地分享你的实践经验和心得体会，这样可以帮助更多的人受益。也许你可以考虑添加一些案例分析或者实际操作的步骤，这样读者可以更好地理解你的学习过程。加油，期待你的下一篇作品！
Task03-大模型开发流程及架构-动手学习大模型应用开发
CSDN-Ada助手: 恭喜用户撰写了第8篇博客！标题中提到的大模型开发流程及架构是一个非常有价值的主题。您的博客内容对于正在学习大模型应用开发的读者来说一定是非常有益的。同时，您的持续创作也展现了您的勤奋与努力，值得赞赏。在下一步的创作中，我建议您可以尝试更深入地探讨大模型开发流程中的具体细节，例如数据处理、模型选择、训练和优化等方面。此外，您还可以结合实际案例或者应用场景，向读者展示如何解决实际问题。这样的创作方式将进一步提升您的博客质量，并为读者提供更实用的知识。再次恭喜您，并期待您在未来的创作中不断进步！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。

>