大模型实战营Day5 作业

流浪德意志

已于 2024-01-14 20:37:11 修改

阅读量487

点赞数 7

分类专栏： LLM 文章标签：人工智能 InternLM 大模型 langchain 深度学习

于 2024-01-14 20:35:58 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/li4692625/article/details/135587651

版权

LLM 专栏收录该内容

12 篇文章 0 订阅

订阅专栏

本文介绍了如何通过LMDeploy将InternLM-Chat-7B模型部署在本地对话、网页Gradio以及API服务中。此外，还探讨了进阶作业，即如何使用量化技术将其部署到OpenXLab，并对比不同量化策略对模型性能和内存的影响。

摘要由CSDN通过智能技术生成

基础作业：

使用 LMDeploy 以本地对话、网页Gradio、API服务中的一种方式部署 InternLM-Chat-7B 模型，生成 300 字的小故事（需截图）

TurboMind 推理+命令行本地对话

lmdeploy chat turbomind /share/temp/model_repos/internlm-chat-7b/  --model-name internlm-chat-7b

TurboMind推理+API服务

网页 Demo 演示

一个终端

lmdeploy serve api_server ./workspace \
> --server_name 0.0.0.0 \
> --server_port 23333 \
> --instance_num 64 \
> --tp 1

另一个终端

lmdeploy serve gradio http://0.0.0.0:23333 \
> --server_name 0.0.0.0 \
> --server_port 6006 \
> --restful_api True

进阶作业（可选做）

将第四节课训练自我认知小助手模型使用 LMDeploy 量化部署到 OpenXLab 平台。
对internlm-chat-7b模型进行量化，并同时使用KV Cache量化，使用量化后的模型完成API服务的部署，分别对比模型量化前后和 KV Cache 量化前后的显存大小（将 bs设置为 1 和 max len 设置为512）。
在自己的任务数据集上任取若干条进行Benchmark测试，测试方向包括：
（1）TurboMind推理+Python代码集成
（2）在（1）的基础上采用W4A16量化
（3）在（1）的基础上开启KV Cache量化
（4）在（2）的基础上开启KV Cache量化
（5）使用Huggingface推理

流浪德意志

关注

7
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
大模型实战营Day5 作业

【代码】大模型实战营Day5 作业。
复制链接

扫一扫

专栏目录

流浪德意志 CSDN认证博客专家 CSDN认证企业博客

码龄16年

171: 原创

5万+: 周排名

4万+: 总排名

26万+: 访问

: 等级

2424: 积分

169: 粉丝

259: 获赞

94: 评论

669: 收藏

私信

关注

热门文章

分类专栏

SLAM算法 7篇
数据处理 5篇
C++基础 21篇
Ubuntu和git（WSL） 35篇
LLM 12篇
深度视觉目标检测 15篇
ROS学习 16篇
Deep Learning 4篇
视觉目标跟踪 1篇
LiDAR目标检测 19篇
cartographer 1篇
opencl 1篇
Python 37篇
LeetCode 14篇
Navigation 4篇
Apollo 1篇
Qt 6篇
gazebo ros 10篇
STAGE ROS 7篇
Computer Vision 10篇

最新评论

ROS STAGE教程2（地图定义和GMAPPING建图）
Ryan Cai: ubuntu@VM9063-ccrrkk:~/catkin_ws/src/stage_controllers/world$ rosrun stage_ros stageros test.world [Loading test.world][Include map.inc][Image "/home/ubuntu/catkin_ws/src/stage_controllers/bitmaps/autolab.png"] [ INFO] [1717169438.721564941]: Subscribed to Stage position model "roomba" [ INFO] [1717169438.722379547]: subscribed to Stage ranger "roomba.ranger:0" [ INFO] [1717169438.722396563]: Robot roomba provided 1 rangers and 0 cameras 段错误想问下我一运行就闪退，然后报段错误是为什么啊
ROS下创建RATSLAM并编译教程
lplplppi: 没有数据集吗
Autoware Docker安装和仿真
捕风抓影: 大神应该怎么再次启动autoware，我执行sudo docker run -it autoware/autoware:latest-melodic-cuda后执行roslaunch runtime_manager runtime_manager.launch 终端就报错日志错误了。在容器里面执行ls /dev/ | grep 'nvidia'发现没有nvidia的依赖项了。
经典算法题：大数乘法之乘法累加算法 Karatsuba算法（远远超出long long范围）
四级考试快发快发打开: 语言标准需要c++11
大模型实战营Day4 作业
白话机器学习: 博主的文章细节很到位，兼顾实用性和可操作性，感谢博主的分享，期待博主持续带来更多好文。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。