RAG项目第一集：大模型的本地加载和提供API接口

最新推荐文章于 2024-08-26 14:58:25 发布

AAI机器之心

最新推荐文章于 2024-08-26 14:58:25 发布

阅读量855

点赞数 4

文章标签：人工智能大模型应用产品经理 LLM langchain

本文链接：https://blog.csdn.net/AAI666666/article/details/139126650

版权

js
复制代码
$conda create -n fastchat python=3.11

系统运行后，选择y安装相关的包依赖。提示成功创建fastchat环境内后，运行命令，

js
复制代码
$conda activate fastchat

激活虚拟坏境

js
复制代码
pip3 install fschat[model_worker,webui]

js
复制代码
python3 -m fastchat.serve.controller` #启动控制器

重新激活一个fastchat环境，运行命令

js
复制代码
python3 -m fastchat.serve.model_worker --load-8bit --model-name 模型名称--model-path /模型本地位置/ #启动模型服务

（如果显存大，可不用8bit启动，模型推理效果更好）重新激活一个fastchat环境，运行命令

js
复制代码
python3 -m fastchat.serve.openai_api_server --host 0.0.0.0 --port 8000     #开启对外API服务，端口是8000

注意：以上3个命令要开启3个命令窗口，激活3遍虚拟环境，要保持3个窗口同时运行。

最后可以通过

js
复制代码
curl http://localhost:8000/v1/models

检查API接口是否可用，如有返回值，说明接口可用。

这个项目代码我已经开源到GitHub上了，可以点这个链接，直接下载整个项目代码： github.com/davidhandso…

以上，大模型的本地加载和提供API接口已经完成了，接下来就是embedding 数据库了，请看RAG项目第二集：知识图谱embeddings向量数据库。

作为一名热心肠的互联网老兵，我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。

但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的 AI大模型资料 包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

😝有需要的小伙伴，可以V扫描下方二维码免费领取🆓

在这里插入图片描述

AI大模型时代的学习之旅：从基础到前沿，掌握人工智能的核心技能！

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。

在这里插入图片描述