利用api方式部署通义千问-14b模型时无法流式输出的问题求助

S_erendipit_y_

已于 2024-05-17 12:22:32 修改

阅读量193

点赞数 2

文章标签： fastapi 人工智能语言模型 chatgpt

于 2024-05-17 12:21:31 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/S_erendipit_y_/article/details/139001458

版权

问题描述：我想通过自己的后端向服务器发送请求，服务器上跑通义千问-14b的int4模型，通过官方github上的OpenAI API格式的本地API部署方法进行部署。

关键代码如下：

predict代码如下：

本地通过以下代码来使用api

我期望的是后端可以分段的接收到服务器的回答，但是实际运行并不是这样，虽然回答被分段，但是所有的回答几乎同一时间抵达后端，我对服务器和后端都进行了调试，只发现服务器的yield这里确实是流式输出的，其他地方都没发现问题。

如果您也遇到了这方面的问题并且有解决问题的思路，请您加我的联系方式qq:1764704854，希望前辈们不吝赐教。我对问题如果有描述不清楚的地方，也请加我的联系方式我可以进一步讨论

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
利用api方式部署通义千问-14b模型时无法流式输出的问题求助

我期望的是后端可以分段的接收到服务器的回答，但是实际运行并不是这样，虽然回答被分段，但是所有的回答几乎同一时间抵达后端，我对服务器和后端都进行了调试，只发现服务器的yield这里确实是流式输出的，其他地方都没发现问题。如果您也遇到了这方面的问题并且有解决问题的思路，请您加我的联系方式qq:1764704854，希望前辈们不吝赐教。##问题描述：我想通过自己的后端向服务器发送请求，服务器上跑通义千问-14b的int4模型，通过官方github上的OpenAI API格式的本地API部署方法进行部署。
复制链接

扫一扫

S_erendipit_y_ CSDN认证博客专家 CSDN认证企业博客

码龄2年

13: 原创

114万+: 周排名

10万+: 总排名

2775: 访问

: 等级

176: 积分

36: 粉丝

45: 获赞

1: 评论

16: 收藏

私信

关注

热门文章

最新评论

2024创新实训01
CSDN-Ada助手: 非常棒的博文！很高兴看到你们小组已经开始对项目进行深入的讨论和探索。前端设计是非常重要的一环，可以直接影响用户体验，加油！除了数据库和后端接口的设计，你们也可以考虑一些与人工智能相关的技术，比如深度学习、神经网络等，这些技能在大数据处理和模型应用中也非常有用。继续保持热情和努力，期待看到更多关于项目进展的分享！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。