如何实现大模型流式请求+打字机效果

大模型场景实战培训,提示词效果调优,大模型应用定制开发,点击咨询
咨询热线:400-920-8999转2

前言

大模型推理是一个消耗大量计算资源,耗时较长的一个过程,在实际业务中让大模型写一篇小作文,经常要十几秒。为了降低终端用户体感等待的时长,大家都会开启流式,让大模型生成一部分内容后,就展示出来,从而提升客户的体验。

想必大家也体验过各种各样的大模型对话应用,界面中大模型生成的内容都是一个字一个字往外蹦,效果就像"打字机"一样。这篇文章就是教会大家,如何快速实现这样一个"打字机"效果,不光可以体验实际效果,还附送前后端示例代码。

体验效果流程

第一步:点击流式示例入口,等待自动加载应用鉴权信息

第二步:默认填充了提示词(可自行选择是否编辑),点击大模型输出效果展示
在这里插入图片描述

架构解析

Image 2: a screen shot of a chinese website

出于安全考虑,百度智能云的鉴权接口不支持跨域,所以必须通过后端获取鉴权用的access_token。

前端把prompt传给服务端后,服务端获取鉴权,再请求大模型接口(携带开启流式参数)。服务端收到大模型一段一段返回的结果后,经过简单格式化处理后再一段一段的返回给前端,最终前端将结果放入队列,按指定的速度往外吐,实现"打字机"的效果。

前端:

html+javascript,前端基于服务端返回的流式数据,模拟打字机效果。

服务端:

支持多种语言(python,java,go,C#,php,nodejs)

各环境介绍

  • python:基于fastapi发布路由,使用uvicorn创建HTTP服务

  • java:maven管理依赖,使用HttpServer创建HTTP服务

  • C#:利用HttpListener创建HTTP服务

Image 3: a screen shot of a chinese website with chinese text

  • 5
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值