- 博客(3)
- 收藏
- 关注
原创 大模型时代必修课:如何针对 SSE 流式场景实施有效的压力测试?
但线上真正的考验,发生在高并发时,模型推理、检索/工具调用、网关与鉴权、队列与限流等环节的排队会叠加放大,导致首 token 变慢、输出节奏变差、甚至流式中断。对用户来说,这不是“慢一点”,而是“卡住了/坏了”,从而触发频繁重试与重复提问,进一步放大系统压力。大模型与 AI 应用正在加速落地:智能客服、AI 搜索、代码助手、内容生成、数据分析等场景,几乎都在追求“边算边回、即时可见”的交互体验。SSE 压测建议从“连接、首包、持续推送、关闭”四段来设计,并特别关注长连接带来的系统瓶颈。
2026-04-03 20:48:07
348
原创 Unity 应用动态化交付新思路:Shiply 插件化解决方案深度解析
随着3D资产精度提升、材质贴图增加,包体也越来越大,500MB 这种体量并不少见,但应用商店的数据又很现实:包体一旦超过 100MB,下载转化率就会明显下滑,超过 200MB 之后很多用户干脆就不下载了,这对游戏买量、电商App获客、或企业内部分发都是实质性损耗。)的重要成员,提供配置与开关发布、资源发布、RN热更新、Flutter动态化、Android插件化框架、热修复、应用内升级、市场发布、应用内测等服务,帮助业务快速、安全地进行客户端功能迭代和上线。的根本问题,而非仅限于脚本层的热更新。
2026-04-01 11:01:43
366
原创 搜狗输入法 Kuikly AI 工程化:Spec coding 的探索与落地
同时,这类高质量的 Context 不只是服务于需求当前,在后续模块迭代、修改、扩展时,它们也会成为稳定的“工作记忆”,帮助AI保持实现思路一致、减少偏航,并在多轮协作中持续输出更可靠的结果。但实际开发工作远不止于新页面开发,后续我们计划逐步将 AI 的能力延伸到更多场景——包括需求文档的自动解析与任务拆分、线上 BUG 的自动定位与修复、跨端工程与端侧工程联动等,在实践过程持续沉淀更多的 Skills和工具,将各项能力与研发流程深度编排集成,让 AI 在更多场景中发挥作用,逐步覆盖到最终的完整交付链路。
2026-03-30 15:02:27
576
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅