智能体
文章平均质量分 93
丁学文武
打球、跑步、徒步、露营️、骑行、滑雪️、游泳、冲浪
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
大模型推理优化Prefill 和 Decoding 分离原理详解
大模型推理优化:Prefill/Decoding分离原理详解 摘要:大模型生成文本过程分为Prefill(预填充)和Decoding(解码)两个阶段。Prefill阶段一次性处理输入提示,生成KV Cache,计算复杂度O(n²),属于计算密集型;Decoding阶段利用KV Cache逐步生成输出,计算复杂度O(1),属于内存密集型。传统混合执行方式存在资源错配问题。Prefill/Decoding分离架构将两个阶段拆分到不同硬件资源池,实现空间解耦和时间重叠,提升吞吐、降低延迟并优化成本。主流模型如Ll原创 2025-08-22 08:00:00 · 2061 阅读 · 0 评论 -
大模型算法工程师-最新各大厂关键核心技能汇总,学习技术、路线、规划
本文总结了多家知名企业(小米、百度、华为、荣耀、京东等)的大模型相关岗位需求。主要职责包括大模型训练优化(SFT/RLHF/RAG)、多模态技术研发、智能体(Agent)应用开发,以及结合业务场景的AI解决方案落地。要求候选人具备深度学习/NLP背景,熟悉PyTorch等框架,有顶级会议论文或竞赛经历者优先。岗位聚焦大模型在搜索、金融、医疗等领域的创新应用,强调工程落地与前沿技术探索能力。原创 2025-06-23 10:46:59 · 2445 阅读 · 0 评论 -
Suna本地部署详细教程
摘要:本文详细介绍了Suna开源AI助手的安装与配置流程。首先需创建Python虚拟环境并安装依赖,然后分别配置后端(包括Tavily搜索、Firecrawl爬虫、Daytona沙盒和Supabase数据库API)和前端(推荐使用DeepSeek模型)。完成配置后,需通过Docker启动Redis,并分别运行后端API服务和前端应用。Suna是一个全能型AI助手,支持自然语言处理复杂任务,包括网络搜索、数据爬取、文件管理、代码执行等功能,适用于市场分析、招聘辅助、行程规划等多种场景。(149字)原创 2025-06-19 13:19:14 · 2539 阅读 · 0 评论
分享