- 博客(17)
- 收藏
- 关注
原创 deep research|从搜索引擎到搜索助手的实践(一)
这篇文章介绍了如何基于HuggingFace团队开源的DeepResearch实现方案进行本地化改造,构建一个网页内容搜索总结助手。
2025-08-03 14:11:48
1121
原创 mcp协议|从0构建第一个mcp server
本文介绍了如何通过MCP协议将大模型与外部工具解耦,实现工具、prompt以及resource调用的标准化流程。MCP协议由Anthropic公司提出,给出了工具、提示词和资源相对于具有ai驱动的host的统一抽象方式。
2025-07-24 11:08:39
1086
原创 deepseek模型技术解读|混合专家模型MoE与负载均衡
DeepSeek-R1大语言模型采用混合专家(MoE)架构替代传统稠密模型中的FFN层,MoE通过Router层动态选择每个token的Top8专家进行加权计算,同时引入共享专家确保基础能力。为解决负载均衡问题,DeepSeek创新性地采用动态偏置调整机制,实现自适应的负载均衡。
2025-07-08 22:53:04
965
1
原创 模型结构|解读transformer模型中三种attention和mask(一)
解读transformer模型中encoder和decoder的self-attention的区别
2024-12-19 22:46:58
2667
原创 搜推广|elasticsearch 8.x 如何安装Hanlp插件
实现从源码打包出可以适配elasticsearch8.X版本的hanlp插件。
2024-11-12 17:28:43
1278
原创 介绍llama2|理解group query attention(GQA)
多角度分析llama模型的group query attention
2024-09-29 00:00:25
2301
原创 概念|如何根据大模型api服务定价推测云厂商让利程度?
本文从计算量、存储以及gpu的特性解释了为什么模型推理的每个token的价格要比prompt中每个token的价格更贵
2024-09-11 00:19:32
1127
原创 关于大模型落地的二三事
其中以固定的知识微调行业大模型为基础,在不同场景下,已有积累的问答对直接检索,需要动态更新的非结构化数据打向量数据库+rag的组合拳,针对各种数据库、结构化数据做text2sql、text2code,针对api用自然语言调api,如果还想更智能就用大模型当决策大脑把这些与能与外部交互的工具组成agent,这下智能客服、智慧XX可以先吹一波,最后为行业赋能吸引企业长期付费(少不了后续的持续优化)。当然以上无论是增量预训练、微调、偏好对齐还是rag工程优化都是有多少人工才有多少智能,高质量的数据才是核心资产。
2024-07-24 22:33:08
312
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅