自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 大模型评估指标详解:科学衡量模型能力

分类任务:准确率、F1 分数生成任务代码生成:pass@k、编译成功率数学推理:数值准确率单一指标不足以全面评估需要在多个数据集上测试人类评估仍然不可或缺注意指标的局限性。

2026-05-17 23:53:27 16

原创 RAG 系统构建实战:从零到生产级别的检索增强生成

数据处理:文档解析要全,分块策略要合理检索优化:选择合适的 Embedding 模型,必要时使用重排序上下文组装:合理控制长度,保留关键信息生成质量:设计好的 prompt,进行输出验证持续迭代:根据实际效果不断调整优化RAG 不是一次性就能做好的系统,需要在实践中不断优化。希望这篇分享对大家有帮助。

2026-05-17 23:51:07 32

原创 多模态 RAG 系统构建:图文检索增强生成

图文 Embedding:使用 CLIP 模型处理图片和文本多模态数据库:统一存储和检索不同类型的内容智能查询:能够根据文本问题找到相关的图片和文档使用 CLIP 进行跨模态检索统一的向量表示便于混合检索需要考虑不同模态的特性上下文构建需要适当处理不同类型的内容。

2026-05-16 16:49:24 20 1

原创 AI Agent 架构设计与实现:构建能自主行动的智能体

简单来说,AI Agent 是一个能够感知环境、做出决策并执行动作的系统。与传统程序不同,Agent 的行为不是完全预设的,而是由大模型根据当前状态动态生成。规划(Planning):将复杂任务分解为可执行的步骤记忆(Memory):存储和检索历史信息工具(Tools):调用外部系统完成任务的能力行动(Action):执行具体动作并观察结果构建一个可靠的 AI Agent 是一个复杂的系统工程,需要考虑规划、记忆、工具调用、自我纠正等多个方面。工具设计要清晰:每个工具的职责要单一,接口要明确。

2026-05-16 16:45:56 336

原创 大模型 API 设计模式:构建稳定可靠的接口

RESTful 风格:清晰的接口设计异步支持:提高并发能力流式响应:提升用户体验错误处理:完善的错误机制安全措施:认证、限流监控日志:便于运维使用 Pydantic 进行数据验证提供详细的错误信息支持异步和流式处理实现请求限流保护。

2026-05-15 20:10:49 37

原创 Prompt Engineering 进阶技巧:解锁大模型的全部潜力

❌ 不好:你是 Python 程序员✅ 更好:你是一位拥有 15 年经验的高级 Python 工程师,曾在 Google 工作多年。你对 Python 的最佳实践、性能优化和代码可读性有深刻理解。你倾向于使用类型提示、装饰器和上下文管理器来编写优雅的代码。你的代码风格遵循 PEP 8,但更注重实际项目中的可维护性。

2026-05-15 20:07:20 139

原创 LangChain 实战入门:构建 AI 应用的瑞士军刀

"""自定义链"""@property@property# 处理逻辑"""实际处理逻辑"""return f"处理后的结果: {text.upper()}"Chains:串联组件构建复杂逻辑Agents:让模型自主决策和调用工具Memory:保持对话上下文RAG:结合外部知识库从简单的 Chain 开始利用 Memory 保持对话连续性RAG 需要高质量的知识库缓存可以显著降低成本。

2026-05-14 13:56:13 22

原创 向量数据库与 Embedding 技术实战:从理论到 RAG 应用

Embedding 是将离散的高维数据(如文字、图片)映射到连续的低维向量空间的技术。"苹果" → [0.123, -0.456, 0.789, ...]"香蕉" → [0.134, -0.441, 0.802, ...]"汽车" → [0.892, 0.234, -0.123, ...]在这个例子中,"苹果"和"香蕉"的向量距离明显比"苹果"和"汽车"近,这正是因为水果之间的语义相似度更高。向量数据库和 Embedding 技术是现代 AI 应用的基础设施。

2026-05-14 13:52:43 345

原创 大模型部署最佳实践:从本地到云端

环境选择:本地测试 vs 云端服务容器化性能优化:预热、连接池监控:指标收集、日志记录安全:认证、限流根据场景选择合适的部署方式容器化是生产环境的标准做法完善的监控系统是运维的关键安全措施必不可少。

2026-05-13 23:30:35 176

原创 LLM 推理优化技术深度解析:让大模型跑得更快、更省

LLM 推理优化是一个系统工程,需要综合考虑延迟、成本、精度等多个因素。先 profiling 再优化- 用工具找出真正的瓶颈从简单方法开始- 优先尝试量化,而不是一开始就改架构保持精度监控- 任何优化都要验证对输出质量的影响根据场景选择- 在线服务追求低延迟,离线任务追求高吞吐希望这篇深度解析对大家有帮助。如果有具体项目中的优化问题,欢迎在评论区交流。

2026-05-13 23:29:06 478

原创 Llama 3 模型实战指南:从安装到部署

模型参数上下文窗口特点Llama 3 8B80亿8K适合消费级GPU700亿8K需要专业级GPU性能强:8B 模型已经能满足大多数需求易部署:支持多种量化和部署方式可微调:使用 LoRA 可以轻松适配特定领域消费级 GPU 用 8B 模型专业级 GPU 可尝试 70B 模型量化是生产部署的必备步骤vLLM 能大幅提升推理性能。

2026-05-12 22:20:42 1048

原创 HuggingFace 生态实战完全指南:模型、数据集与最佳实践

HuggingFace 生态已经相当成熟,提供了从研究到生产所需的全部工具。掌握这个生态系统的核心组件——Transformers、Datasets、Tokenizers、PEFT——是每个 AI 开发者都应该具备的能力。在实践中,我建议大家多阅读 HuggingFace 官方文档和示例代码,关注最新的更新和最佳实践。HuggingFace 的社区非常活跃,新的工具和方法层出不穷。

2026-05-12 22:18:24 1598

原创 大模型训练框架对比:PyTorch vs JAX vs TensorFlow

项目阶段:研究用 JAX,生产用 PyTorch/TensorFlow硬件环境:TPU 优先考虑 JAX/TensorFlow团队熟悉度:选择团队熟悉的框架生态需求:看所需库的支持情况PyTorch 是当前研究的主流选择JAX 在数学优化方面更强大TensorFlow 在生产部署上更成熟根据项目需求选择合适的框架。

2026-05-11 15:06:23 1486

原创 大模型技术原理与架构演进:从 Transformer 到 GPT 时代

大模型技术正在快速演进,理解其背后的原理对于开发者来说越来越重要。从 Transformer 到 RLHF,从预训练到量化优化,每一个环节都有大量值得深入研究的内容。作为开发者,我们不需要成为 AI 科学家,但需要理解这些技术的核心原理和应用方式。只有这样,才能在 AI 时代构建出真正有价值的产品。后续我会继续分享 HuggingFace 生态、大模型微调、RAG 系统等话题,欢迎大家一起交流学习。

2026-05-11 15:04:23 1967 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除