- 博客(182)
- 收藏
- 关注
原创 为什么选择LangChain?LangChain的价值是什么?
文章描述了LangChain的价值,为什么开发者要选择LangChain作为AI大模型应用开发的框架
2025-05-29 09:00:00
1703
原创 《DAIL-SQL》论文精读:2025年在Spider的SOTA方法(Text-to-SQL任务)
文章讲解了LLMs如何系统应用到Text-to-SQL任务当中
2025-05-21 09:15:00
800
原创 《Opensearch-SQL》论文精读:2025年在BIRD的SOTA方法(Text-to-SQL任务)
本文详细介绍了OpenSearch-SQL的实现方法
2025-05-19 19:00:00
1038
原创 一文详解解读timm的使用方法,从新手变老手
`timm` 是由 Ross Wightman 创建的一个深度学习库,包含了一系列当下最先进(SOTA)的计算机视觉模型、层、工具、优化器、调度器、数据加载器、增强方法,以及用于复现 ImageNet 训练结果的训练/验证脚本。
2025-04-08 07:00:00
913
原创 一文详解PyTorch分布式训练中数据并行DDP的原理和代码实现
torch.nn.parallel.DistributedDataParallel (DDP) 透明地执行分布式数据并行训练。本页描述了其工作原理并揭示了实现细节。
2025-04-03 07:00:00
1041
原创 1天入门一项新技术的道路:用拆分问题的方法使用DeepSeek平替DeepResearch进行信息搜索
本文演示如何使用DeepSeek快速了解一个陌生的领域技术,给读者提供一种思考方式和写提示词的方法,通过这种思考方式和提示词,可以快速得到类似于Deep Research的效果,快速搜索到自己想要的信息。
2025-03-24 07:00:00
712
原创 SpaCy官方中文教程:一文详解SpaCy的所有功能
文章完整地讲解了使用spaCy进行自然语言处理的功能,包括词性标注、词缀形态、词性还原、句法依赖解析器、命名实体抽取等等
2025-03-18 07:00:00
788
1
原创 详解大模型推理:从基础知识讲起
本文介绍了大型语言模型推理的各个方面。它首先解释了推理的基本概念,如预填充和解码阶段、在线和离线推理、基础(Grounding)等。然后详细讨论了推理性能的关键指标,包括延迟、吞吐量、第一个Token的时间(TTFT)和每个输出Token的时间(TPOT)。后面还深入探讨了模型内存使用情况,特别是KV Cache的重要性和计算方法。
2025-03-14 07:00:00
1812
原创 vLLM官方中文教程:使用vLLM的两种方式(离线推理和vllm server)
本文介绍了使用vllm推理框架的两种方式,离线推理和vllm server
2025-03-10 07:00:00
7874
原创 【干货】DeepSeek-V3和DeepSeek-R1官方中文部署文档(附详细资料和原文链接)
本文对DeepSeek官方英文部署文档进行手动中文翻译,并附上详细资料和原文链接
2025-03-03 07:00:00
2680
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人