PyTorch
文章平均质量分 92
PyTorch
csdddn
技术搬运工
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
PyTorch 2.9 最终候选版现已发布
PyTorch 2.9.0 最终候选版本(RC)已发布,用户可通过pytorch-test频道下载测试。该版本包含CPU、CUDA(12.6/12.8/13.0)、ROCM(6.3/6.4)和XPU等多个平台支持,并提供了详细的pip和Libtorch安装指令。关键时间节点包括10月8日教程草稿提交截止、10月10日外部内容定稿,以及10月15日正式发布。开发团队鼓励用户提交功能特性以纳入发布说明。原创 2025-10-08 00:33:56 · 1780 阅读 · 0 评论 -
PyTorch 2.8.0 发布说明
原文地址:https://github.com/pytorch/pytorch/releases/tag/v2.8.0亮点向后不兼容的更改弃用新功能改进错误修正性能文档开发者不稳定特性更多亮点特性详见 release blogpost。以下为本次发布的完整更新说明。由于 CUDA 12.9.1 引入的 bug,我们无法完成该版本下 Windows wheel 的完整构建,因为编译 时会导致构建崩溃。为规避此问题,我们提供的 wheel中未包含 。如需该功能,请使用其他版本。由于二进制原创 2025-10-07 00:01:18 · 1719 阅读 · 0 评论 -
PyTorch 2.7.0 发布说明
PyTorch 2.7.0 发布摘要 PyTorch 2.7.0带来多项重大更新,包括对NVIDIA Blackwell架构的原生支持、Context并行API、Intel GPU性能优化等。主要亮点包括:Torch.Compile支持Torch Function模式、Mega Cache功能、FlexAttention推理支持等。该版本同时移除了对Triton<2.2.0的支持,并变更了多项API行为,建议开发者注意兼容性调整。 新特性涵盖分布式训练、CUDA、MPS、ROCm等多个领域,包括: 新原创 2025-10-08 00:34:24 · 1152 阅读 · 0 评论 -
PyTorch 2.8 发布博客
PyTorch 2.8版本发布,带来多项重要更新:1)引入有限稳定版libtorch ABI,支持第三方C++/CUDA扩展兼容性;2)新增英特尔CPU上的高性能量化LLM推理功能;3)实验性Wheel变体机制,实现硬件适配的包管理;4)强化ROCm 7支持,优化矩阵运算性能;5)新增控制流操作符库,支持模型编译与导出。此外还包含Inductor CUTLASS后端优化、CUDA图划分等性能改进,以及SYCL/XCCL对英特尔GPU的支持。该版本共包含4164次提交,来自585位贡献者,持续推动PyTorc原创 2025-10-08 00:34:12 · 1094 阅读 · 0 评论
分享