1. TorchVision简介
TorchVision是PyTorch项目的一部分。
PyTorch是一个开源的机器学习框架。
本文档中描述的功能按发布状态分类。
- 稳定的。这些功能将被长期维护,一般不会有重大的性能限制或文档空白。我们还希望保持向后的兼容性(尽管可能会发生突破性的变化,但我们会提前一个版本通知)。
- 测试版。功能被标记为Beta,是因为API可能会根据用户的反馈而改变,因为性能需要改进,或者因为对运营商的覆盖还没有完成。对于Beta版的功能,我们承诺会将该功能的稳定性分类为稳定版。然而,我们并不承诺向后兼容。
- 原型(Prototype)。这些功能通常不能作为PyPI或Conda等二进制发行版的一部分,除了有时在运行时标志后面,并且处于反馈和测试的早期阶段。
torchvision软件包包括:
- 流行的数据集
- 模型架构
- 计算机视觉的常见图像转换。
2. 官方实现的包
2.1 变换/增强图片 (Transforming and augmenting images)
- 脚本化的转换 —— Scriptable transforms
- 变换的组合 —— Compositions of transforms
- 对PIL图像和Torch.*Tensor的变换 —— Transforms on PIL Image and torch.*Tensor
- 只对PIL图像进行转换 —— Transforms on PIL Image only
- 只在Torch.*Tensor上进行变换 —— Transforms on torch.*Tensor only
- 转换变换 —— Conversion Transforms
- 通用的变换 —— Generic Transforms
- 自动扩增变换 —— Automatic Augmentation Transforms
- 功能转换 —— Functional Transforms
2.2 模型文件以及预训练权重 (Models and pre-trained weights)
- 分类网络 —— Classification
- 语义分割 —— Semantic Segmentation
- 目标检测 —— Object Detection
- 实例分割 —— Instance Segmentation
- 人的关键点检测 —— Person Keypoint Detection
- 视频分类 —— Video classification
- 光流 —— Optical flow
2.3 数据集 (Datasets)
- 内置数据集 —— Built-in datasets
- 自定义数据集的基类 —— Base classes for custom datasets
2.4 工具 (Utils)
- 绘制Bounding Box —— draw_bounding_boxes
- 绘制分割mask —— draw_segmentation_masks
- 绘制关键点 ——draw_keypoints
- 光流转为图片 —— flow_to_image
- 制作grid —— make_grid
- 保存图片 —— save_image
2.5 算子 (Operators)
- 批量NMS —— batched_nms
- 计算box面积 —— box_area
- box坐标转换 —— box_convert
- box IoU计算 —— box_iou
- 将box裁剪为图片 —— clip_boxes_to_image
- 可形变的二维卷积 —— deform_conv2d
- GIoU计算 —— generalized_box_iou
- GIoU Loss的计算 —— generalized_box_iou_loss
- 蒙版->box —— masks_to_boxes
- NMS —— nms
- ps_roi_align
- ps_roi_pool
- remove_small_boxes
- roi_align
- roi_pool
- sigmoid_focal_loss
- stochastic_depth
- RoIAlign
- PSRoIAlign
- RoIPool
- PSRoIPool
- DeformConv2d
- MultiScaleRoIAlign
- FPN网络 —— FeaturePyramidNetwork
- StochasticDepth
- FrozenBatchNorm2d
- SE注意力机制 —— SqueezeExcitation
2.6 读/写图片或视频 (Reading/Writing images and videos)
- 读/写视频 —— Video
- 细粒度的视频API —— Fine-grained video API
- 图片 —— Image
2.7 用于模型检查的特征提取 (Feature extraction for model inspection)
- API Reference
3. 实例和训练参考 (Examples and training references)
- 示例画廊 —— Example gallery
- 训练参考 —— Training references