TorchVision介绍

1. TorchVision简介

TorchVision是PyTorch项目的一部分。

PyTorch是一个开源的机器学习框架。

本文档中描述的功能按发布状态分类。

  • 稳定的。这些功能将被长期维护,一般不会有重大的性能限制或文档空白。我们还希望保持向后的兼容性(尽管可能会发生突破性的变化,但我们会提前一个版本通知)。
  • 测试版。功能被标记为Beta,是因为API可能会根据用户的反馈而改变,因为性能需要改进,或者因为对运营商的覆盖还没有完成。对于Beta版的功能,我们承诺会将该功能的稳定性分类为稳定版。然而,我们并不承诺向后兼容。
  • 原型(Prototype)。这些功能通常不能作为PyPI或Conda等二进制发行版的一部分,除了有时在运行时标志后面,并且处于反馈和测试的早期阶段。

torchvision软件包包括:

  1. 流行的数据集
  2. 模型架构
  3. 计算机视觉的常见图像转换。

2. 官方实现的包

2.1 变换/增强图片 (Transforming and augmenting images)

  • 脚本化的转换 —— Scriptable transforms
  • 变换的组合 —— Compositions of transforms
  • 对PIL图像和Torch.*Tensor的变换 —— Transforms on PIL Image and torch.*Tensor
  • 只对PIL图像进行转换 —— Transforms on PIL Image only
  • 只在Torch.*Tensor上进行变换 —— Transforms on torch.*Tensor only
  • 转换变换 —— Conversion Transforms
  • 通用的变换 —— Generic Transforms
  • 自动扩增变换 —— Automatic Augmentation Transforms
  • 功能转换 —— Functional Transforms

2.2 模型文件以及预训练权重 (Models and pre-trained weights)

  • 分类网络 —— Classification
  • 语义分割 —— Semantic Segmentation
  • 目标检测 —— Object Detection
  • 实例分割 —— Instance Segmentation
  • 人的关键点检测 —— Person Keypoint Detection
  • 视频分类 —— Video classification
  • 光流 —— Optical flow

2.3 数据集 (Datasets)

  • 内置数据集 —— Built-in datasets
  • 自定义数据集的基类 —— Base classes for custom datasets

2.4 工具 (Utils)

  • 绘制Bounding Box —— draw_bounding_boxes
  • 绘制分割mask —— draw_segmentation_masks
  • 绘制关键点 ——draw_keypoints
  • 光流转为图片 —— flow_to_image
  • 制作grid —— make_grid
  • 保存图片 —— save_image

2.5 算子 (Operators)

  • 批量NMS —— batched_nms
  • 计算box面积 —— box_area
  • box坐标转换 —— box_convert
  • box IoU计算 —— box_iou
  • 将box裁剪为图片 —— clip_boxes_to_image
  • 可形变的二维卷积 —— deform_conv2d
  • GIoU计算 —— generalized_box_iou
  • GIoU Loss的计算 —— generalized_box_iou_loss
  • 蒙版->box —— masks_to_boxes
  • NMS —— nms
  • ps_roi_align
  • ps_roi_pool
  • remove_small_boxes
  • roi_align
  • roi_pool
  • sigmoid_focal_loss
  • stochastic_depth
  • RoIAlign
  • PSRoIAlign
  • RoIPool
  • PSRoIPool
  • DeformConv2d
  • MultiScaleRoIAlign
  • FPN网络 —— FeaturePyramidNetwork
  • StochasticDepth
  • FrozenBatchNorm2d
  • SE注意力机制 —— SqueezeExcitation

2.6 读/写图片或视频 (Reading/Writing images and videos)

  • 读/写视频 —— Video
  • 细粒度的视频API —— Fine-grained video API
  • 图片 —— Image

2.7 用于模型检查的特征提取 (Feature extraction for model inspection)

  • API Reference

3. 实例和训练参考 (Examples and training references)

  • 示例画廊 —— Example gallery
  • 训练参考 —— Training references


链接:https://pytorch.org/vision/stable/index.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值