torchvision软件包包括流行的数据集、模型架构和用于计算机视觉的通用图像转换。
包参考
torchvision.datasets
Caltech
CelebA
CIFAR
Cityscapes
COCO
EMNIST
FakeData
Fashion-MNIST
Flickr
HMDB51
ImageNet
Kinetics-400
KITTI
KMNIST
LSUN
MNIST
Omniglot
PhotoTour
Places365
QMNIST
SBD
SBU
SEMEION
STL10
SVHN
UCF101
USPS
VOC
WIDERFace
Base classes for custom datasets
torchvision.io
Video
Fine-grained video API
Image
torchvision.models
Classification
Semantic Segmentation
Object Detection, Instance Segmentation and Person Keypoint Detection
Video classification
torchvision.ops
torchvision.transforms
Scriptable transforms
Compositions of transforms
Transforms on PIL Image and torch.*Tensor
Transforms on PIL Image only
Transforms on torch.*Tensor only
Conversion Transforms
Generic Transforms
AutoAugment Transforms
Functional Transforms
torchvision.utils
torchvision.get_image_backend()
获取用于加载图像的包的名称
torchvision.get_video_backend()
返回用于解码视频的当前活动视频后端。 Returns 视频后端的名称。其中一个{‘pyav’,‘video_reader’}。
Return type
str
torchvision.set_image_backend(backend)
指定用于加载图像的包。
Parameters
后端(字符串)–映像后端的名称。{‘PIL’,‘accimage’}中的一个。accimage软件包使用“英特尔IPP”库。它通常比PIL更快,但不支持如此多的操作。
torchvision.set_video_backend(backend)
指定用于解码视频的包。
Parameters
后端(字符串)–视频后端的名称。其中一个{‘pyav’,‘video_reader’}。pyav软件包使用第三方pyav库。它是FFmpeg库的Python绑定。VIEWORKRADIOR包包括FFMPEG库顶部的本地C++实现,以及TooScript自定义操作符的Python API。它的解码速度通常比pyav快,但可能不太鲁棒。
更多计算机视觉与图形学相关资料,请关注微信公众号:计算机视觉与图形学实战