1.pycharm如何设置,使得注释可以输入中文
打开pycharm后,依次点击工具栏-> Help -> Edit Custom VM Options
在打开的pycharm64.vmoptions文件中添加一行:
-Drecreate.x11.input.method=true
重启pycharm后即可生效。
2.dataset类
定义数据加载器,使得模型训练时模型能源源不断地获取数据进行训练。对于Pytorch而言,数据记载主要需要用到Dataset和DataLoader这两个类。
Dataset是Pytorch中的一个数据读取类,它已经包含了很多常见的数据集,torchvision.datasets中包含了以下数据集MNIST,COCO(用于图像标注和目标检测)(Captioning and Detection),LSUN Classification,ImageFolder,Imagenet-12等。
我们可以直接使用这个Dataset类里面的数据集,示例如下:
dset.MNIST(root, train=True, transform=None, target_transform=None, download=False)
主要包含两个方法:
__getitem__()
__getitem__函数的作用是根据索引index遍历数据,一般返回image的Tensor形式和对应标注。当然也可以多返回一些其它信息,这个根据需求而定。
__len__()
__len__函数的作用是返回数据集的长度。
在我们训练自己的数据时,需要继承它,并需要重写__getitem__()和__len__()这两个方法。
3.