数据处理
师太,借个吻
这个作者很懒,什么都没留下…
展开
-
图像数据处理
首先图像数据初始为RGB三个通道,每个通道的数值都是[0,255]的灰度值首先transforms.ToTensor()方法可将数据处理成[0,1]之间在用transforms.Normalize()方法可将数据处理成[-1,1]之间的标准化数据(之所以要处理成标准化数据是为了防止某些数据过大而其余数据都很小时这个过大的数据会对模型带来很大的影响,但其实每个数据都需要对模型产生影响,所以要先标准化)在使用imagenet数据集时会看到transforms.Normalize([0.485, 0.原创 2021-09-02 17:46:39 · 654 阅读 · 0 评论 -
os.walk()方法读取图像集标签与路径到列表
import osdata_path = []data_name = []for root, dirs, files in os.walk('train'): # 变量指定目录文件列表 for image_file in files: image_path = os.path.join(root, image_file) data_path.append(image_path) data_name.append(image_file.原创 2021-09-02 16:52:40 · 324 阅读 · 0 评论 -
LabelEncoder()对特征进行硬编码
sklearn.preprocessing.LabelEncoder对标签进行标准化,将字符串标签转换成从 0 开始的数字类标签。另外,该方法还可以反转标签,即将数字处理成字符串。当然,你也可以自己写一个判断语句来将字符串标签数值化。该方法对特征进行硬编码不仅可以使用pandas的 factorize函数将文本特征进行编号,也可以使用sklearn 的LabelEncoder函数,两者的效果几乎是一样的。编码为0~n-1(n为种类数)data_name中为:dog,dog,cat,dog等列表...原创 2021-09-02 16:42:46 · 1095 阅读 · 0 评论 -
pytorch nn.Linear(x)中x的数据维度
当x为:torch.manual_seed(10) # 随机数种子x = torch.linspace(1, 10, 50) # 生成等间距张量y = 2 * x + 3 * torch.rand(50)print(x)输出:tensor([ 1.0000, 1.1837, 1.3673, 1.5510, 1.7347, 1.9184, 2.1020, 2.2857, 2.4694, 2.6531, 2.8367, 3.0204, 3.204原创 2021-08-28 11:48:15 · 739 阅读 · 0 评论