CS321N笔记（1）

weixin_45958102

于 2019-12-02 16:17:55 发布

阅读量244

点赞数

本文链接：https://blog.csdn.net/weixin_45958102/article/details/103347884

版权

1. 图像分类数据和label分别是什么，图像分类存在的问题与挑战

1）数据是输入的图片，label是图片的类别标签
2）图像分类需要大量的计算空间和时间，视觉角度的变化、光照变化、形态变化都可能导致图像的数据结构产生变化，然而图像的类别却是不变的，这是一个难点。背景的变化也是一个问题。即使是同一类物体见也有差异。找到一个可以同时处理这些问题的算法是很难的。

2. 使用python加载一张彩色图片，观察像素值

代码如下：

from PIL import Image
import torch
from torchvision import transforms
import numpy as np
import matplotlib.pyplot as plt

img_path = '/data/Images/1/8b9389c57c1eca099dc87931de0ff63752e4c0915c5bb81a2e4f70ad.jpg'

image = Image.open(img_path)
image = transforms.ToTensor()(image)
print(image.size())

fig=plt.figure()
img = np.transpose(image.numpy(),(1,2,0))
plt.imshow(img)

打印结果如下：
python加载的彩色图片

3. L1范数，L2范数数学表达式，分别适用于什么情况

L1范数适用于向量中某一元素具有重要意义的情况（旋转坐标系时，L1距离会发生改变），公式如下：
$d_1(I_1,I_2) =\sum_p\vert I^p_1 -I^p_2\vert$
在这里插入图片描述
L2范数不会随着坐标轴的旋转而改变，适用于处理通用向量的分类问题，公式如下：
$d_2(I_1,I_2) =\sqrt{\sum_p( I^p_1 -I^p_2)^2}$