课程的重点:
图像分类(目标检测,图像摘要)
pzza网站上去进行讨论吧。
cs231n得到谷歌云的支持,在上面可以运行。需要使用python && Numpy
计算机理解图片存在 语义鸿沟:不能从众多数字中提取特征
需要从背景复杂的图片,或者千姿百态的猫咪图片,有遮挡的图片中 find the cat,以及类内差异,不同形状,大小,年龄的cats。
数据驱动方法
CIFAR 10数据集
K近邻算法(训练快,测试却慢正好与卷积神经网络相反)落伍了,我们希望训练的慢,但是测试的快,不妨试试卷积神经网络。
K近邻算法,总是给K赋一个比较大的值,从而使得决策边界更加平滑。
KNN:
L1距离(曼哈顿距离):二者之差取绝对值 ,取决于所选的坐标系
L2距离(欧式距离):二者之差的平方和取根号
并非在训练时准确率越高越好哦,我们追求的是在未知数据上的准确率越高越好。
还有一种只分成训练集和测试集,然后训练使用不同的超参数,选择在测试集上准确率最高的那个作为最终结果,也不行。因为可能只是在这上面好。
最常见的便是分为训练集,验证集,测试集。在训练集训练超参数,验证集评估取最好,在测试集上跑一跑。
K近邻算法不适合用于区分图片,向量化的距离函数不适合表示图像之间视觉的相似度。另一个问题:维度灾难,若希望分类器有好的训练效果,则需要训练数据能密集的分布,需要指数倍数的训练。