第一周实践作业总结
作业内容:课程中以1张图片为例,测试了预测效果。请从原始mnist数据集中,『随机抽取』100张图片,测试模型的分类准确率。
遗漏点:测试分类准确率,因此随机选取的100张图片应在测试集而非训练集中,此处扣了10分
大致思路:随机100个可选的图片序号,升序排序,初始指针为0,根据批次epoch_id及序号batch_id计算图片序号,并判断是否是当前指针下的图片序号,若是,则计算预测结果是否正确,rightnum记正确个数。最终测试预测正确率为rightnum/100
实现过程:实现时对预测结果predict没有正确的认识,通过Print得知预测值并非一个数字,而是预测是各个数字的概率,需手动计算预测数字(也即概率最大的那位数),并与lable作比较。
计算机视觉
经典模型:
- 卷积神经网络
- 图像分类
- 目标检测
计算机视觉子任务:
(a) Image Classification: 图像分类,用于识别图像中物体的类别。
(b) Object Localization: 目标检测,用于检测图像中每个物体的类别,并准确标出它们的位置。
© Semantic Segmentation: 图像语义分割,用于标出图像中每个像素点所属的类别,属于同一类别的像素点用一个颜色标识。
(d) Instance Segmentation: 实例分割,值得注意的是,(b)中的目标检测任务只需要标注出物体位置,而(d)中的实例分割任务不仅要标注出物体位置,还需要标注出物体的外形轮廓。
卷积神经网络
基础模块:
- 卷积(Convolution)
- 池化(Pooling)
- ReLU激活函数
- 批归一化(Batch Normalization)
- 丢弃法(Dropout)
卷积(Convolution)
- 卷积计算
- 填充(padding)
- 步幅(stride)
- 感受野(Receptive Field)
- 多输入通道、多输出通道和批量操作
- 飞桨卷积API介绍
- 卷积算子应用举例
(未完)