![](https://img-blog.csdnimg.cn/20190918140129601.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
研究生学习
文章平均质量分 76
不想墨鱼的研究生学习记录
l_z_z_z
这个作者很懒,什么都没留下…
展开
-
在python中读取.pgm格式图像
先检查图片格式from PIL import Image# 图像格式def show_image(filepath): im = Image.open(filepath) im.show() print(im.mode) print(im.size)根据print(im.mode)内容结合网址给出的信息判断 。网址:PIL库图像中的mode参数假设是8位深度图像,则采用下列代码读取数据:def read_pgm(pgmf): """Re.原创 2021-10-16 16:46:18 · 1888 阅读 · 0 评论 -
语义分割--DeepLabV2
先放到这,这两天把博客写出来,敬请期待。原创 2021-08-11 11:32:40 · 242 阅读 · 0 评论 -
数据集Pascal VOC2012
写在前面PASCAL VOC为图像识别提供了一套标准化的优秀的数据集。其三个主要的物体识别竞赛分别是分类classification, 检测detection, 分割segmentation。对于分割任务, VOC2012的trainval包含2007-2011年所有对应图片,test只包含2008-2011,trainval有2913张图片,共6929个物体。分类总共分成20+1类,有20类物体,第21类为背景:Person : personAnimal : bird , cat ,原创 2021-08-11 11:02:43 · 1395 阅读 · 0 评论 -
分类模型--ResNet系列--ResNet50
ResNet解决了?ResNet网络解决深度网络退化问题。采用ResNet网络结构的网络层数越深,性能越佳;如下图一显示,56层的深度网络的训练误差和测试误差反而比20层网络更大,这就是深度网络退化;而图二展示了使用ResNet结构前后,34层网络与18层网络的训练结果对比;ResNet原理及结构假设我们想要网络块学习到的映射为H(x),而直接学习H(x)是很难学习到的。若我们学习另一个残差函数F(x) = H(x) - x可以很容易学习,因为此时网络块的训练目标是将...原创 2021-07-26 10:05:56 · 4521 阅读 · 0 评论 -
分类模型--VGG16
前言VGG参加2014年的ImageNet图像分类与定位挑战赛,取得了分类第二,定位第一的优秀成绩;结构VGG根据卷积核大小和卷积层数目不同,可以分为A,A-,LRN,B,C,D,E6种,以D,E两种较为常用,分别称为VGG16和VGG19;下图给出VGG的六种结构配置:上图中,每一列对应一种结构配置,比如:图中的绿色部分即指明了VGG16所采用的结构;针对其进行具体分析,可以看到VGG16共包含:13个卷积层(Convolutional Layer),分别用conv3-xx..原创 2021-07-24 11:25:48 · 1858 阅读 · 1 评论