计算机视觉
文章平均质量分 82
Hazelyu27
这个作者很懒,什么都没留下…
展开
-
影像计算课上对于一些深度学习的思考
调了很多模型,包括目标检测的yolo,分类的cnn,efficientnet,这次做分割的unet和resunet。但是在调模型的时候,我发现很难真正学到什么经验,我只是在改输入输出路径,调bug,对输出的东西处理。最难的应该是调unet,花了很多时间在统一数据集的格式和输出的东西上,因为我不太理解gif,png,jpg存储的区别,cv2和Image读取图片的区别,位深1,8(灰度图和彩色图的区别),二值图(true,false)和普通灰度图(0-255)的区别,导致总是报错。原创 2022-12-03 15:07:46 · 746 阅读 · 0 评论 -
python实现随机梯度下降
梯度下降和随机梯度下降的区别是,梯度下降在每次更新时,使用所有样本来计算,这样的实现在大型数据集上运行会非常慢,会被认为是浪费资源。SGD是训练深度神经网络时最重要的算法。mini-batch随机梯度下降是采样小批量数据来更新。虽然不是每次迭代得到的损失函数都向着全局最优方向,但是大的整体的方向是向全局最优解的。python实现随机梯度下降如下,使用常规的线性模型来测试效果。随机梯度下降指的是用样本中的一个例子来代替所有的样本,...原创 2022-07-23 17:38:47 · 3215 阅读 · 0 评论 -
Deep learning for Computer Vision with Python笔记(5)构建线性分类器并优化参数
整个线性分类器的过程可以用下图来表示。图像矩阵×权重矩阵+b,得到最终的y是一个n维向量,n是标签的个数。w的大小是由图像大小决定的。线性分类器的好处有1.一旦数据和标签定下来,我们只需要考虑w和b对于模型的影响。2.预测的效率非常高。............原创 2022-07-18 10:49:01 · 719 阅读 · 0 评论 -
Deep learning for Computer Vision with Python笔记(4)构建KNN图像分类器
由于每个环境的版本都在更新,所以他们的兼容性非常复杂,尽管它们的更新会带来新的优化和训练神经网络的能力。用到的库介绍1.同时支持TensorFlow和Theano2.分布式多机器学习的深度学习库,在海量数据集上训练深度神经网络架构时,跨多个GPU、多设备并行训练的能力是非常重要的。3.主要目的是实时图像处理,将图像表示为Numpy数组。它使用c++写的,但是支持python的接口。4.和用于图像处理的算法,实现创建训练测试和验证的功能。...............原创 2022-07-15 17:57:23 · 743 阅读 · 0 评论 -
Deep learning for Computer Vision with Python笔记(3)图像数据集介绍
在开始训练之前,我们要知道如何去创建一个数据集,并且构建图像分类器。我们首先将介绍书中将会用到的数据集。这是一个手写数据集,目的是为了识别手写的0~9。它通常用来作为基准数据库,用来对机器学习算法的表现进行排序。 它包含60000个训练数据和10000个测试数据,特征维度是784维,包含28✖️28像素的图片。这些像素是0~255范围内的整数(只有单通道的像素)。 这是一个包含猫,狗和熊猫的三类动物数据集,分别每个类包含1000张图片。这个数据集将在第十章使用卷积神经网络时进行使用。它常用于作为Kaggle原创 2022-07-12 09:28:52 · 1493 阅读 · 0 评论 -
Deep learning for Computer Vision with Python 笔记(2)图像基础
像素是图像的构成元素,每个图片都是由一系列像素组成。一个图片的像素数量=长像素数*宽像素数。大多数像素可以分成两类:灰通道的像素是一个标量,它的取值在0~255之间,其中0表示黑色,255表示白色。彩色通道的像素是一个三元组,三元组中的值表示红、绿、蓝颜色的数量,它们的范围都在0~255之间。我们通常用8位int表示0~255之间的数。但是,通常情况下,我们并不会将图片的像素数据直接放入神经网络中进行训练,其中都要进行一个数据转化的过程,即使用一些加载方式(例如OpenCV)将像素int数据转成float类原创 2022-07-08 16:25:57 · 1560 阅读 · 0 评论 -
Deep learning for Computer Vision with Python(1)从零开始入门计算机视觉
计算机视觉与深度学习阅读笔记原创 2022-07-07 14:56:05 · 1074 阅读 · 0 评论