机器视觉及图像分类

最新推荐文章于 2024-06-05 07:00:43 发布

Ycaid

最新推荐文章于 2024-06-05 07:00:43 发布

阅读量2.8k

点赞数 2

文章标签：神经网络卷积大数据深度学习机器学习

本文链接：https://blog.csdn.net/Ycaid/article/details/113789643

版权

机器视觉及图像分类撰写本科毕业论文前期文献准备扩大课题在知乎上查相关的文献并且下载，之后导入Endnote里面，如果下的是CAJ文件的话，需要再下载一个CAJViewer阅读器。因为是第一次看论文。但每篇都做了相关的笔记。看完30多偏后，对自己的课题有了一个总体的框架，并且和导师聊了下后续的进展。分享一下自己做的笔记长文警告：（1）一种机器视觉的书籍类整理识别系统设计知识点；VS、open cv机器视觉及图像处理彼长于分类，亦即如猫、狗、茄子、香蕉、飞机、自行车等物体之检测、分类，短

摘要由CSDN通过智能技术生成

机器视觉及图像分类

撰写本科毕业论文前期文献准备

扩大课题在知乎上查相关的文献并且下载，之后导入Endnote里面，如果下的是CAJ文件的话，需要再下载一个CAJViewer阅读器。

因为是第一次看论文。但每篇都做了相关的笔记。看完30多偏后，对自己的课题有了一个总体的框架，并且和导师聊了下后续的进展。

分享一下自己做的笔记
长文警告：
（1）一种机器视觉的书籍类整理识别系统设计
知识点；

VS、open cv
机器视觉及图像处理
彼长于分类，亦即如猫、狗、茄子、香蕉、飞机、自行车等物体之检测、分类，短于人脸识别。其实，使之于人脸分类，亦无不可，然问彼汝为何人，则弱矣，其因有四：1、每添新人，须采集大量图像；2、每添新人，须重新训练模型；3、训练数据，须事先清洗，工作浩繁；4、调参困难、耗时、耗工；
机器视觉及图像处理库（以下简称工具库）基于VS2015开发，开发语言为C++，用到的图像处理库为OpenCV3.4（以下简称OCV3），深度学习网络为caffe和DLib。这几个第三方的支持库都需要自行编译以支持VS2015。网上有大把的资料介绍如何用CMake构建支持VS2015的工程，以实现VS2015下的源码编译，
OCV3我们需要opencv contrib模块，所以编译OCV3时记得要把这个模块加上。另外，如果你的机器支持GPU，请一定编译成GPU版本，如果不支持也没事，工具库支持源码级的CPU和GPU切换，使用时你只须根据现场环境定制编译就行了。
原理
VS-OPEN CV 开发智能书籍分类识别算法-预处理-二值化图像
可以利用软件开发平台VS2010软件开发平台设计开发软件系统的界面

（2）一种基于卷积神经网络参数优化棉花等级分类算法

分类：VGG16卷积神经网络-迁移学习-搭建模型-梯度下降优化算法-重复训练模型-确定最佳参数值
卷积神经网络中InceptionV3模型，迁移学习，对预先处理好的深度学习网络进行学习，提高效率和识别精度
利用图像采集技术建立采集样本图像
利用Keras深度学习框架实现对VGG16网络模型搭建。对图像进行预处理后再进行迁移学习
神经网络模型的训练？
通过公式;确定超参数值和轮次数对模型进行训练，机损分类正确率。选择交叉熵作为损失函数

现成的神经网络库比如Keras、Tensorflow

神经网络-吴恩达老师教程
VGG16：基于大量真实图像的ImageNet图像库预训练的网络
导入必要库
使用Keras建立VGG16模型？
预测;写一个方法来加载并处理图片，读取VGG16的类别文件，开始预测

神经网络：我们可以在计算机上创建神经网络，来对这个过程进行建模，且并不需要模拟分子级的生物复杂性，只要观其大略即可。为了简化起见，我们只模拟一个神经元，含有三个输入和一个输出。
利用所得样本集作为训练集来训练这个神经元。当加入一个新的情况时来自动判断结果即输出

训练过程：但是如何教会神经元来正确的回答这个问题呢？我们要给每个输入赋予一个权重，权重可能为正也可能为负。权重的绝对值，代表了输入对输出的决定权。在开始之前，我们先把权重设为随机数，再开始训练过程：
1.从训练集样本读取输入，根据权重进行调整，再代入某个特殊的方程计算神经元的输出。
2.计算误差，也就是神经元的实际输出和训练样本的期望输出之差。
3.根据误差的方向，微调权重。
4.重复10000次。
最终权重达到训练集的最优值。再用神经元去思考一个新的形势来得到预测。
计算神经元输出方程：

构建Python代码。–网页收藏9行Python代码搭建神经网络

图片输入：像素值构成数组。像素值组成的矩阵
卷积：从输入图片中特征提取基于一个小矩阵，也就是卷积核 -过滤器，在上面所说的每层像素矩阵上不断按步长扫过去的，扫到数与卷积核对应位置的数相乘，然后求总和，每扫一次，得到一个值，全部扫完则生成一个新的矩阵。卷积核如何设置可以参考卷积神经网络的卷积核大小、个数，卷积层数如何确定呢？一般取(3,3)的小矩阵，卷积核里面每个值就是我们需要寻找（训练）的神经元参数(权重)，开始会随机有个初始值，当训练网络时，网络会通过后向传播不断更新这些参数值，直到寻找到最佳的参数值。如何知道是“最佳”？是通过损失函数去评估。
不同的卷积核对不同的图像信息敏感，可以用于提取不同的特征
最后一个输出层与前一层是全连接，但其输出最终的结果，起到分类器的作用
卷积神经网络对数据进行多次深度的抽象，不断学习优化的过程也称为深度学习

卷积神经网络CNNS：可以避免对数据负载预处理过程的优点，直接将原始图片作为模型输入
卷积特征值

LeNet架构-深度学习领域的卷积神经网络之一：卷积（对原图像特征增强，降低噪声，从而得到特征图）-非线性-池化ÿ

最低0.47元/天解锁文章

Ycaid

关注

2
点赞
踩
19

收藏

觉得还不错? 一键收藏
1
评论
机器视觉及图像分类

机器视觉及图像分类撰写本科毕业论文前期文献准备扩大课题在知乎上查相关的文献并且下载，之后导入Endnote里面，如果下的是CAJ文件的话，需要再下载一个CAJViewer阅读器。因为是第一次看论文。但每篇都做了相关的笔记。看完30多偏后，对自己的课题有了一个总体的框架，并且和导师聊了下后续的进展。分享一下自己做的笔记长文警告：（1）一种机器视觉的书籍类整理识别系统设计知识点；VS、open cv机器视觉及图像处理彼长于分类，亦即如猫、狗、茄子、香蕉、飞机、自行车等物体之检测、分类，短
复制链接

扫一扫