机器学习
donkey_1993
这个作者很懒,什么都没留下…
展开
-
基于python opencv的图像光照增强算法的代码实现。
在做检测过程中发现光照对于检测的精度影响很大,为了不增加采集标注数据工作量,增加了光照数据集来增强检测效果。代码1:选取需要光照增强的区域,直接将像素值增加到240-255之间。import cv2import matplotlib.pyplot as pltimport randomimg = cv2.imread('000100000910000000098.jpg')h,w,c = img.shapeprint(h,w)start_x = 510start_y = 1000f原创 2020-06-30 10:18:00 · 7033 阅读 · 5 评论 -
霍夫圆检测进行钢管检测
通过霍夫圆检测来检测图片中的圆形。HoughCircles里面的参数是可以自己设置的,具体参数的设置,在文章的最后。import cv2 as cvimport numpy as npimage1 = cv.imread("zzw.jpg") #读取要检测的图片se = cv.getStructuringElement(cv.MORPH_RECT, (3, 3))image = cv.morphologyEx(image1, cv.MORPH_GRADIENT, se)cv.imwri原创 2020-05-12 16:56:55 · 2891 阅读 · 0 评论 -
鱼眼摄像头的畸变矫正方法-python+opencv
鱼眼摄像头畸变校正的方法:1. 棋盘矫正法2. 经纬度矫正法。相机为什么会出现畸变?当前相机的畸变主要分为径向畸变和切向畸变两种。 径向畸变产生的原因:相机的光学镜头厚度不均匀,离镜头越远场景的光线就越弯曲从而产生径向畸变。 切向畸变产生的原因:镜头与图像传感器不完全平行造成的。 ...原创 2020-01-09 16:42:14 · 23431 阅读 · 12 评论 -
吴恩达机器学习训练秘籍整理十一到十九章(二)
第十一章:如何修改开发集,测试集和度量指标我们在开发一个新项目的时候,会尽快选好一个开发集和测试集。这样可以帮助团队制定一个明确的目标。到后面我们会发现初始的开发集,测试集和度量指标设置与期待目标有一定的差距。这时候我们需要修改我们的开发集,测试集和度量指标。在项目中改变开发集、测试集或者度量指标是很常见的。一个初始的开发集、测试集和度量指标能够帮助团队进行快速迭代,当你发现它们对...原创 2018-10-16 14:14:46 · 952 阅读 · 0 评论 -
吴恩达机器学习训练秘籍整理二十到二十七章(三)
第二十章:偏差和方差:误差的两大来源你的猫识别器在开发集上的错误率是16%,训练集上的错误率是15%。偏差:在训练集上的错误率。15%方差:开发集上的表现比训练集差多少。16%-15%=1%总误差 = 偏差+方差 = 16%第二十一章:通过偏差和方差来定义欠拟合和过拟合训练集错误率:1%开发集错误率:11%方差为:10%训练集误差低,开发集误差高。这就...原创 2018-10-16 15:11:59 · 880 阅读 · 0 评论 -
吴恩达机器学习训练秘籍整理二十八到三十二章(四)学习曲线
第二十八章:绘制学习曲线。随着训练集的增加,错误率逐渐的减少。 第二十九章:绘制训练误差曲线。随着训练集大小的增加,开发集(和测试集)误差应该会降低,但你的训练集误差往往会同时增加。 第三十章:高偏差: 随着我们添加更多的训练数据,训练误差只会变得更糟。因此蓝色的训练误差曲线只会保持不动或上升,这表明它只会远离期望的性能水平(绿色的线)。 红色的开发误差...原创 2018-10-16 15:29:32 · 1203 阅读 · 0 评论 -
吴恩达机器学习训练秘籍整理三十三到三十五章(五)
第三十三章为何与人类表现水平进行对比:许多机器学习系统的设计目的是想要自动化一些人类可以处理得很好的事情,可举的例子有图像识别、语音识别以及垃圾邮件分类等等。此外,有许多理由表明在处理人类擅长的任务时,构建机器一个学习系统会更加简单:1.易于从人为标签中获取数据2.基于人类直觉进行误差分析3.使用人类表现水平来估计最优错误率,并设置可达到的“期望错误率”。面临的难题:1...原创 2018-10-16 15:43:17 · 1038 阅读 · 0 评论 -
吴恩达机器学习训练秘籍整理三十六到四十三章(六)训练数据
第三十六章:何时在不同的分布上训练与测试。用户上传的10000张图片。网上收集的200000张图片。用户上传的5000张用来做开发集和测试集。205000用来做训练集。这样可以让他们的数据集的分布尽可能的相同。第三十七章:现有100000张用户上传的图片和200000张网络收集到的图片。这两种图片的分布是不一样的。早期的学习算法是不能将200000张图片用来训练的。但是基于深度学习...原创 2018-10-16 16:27:24 · 1066 阅读 · 0 评论 -
吴恩达机器学习训练秘籍整理四十四到五十二章(七)优化测试和端到端
第四十四章优化验证测试假设你正在构建一个语音识别系统,该系统通过输入一个音频片段A,并为每一个可能的输出句子S计算得分ScoreA(S) 。例如,你可以试着估计 ScoreA(S) = P(S|A) ,表示句子S是正确输出的转录的概率,其中 A 是给定的输入音频。假设有一个音频片段记录着某人说的:“我爱机器学习。”但你的系统输出的却是不正确的 “我爱机器人。”,它没能够输出正确的转录。...原创 2018-10-16 16:59:47 · 1057 阅读 · 0 评论 -
吴恩达机器学习训练秘籍整理五十三到五十七章(八)组件分析
第五十三章:根据组件进行误差分析假设你的系统由复杂的机器学习流水线所构建,并且你希望提高该系统的性能,那应该从流水线的哪一部分开始改进呢?你可以通过将误差归因于流水线的特定组件,来决定工作的优先级。在上图的流水线中,第一部分是猫检测器,它能够检测出猫,并将它们从图像裁剪出来;第二部分是猫的品种分类器,决定它是否是暹罗猫。通过按组件进行误差分析,你可以尝试将每一个算法造成的误差归因于...原创 2018-10-16 17:21:15 · 1072 阅读 · 0 评论 -
图像数据处理算法总结
本博文主要介绍了图像处理的一些基础知识一. 图像存储原理图像存储原理主要分为5种1. RGB颜色空间,使用最为广泛的颜色空间。2. CMY(K)颜色空间,主要用于印刷行业。3. HSV/HSL(I)颜色空间,人类视觉,和画家配色领域。4. CIE-XYZ颜色空间,国际照明协会应用。5. CIE-Lab对色空间,接近人类视觉。 二. 空域分析及变换滤波/卷积的...原创 2018-10-25 20:31:48 · 7253 阅读 · 0 评论 -
KNN,K近邻来做图像分类
KNN来做图像分类:如下图所示,用CIFAR-10图片作为训练样本,50000张图片作为训练集,10000图片作为测试集。KNN分类就是将测试集的像素值-训练集的像素值然后将像素值相加就得到我们的距离,距离最小的就是我们最后的分类结果。有时候只找到距离最近的一张图片会出现误差比较大,所以我们一般找5张距离最近的图片,选区这5张图片中类别最多的种类作为我们最终的分类结果。下图是L1距离,...原创 2018-11-07 15:59:13 · 2863 阅读 · 2 评论 -
机器学习:KNN的简单实现
KNN就是计算测试集与样本之间的最近的距离。 KNN是通过测量不同特征值之间的距离进行分类。它的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别,其中K通常是不大于20的整数。KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。简单代码实现:...原创 2018-11-29 16:05:58 · 2076 阅读 · 0 评论 -
吴恩达机器学习训练秘籍整理一到十章(一)
第一到四章:1.为什么选用机器学习策略。机器学习是无数重要应用的基础。2.先修知识与符号标记。有监督学习的经验。了解机器学习。3.驱动机器学习发展的原因。数据的可用性和计算规模。传统算法和神经网络算法在数据集较小的情况下区别不大,但是随着数据集的增加和网络层数的加深,效果会越来越好。假设我们要做的产品是一个APP,用户上传图片我们来自动的找到图中有猫的照片。 第五章:...原创 2018-10-16 13:11:26 · 2169 阅读 · 1 评论 -
机器学习中的集成学习
集成学习本质上就是将多个基学习器通过某种结合策略结合在一起然后输出结果。现在我们介绍一下集成学习的种类:1. Boosting,采用的是串行工作机制。其中最为经典的就是AdaBoost。AdaBoost采用的是指数损失函数。算法流程是:初始化训练数据的权值分布。如果有N个样本,则每一个训练样本最开始时都被赋予相同的权值:1/N。 训练弱分类器。具体训练过程中,如果某个样本点已经被...原创 2018-09-10 11:18:05 · 909 阅读 · 0 评论 -
Logistic 回归 逻辑回归算法。
logistic回归:经典的二分类算法。Sigmoid函数:自变量取任意值,值域位于[0,1]。该函数可以将任意值映射到[0,1]之间。我们在线性回归中可以得到一个预测值,然后将预测值映射到Sigmoid函数中,完成由值到概率的转换这就可以用来分类。预测函数:得到似然函数:最后求偏导:...原创 2018-04-10 09:34:22 · 3772 阅读 · 0 评论 -
2018年CVPR中部分目标跟踪论文visual tracking
1.Learning Attentions: Residual Attentional Siamese Networkfor High Performance Online Visual Tracking2.VITAL: VIsual Tracking via Adversarial Learning3.Context-aware Deep Feature Compression for High...原创 2018-04-24 10:46:17 · 6413 阅读 · 1 评论 -
Softmax分类器
SVM分类器得到的是一个得分数值。Softmax得到的是一个概率值。1. Sigmoid函数:(x 可以去任意值,y 得到0-1之间的数值(0-1数值相当于概率值)。) 2. Softmax分类器: Softmax的输出:归一化的分类概率。输入一个向量(向量元素为任意实数),输出的是一个向量(向量元素为0-1之间的概率值)实例:分类品种得分值将得到的值进行ex处理做...原创 2018-05-25 21:09:35 · 12791 阅读 · 3 评论 -
深度学习中的激活函数Sigmoid和ReLu激活函数和梯度消失问题。
1. Sigmoid激活函数: Sigmoid激活函数的缺陷:当 x 取很大的值之后他们对应的 y 值区别不会很大,就会出现梯度消失的问题。因此现在一般都不使用Sigmoid函数,而是使用ReLu激活函数。2. ReLu激活函数: ReLu激活函数:当x为负值之后y取0,x为正数之后,y随x的值得增大而增大,这样就可以解决梯度消失问题。现在一般都是用ReLu激...原创 2018-05-26 19:41:21 · 18065 阅读 · 0 评论 -
深度学习的偏差和方差:两大误差的来源。
机器学习中的两大误差来源:偏差和方差。假设你的算法在开发集上有16%的错误率(84%的精度),我们将16%的错误率分为两部分:1. 偏差:算法在训练集上面的错误率。假设有15%。2.方差:算法在测试集上的错误率比训练集上差多少。16%-15%=1%总误差 = 偏差+方差 所以总误差为15%+1%=16%....原创 2018-05-23 09:38:43 · 6703 阅读 · 0 评论 -
方差和偏差来分析:深度学习中的过拟合、欠拟合
偏差和方差的定义介绍:https://mp.csdn.net/postedit/80414998假设一个识别狗算法分类器:1. 过拟合 训练集错误率:1% 测试集错误率:15% 偏差为:1% 方差为:15%-1%=14% 总误差为 15% 虽然分类器训练误差非常低,但是没能成功泛化到测试集。这叫做过拟合。2.欠拟合 训练集错误率:15% 测...原创 2018-05-23 09:59:09 · 6261 阅读 · 0 评论 -
Caffe教程:训练自己的网络结构来分类。
本站的内容是训练自己的网络结构来分类鸟和狗。1.准备自己的数据集,百度下载10张鸟的图片和10张狗的图片最为训练集。再下载4张鸟的图片和4张狗的图片最为验证集。(只是为了给大家演示一下就没有弄太多的数据集)。训练集对图片进行bianhao...原创 2018-05-23 15:50:07 · 8280 阅读 · 1 评论 -
数据增强的方法 Data Augmentation
数据增强的方法:1.水平翻转(镜像操作)2.随机裁剪3.尺度变化4.平移操作5.角度变化6.拉伸操作。。。。。。。。。数据增强的方法主要有这6种,每种方法又可以和其他的一种或者多种方法结合在一起,这样就可以产生更多的数据。...原创 2018-06-12 22:46:37 · 2745 阅读 · 0 评论 -
四种聚类方法及代码实现。K-means 高斯聚类 密度聚类 均值漂移聚类
四种方法的matlab代码实现:链接: https://pan.baidu.com/s/1b6pKH65rYrRcBLnczz-EnA 密码: 4iag1.K-means聚类:算法步骤: (1) 首先我们选择一些类/组,并随机初始化它们各自的中心点。中心点是与每个数据点向量长度相同的位置。这需要我们提前预知类的数量(即中心点的数量)。 (2) 计算每个数据点到中心点的距离,数据点距离哪个中心点最近...原创 2018-06-06 09:39:06 · 9404 阅读 · 29 评论 -
RGB-D深度图像介绍RGBD
RGBD = RGB + Depth MapRGB :RGB色彩模式是工业界的一种颜色标准,是通过对红(R)、绿(G)、蓝(B)三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色的,RGB即是代表红、绿、蓝三个通道的颜色,这个标准几乎包括了人类视力所能感知的所有颜色,是目前运用最广的颜色系统之一。 Depth Map:在3D计算机图形中,Depth Map(深度图)是包含与视点的场景对...原创 2018-06-23 11:02:08 · 85676 阅读 · 15 评论 -
SVM支持向量机详解
SVM支持向量机是一个优秀的分类算法,用简单的原理构造了复杂的算法。本文将从SVM的基础开始讲:1.拉格朗日乘子法和KKT条件a) 拉格朗日乘子法:只要有拉格朗日乘子法的地方就有组合优化问题。带约束优化的问题:这是一个带等式约束优化问题,有目标值,有约束条件。假设没有约束条件我们应该如何求解:将x1,x2,x3分别求偏导,然后偏导为0,那么各个x都为0,f=0求得最小值...原创 2018-08-13 14:44:58 · 1509 阅读 · 0 评论 -
为什么不用牛顿法来代替梯度下降算法?
a. 牛顿法使用的是目标函数的二阶导数,在高维情况下这个矩阵非常大,计算和存储都是问题。b. 在小批量的情况下,牛顿法对于二阶导数的估计噪声太大。c.目标函数非凸的时候,牛顿法容易受到鞍点或者最大值点的吸引。...原创 2018-09-09 21:29:39 · 3064 阅读 · 1 评论 -
贝叶斯算法
贝叶斯要解决的问题:(贝叶斯解决的逆向概率问题)1)正向概率:假设袋子里面有M个黑球,N个白球。伸手去摸一个,摸到黑球的概率是多少?2)逆向概率:假设事先我们不知道黑球和白球的概率。我们随便摸一个(或者多个),观察取出来的球的颜色之后,那么我们对袋子里面的黑球和白球的概率做怎样的推测。假设一个学校有60%的男生和40%的女生。男生都穿长裤,女生一半穿长裤一半穿短裤。假设一共有U个学生。穿长裤的男生...原创 2018-04-14 18:59:03 · 4229 阅读 · 0 评论