![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 95
jamsShadow
这个作者很懒,什么都没留下…
展开
-
Matlab函数imfeature详解
Matlab函数imfeature详解初学者请多多指正。 但凡读matlab程序遇到的不了解的函数一除了上网搜索外,matlab中的help和命令行的help也能够提供很大的帮助尤其是help菜单,有详细的解释和举例。今天想把一个车牌识别的程序运用到表格识别中,遇到imfeature函数。没见过,于是help imfeature得到的是 IMFEATURE Compute feat原创 2013-09-18 20:45:21 · 4997 阅读 · 0 评论 -
bag of visual word
是由文档分析推广到计算机视觉的,文档分析的词袋的用途,将一篇篇文档看成一个个词汇的集合,统计词汇在字典中出现的次数构成直方图。 example: 1:Bob likes to play basketball, Jim likes too. 2:Bob also likes to play football games.基于这两个文本文档,构造一个词典原创 2013-12-23 21:15:43 · 3602 阅读 · 3 评论 -
Libsvm在matlab环境下使用指南
一、安装http://www.csie.ntu.edu.tw/~cjlin/libsvm/matlab/。在这个地址上可以下的包含matlab接口的源程序。下载完后可以放到放到任意的盘上解压,最好建一个专门来放matlab程序的文件夹。打开matlab,在matlab的面板上找到set path选项(不同版本不一样R2010b在file菜单下),将刚下载的libsvm整个目录都添加到matla原创 2014-07-04 23:13:36 · 1551 阅读 · 0 评论 -
二值化方法总结——附录程序
表格识别的第一个关键步是二值法。二值化算法包括全局二值化和局部二值化, 全局二值化具有速度快但效果相对差的特点, 局部二值化算法具有速度慢效果好的特点。全局阈值 方法一:直接采用im2bw ;不断尝试阈值阈值为240: 阈值为163: 阈值为10: 方法一虽然很简单,原创 2013-09-22 22:26:04 · 6139 阅读 · 0 评论 -
matlab_关于倾斜校正的函数
这周开始转向倾斜校正,上周的二值化的效果完成的还可以,但是没提出自己的想法。应该很少有方法能够通吃所有遇到的情况,另外也无法兼顾速度和效果。所以想法是能够抽取图像一些最简单的特征如:直方图。从直方图的情况来确定所用的方法,增加鲁棒性。对于简单的图像用简单的方法没有涉及到hough,radon。但一定涉及一个函数imrotate;B = imrotate(A,angle)B =imr原创 2013-09-30 17:56:26 · 9910 阅读 · 0 评论 -
matlab的各种数据读取(txt,dat,mat等格式),文件打开关闭
本文引用地址:http://blog.sciencenet.cn/blog-907194-688272.html MATLAB提供了多种方式从磁盘读入文件或将数据输入到工作空间,即读取数据,又叫导入数据;将工作空间的变量存储到磁盘文件中称为存写数据,又叫导出数据。至于选择哪种机制,则根据下面两个因素决定:● 用户所执行的操作是导入数据还是导出数据;● 数据的格式为文本格转载 2013-10-10 22:32:41 · 17341 阅读 · 0 评论 -
matalb ann
其实是这样的 ,在R2009的NN工具箱中,数据被自动分成training set、validation set 及test set 三部分,training set是训练样本数据,validation set是验证样本数据,test set是测试样本数据,这样这三个数据集是没有重叠的。在训练时,用training训练,每训练一次,系统自动会将validation set中的样本数据输入神经网络进转载 2013-10-18 15:10:01 · 1061 阅读 · 0 评论 -
out of memory--神经网络训练--case
之前的工作:由于下载到的数据集包含62个文件夹,每个文件夹有1016张图片,0-9,A-Z,a-z 。上周研究的是印刷体数字的识别,只有用的10个文件夹,这时读取的图片数目可以很大,得到的识别效果也十分好,接近98%。现在的工作:将处理的的范围扩大到大小写字母,这时读取的图片量剧增,以每个文件夹读取300张算,总体的图片张数是18600,在训练的时候发生了错误out of memory原创 2013-10-23 22:02:37 · 3371 阅读 · 0 评论 -
can't read model: number of return field is not correct
系统里装的是libsvm3.17,下载的一个场景字符识别程序没有标明用的是哪个版本的libsvm。运行程序出现“can't read model: number of return field is not correct”。错误在 “[pl,ac,py]=svmpredict(zeros(size(x,1),1),x,clf{3},'-b 0');”这一行里之前一直无法解决。在熟悉了解了l原创 2014-04-15 22:57:45 · 5442 阅读 · 1 评论 -
ROC曲线,AUC,
在信号检测理论中,接收者操作特征曲线(receiver operating characteristic curve,或者叫ROC曲线)是一种座标图式的分析工具,用途(1),选择最佳的分类模型(2),同一模型中选择最佳阈值那是怎么达到这一目的的呢?首先要了解几个概念。真阳性TP,真阴性TN,伪阳性FP,伪阴性FN,伪阳性率(FPR),真阳性率(TPR)。举个例子,比如你预测原创 2013-12-11 09:33:10 · 1874 阅读 · 0 评论 -
matlab实现MSER(最大极值稳定区域)来进行文本定位
一、自然场景文本定位综述 场景图像中文本占据的范围一般都较小,图像中存在着大范围的非文本区域。因此,场景图像文本定位作为一个独立步骤越来越受到重视。这包括从最先的CD和杂志封面文本定位到智能交通系统中的车牌定位、视频中的字幕提取,再到限制条件少,复杂背景下的场景文本定位。与此同时文本定位算法的鲁棒性越来越高,适用的范围也越来越广泛。文本定位的方式一般可以分为三种,基于连通域的、...原创 2015-08-17 23:39:02 · 8263 阅读 · 14 评论 -
Matlab GUI memo
有一段时间没写博客,一周4篇文章都坚持不下来,不知道写哪个方面的内容,写研究相关就怕论文查重查到,其他方面也没太多时间去学。还是花时间多学点其他方面。废话到此,很早就做过matlab gui相关,现在想做一个论文的系统演示,很多东西又忘了又没有记录,再熟悉一次又得花大功夫,所以在这里系统的记录下。 一、创建GUI的方式 学习GUI最好的材料当然是matlab的官方文档了,本文也原创 2015-04-02 22:45:09 · 1067 阅读 · 0 评论 -
KNN算法matlab函数 ClassificationKNN.fit
ClassificationKNN.fit:建立mdl =ClassificationKNN.fit(X,Y):基于特征和分类标签返回分类模型。X:每行表示一个特征向量,每列表示特征向量中一个变量。Y:每行代表的是X中特征向量说代表的标签或种类。mdl = ClassificationKNN.fit(X,Y,Name,Value):value代表K的值ClassificationKNN原创 2014-01-15 11:24:03 · 20664 阅读 · 2 评论 -
图像分割之mean shift
阅读目的:理解quick shift,同时理解mean shift原理,mean shift用于图像聚类,优点是不需要指定聚类中心个数,缺点是计算量太大(原因)。mean shift主要用来寻找符合一些数据样本的模型,证明样本符合某一概率密度函数(PDF),是一种非参数迭代算法能够寻找模型和聚类。 数据经过非参数密度估计能够得到符合数据分布的概率密度函数,而mean原创 2014-10-31 22:36:36 · 2310 阅读 · 0 评论 -
BP神经网络应用于手写数字识别--matlab程序
二:BP神经网络应用于字符识别 字符包括汉字,字母,数字和一些符号。汉字有几千个,字母有几十个,数字的类最少只有10个,所以选择简单的手写数字字符来实现。结合三个相关的程序和论文,一个是语音特征的分类(不调用神经网络工具箱相关函数实现),另外两个是关于手写数字识别的。处理的数据集是放在10个文件夹里,文件夹的名称对应存放的手写数字图片的数字,每个数字500张,每张图片的像素统一为28*28,原创 2013-10-15 22:18:28 · 40090 阅读 · 21 评论 -
Matlab中plot函数全功能解析
该帖由Matlab技术论(http://www.matlabsky.com)坛原创,更多精彩内容参见http://www.matlabsky.com 功能二维曲线绘图 语法plot(Y)plot(X1,Y1,...)plot(X1,Y1,LineSpec,...)plot(...,'PropertyName',PropertyValue,转载 2013-10-28 11:43:01 · 1304 阅读 · 0 评论 -
四通道图像中的alpha通道
在图像处理中,Alpha用来衡量一个像素或图像的透明度。在非压缩的32位RGB图像中,每个像素是由四个部分组成:一个Alpha通道和三个颜色分量(R、G和B)。当Alpha值为0时,该像素是完全透明的,而当Alpha值为255时,则该像素是完全不透明。 Alpha混色是将源像素和背景像素的颜色进行混合,最终显示的颜色取决于其RGB颜色分量和Alpha值。它们之间的关系可用下列公式来表示:原创 2013-10-29 19:50:02 · 13565 阅读 · 0 评论 -
opencv---mat
Mat - 基本图像容器http://www.opencv.org.cn/opencvdoc/2.3.2/html/doc/tutorials/core/mat%20-%20the%20basic%20image%20container/mat%20-%20the%20basic%20image%20container.html目的从真实世界中获取数字图像有很多方法,比转载 2013-10-30 20:11:45 · 989 阅读 · 0 评论 -
SIFT(尺度不变特征变换)
SIFT(尺度不变特征变换)基本上参考http://blog.csdn.net/abcjennifer/article/details/7639681这篇文献,不过个人感觉作者写的思路不够清晰,虽然我写的也不咋的;文章只是个人理解,有错误请指正。用途和特点:描述图像中的局部特征,一种可以检测并计算出对于在光照、图像噪点、旋转、缩放和视点变换时提取出不变的局部特征值的算法。具体的原理着实原创 2013-12-09 21:15:01 · 8100 阅读 · 0 评论 -
Error using pdist2 Too many input arguments
PS:遇到的问题Error using pdist2Too many input arguments. Error inExhaustiveSearcher/knnsearch (line 207) [dist,idx] = pdist2(obj.X,Y, distMetric,arg{:}, 'smallest',numNN); Error in Clas原创 2014-01-15 11:26:22 · 3040 阅读 · 1 评论 -
神经网络用于手写数字识别更新版
一:人工神经网络 人类之所以能够思考,学习,判断,大部分都要归功于人脑中复杂的神经网络。虽然现在人脑的机理还没有完全破译,但是人脑中神经元之间的连接,信息的传递都已为人所知晓。于是人们就想能否模拟人脑的功能用于解决其他问题,这就发展出人工神经网络。 人工神经网络(artificial neural network,缩写ANN),是一种模仿生物神经网络的结构和功能的原创 2014-10-28 23:01:20 · 17929 阅读 · 39 评论 -
颜色聚类方法综述
毕业了,毕业论文也可以拿来晒晒了。觉的自己的论文涉及的知识点特别多,用到了很多图像处理和机器学习方面的技术。第三章主要是讲的颜色聚类的方法用来提取自然场景文本的候选连通域。(工作了时间不是很多,先把文章发上来,一周之内在好好拓展并整理).一、颜色聚类的优点 分析自然场景文本的特点可得,在一个文本区域内部,一般一个字符内部的颜色变化不大。对于一幅24位RGB彩色图,需要处理的颜色范围达原创 2015-08-12 21:51:28 · 7606 阅读 · 2 评论 -
matlab神经网络函数(feedforwardnet,fitnet,patternet)
feedforwardnet ():综述:包含一系列的层次。第一层与网络输入连接。接下来的层次与上一次连接。最后一层产生网络的输出。feedforward网络可以用作输入和输出的映射,只含有一个隐含层的的神经网络可以拟合任意有限的输入输出映射问题。输入的变量有两个可以选择feedforwardnet(hiddenSizes,trainFcn) hiddenSizes原创 2013-10-17 17:23:16 · 32620 阅读 · 2 评论 -
matlab find函数详解
Find 这个函数用处也挺大的,这几天看很多程序都见到这一函数,今天要好好给阐述,了解下这个函数是为了找到矩阵或者是数组,向量中的非零元素。下面一大段英文没耐心看。看看例子就行了。第一个用法是ndices = find(X)X = [1 0 4 -3 0 0 0 8 6];indices = find(X)返回x中非零元素的序号从1开始indices = 1原创 2013-09-18 20:46:52 · 118325 阅读 · 9 评论 -
字符识别数据集,文档分析相关的资源
原创一.一些作者的研究主页Scottleishman:多伦多大学计算机系机器学习小组,主页可以下载到作者的发表的论文,硕士学位论文等。http://www.cs.toronto.edu/~scottl/http://www.cs.toronto.edu/~scottl/research/icdar2005.pdfhttp://www.cs.toronto.edu/~scot原创 2013-12-04 21:42:23 · 7907 阅读 · 1 评论 -
VlFeat_vl_pr画图解析
This tutorial illustrates the use of thefunctions vl_roc, vl_det, and vl_pr to generate ROC, DET, and precision-recallcurves.ROC curves-vl_roc:tpr(k):scores按降序排列,排名小于或等于K-1的正样本占所有正样本的比例。tnr(k):排名大原创 2014-01-08 20:11:08 · 3046 阅读 · 0 评论 -
应用笔画宽度变换(SWT)来检测自然场景中的文本
Introduction: 应用背景:是盲人辅助系统,城市环境中的机器导航等计算机视觉系统应用的重要一步。获取文本能够为许多视觉任务提供上下文的线索,并且,图像检索算法的性能很大部分都依赖于对应的文本检测模块。 意义:传统的OCR应用于扫描文本,所以其依赖于把文本从背景像素中正确分离。这对于扫描文本来说是很简单的,但是自然图像由于存在色彩噪声,模糊,遮挡,很难将文本从背景中分离。 文章提出的原创 2014-06-25 11:30:17 · 5815 阅读 · 8 评论 -
笔画宽度变化(C++和matlab算法)
最近一直在看工作方面的书籍,把论文的事情搁置了,之前承诺的贴代码的事一直拖。现在把代码整理发上来,只有核心部分的,都不是我写的,我是网上整理下载的,matlab代码的效果比较差。全部文件网盘下载地址:http://pan.baidu.com/s/1qWwNMfM;1.C++代码下载地址:需要先安装opencv和boost库。boost库下载地址:http:/原创 2014-08-12 10:11:23 · 7143 阅读 · 12 评论 -
Parzen-Window Density Estimation(PWDE)
1.概率密度函数 在在数学中,连续型随机变量的概率密度函数(在不至于混淆时可以简称为密度函数)是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。而随机变量的取值落在某个区域之内的概率则为概率密度函数在这个区域上的积分。当概率密度函数存在的时候,分布函数是概率密度函数的积分。概率密度函数一般以小写“pdf”(Probability Density Function)原创 2014-10-19 20:11:28 · 12982 阅读 · 0 评论 -
图像预处理技术一
预处理的意义场景图像有着截然不同的成像特性如分辨率低、大小不一、光照不均等。这些特性影响着文本定位、词图像分割到字符识别等各个过程。在将场景条件下的文本图像输入到各个模块前,对图像进行必要的预处理,对定位和识别正确率的提高有一定的帮助。本章从以下几个方面对文本图像进行预处理:一是在图像进行聚类和显著性检测前,对场景文本图像进行颜色空间变换;二是得到文本词图像后,文本行可能不是以水平直线方式存在的,将原创 2015-06-17 09:42:21 · 34764 阅读 · 0 评论 -
simplefit_dataset
LOAD simplefit_dataset.MAT loads these two variables: simplefitInputs - a 1x67 matrix defining 67 input values. simplefitTargets - a 1x67 matrix defining 67 associated target values.原创 2013-10-17 15:13:30 · 3902 阅读 · 2 评论 -
倾斜校正-表格图像的校正
方法一:直接寻找表格边框的倾斜角如果表格中的水平边框能够很好经过预处理得到,那么通过定位这一边框。得到边框的起始点和斜率,就能得到相应的角度。通过角度就能够实现校正。难点在于如何得到边框的起始点。起始点的特点是起点的行坐标最小,终点的列坐标最小。方法二:采用熟悉的hough变换倾斜校正前处理和后处理都是一致,区别在于怎么得到倾斜的角度,而倾斜的角度是通过倾斜的直线得到。关键就在于检原创 2013-09-30 17:57:13 · 10578 阅读 · 7 评论 -
matlab system,fullfile, feval,contourc
1.matlab system在Matlab里可以通过system这个命令调出dos命令,比如:执行语句system('mkdir step1')就可以在当前目录下建立名为step1的文件夹!在实际编程中,可以结合函数exist使用。比如:ifexist('Step1') == 0system('mkdirStep1');end即:先判断当前目录下是否以存在名为Step1的子目原创 2014-01-08 20:05:44 · 3788 阅读 · 0 评论 -
机器学习中如何选择分类器
在机器学习中,分类器作用是在标记好类别的训练数据基础上判断一个新的观察样本所属的类别。分类器依据学习的方式可以分为非监督学习和监督学习。非监督学习顾名思义指的是给予分类器学习的样本但没有相对应类别标签,主要是寻找未标记数据中的隐藏结构。,监督学习通过标记的训练数据推断出分类函数,分类函数可以用来将新样本映射到对应的标签。在监督学习方式中,每个训练样本包括训练样本的特征和相对应的标签。监督学习的流程原创 2015-08-30 00:02:29 · 6938 阅读 · 0 评论 -
Matlab数据类型
今天写了一个读取多个图片(图片是个灰度图像)的程序,读取进来后对图片进行二值化,却发现输出的图片显示全黑。认真查看程序还是看不出问题,于是写了下面的程序能够显示黑白分明的图片。查看command windows变量区。发现cut(:,:,i)的数据类型是unit8,在看看help imshow的说明。由于已经二值化了,所以这个unit8只有0,1两个元素。256是白色。所以造成1的亮度太暗无法显示原创 2013-09-18 20:48:32 · 1690 阅读 · 0 评论 -
BP神经网络参数设置及实例
BP网络的训练函数 训练方法训练函数梯度下降法traingd有动量的梯度下降法traingdm自适应lr梯度下降法traingda自适应lr动量梯度下降法traingdx弹性梯度下降法trainrp转载 2013-11-18 16:07:53 · 26000 阅读 · 0 评论 -
Matlab mser(最大极值稳定区域)
一、函数detectMSERFeatures输入的是M*N的灰度图片。可以指定阈值刻度,区域范围,感兴趣区域等参数。输出的是MSERRegions class,即框住区域的椭圆由椭圆中心的坐标,椭圆的长短轴,椭圆的方向(有长轴与x方向形成的角),即区域内所有像素的坐标。 Detect MSER features and return MSERRegions obje原创 2014-06-10 21:29:08 · 5748 阅读 · 4 评论 -
科学预测世界杯-采用机器学习方法
最近不管是在哪,世界杯永远是大家闲聊的话题。而随着互联网的发展,购买足彩越发便利和火爆了,体彩不像福彩,我们可以根据各个球队的情况做一些猜测。但作为一名看世界杯只记的住场边广告的伪球迷,也想凑热闹买一把,怎么才能保证在前面几次比赛的基础上,比较科学靠谱的预测比赛结果呢?做为一名略懂机器学习的伪球迷,当然要发挥学科的优势来凑凑热闹预测一下。 机器学习算法很多,我们分别实现了用SVM,神经网原创 2014-06-27 23:04:33 · 4853 阅读 · 0 评论 -
matlab神经网络相关函数
mapminmax:通过把行的最大值和最小值映射到[-1 1]对矩阵进行处理 minmax:pr = minmax(P)若:P是R* Q的矩阵。那么返回值的是R*2的矩阵。每行都是P每行的最大最小值。>> b=magic(3) b = 8 1 6 3 5 7 4 9 2 >> a原创 2013-10-15 22:13:26 · 2373 阅读 · 0 评论 -
OpenCV_连通区域分析与标记(Connected Component Analysis-Labeling)
http://www.icvpr.com/connected-component-analysis-labeling/OpenCV_连通区域分析与标记(Connected Component Analysis-Labeling)【摘要】 本文主要介绍在CVPR和图像处理领域中较为常用的一种图像区域(Blob)提取的方法——连通区域分析法(连通区域标记法)。文中介绍了两种常见的连转载 2013-10-21 17:14:28 · 2463 阅读 · 0 评论