opencv SVM图像分类工程文件
这是opencv svm图像分类的整个工程代码,在VS2010下打开即可。整个工程文件以及我的所有训练的图片存放在这里,需要的可以下载,自己在找训练图片写代码花了很多时间,下载完后自行解压,训练图片和测试图片可以从这免费下载http://download.csdn.net/detail/always2015/8944959,project data文件夹直接放在D盘就行,里面存放训练的图片和待测试图片,以及训练过程中生成的中间文件,现在这个下载object_classfication_end则是工程文件,我用的是vs2010打开即可,下面工程里有几个要注意的地方: 1、在这个模块中使用到了c++的boost库,但是在这里有一个版本的限制。这个模块的代码只能在boost版本1.46以上使用,这个版本以下的就不能用了,直接运行就会出错,这是最需要注意的。因为在1.46版本以上中对比CsSVM这个类一些成员函数做了一些私有化的修改,所以在使用该类初始化对象时候需要注意。 2、我的模块所使用到的函数和产生的中间结果都是在一个categorizer类中声明的,由于不同的执行阶段中间结果有很多个,例如:训练图片聚类后所得到单词表矩阵,svm分类器的训练的结果等,中间结果的产生是相当耗时的,所以在刚开始就考虑到第一次运行时候把他以文件XML的格式保存下来,下次使用到的时候在读取。将一个矩阵存入文本的时候可以直接用输出流的方式将一个矩阵存入,但是读取时候如果用输入流直接一个矩阵变量的形式读取,那就肯定报错,因为输入流不支持直接对矩阵的操作,所以这时候只能对矩阵的元素一个一个进行读取了。 3、在测试的时候,如果输入的图片太小,或者全为黑色,当经过特征提取和单词构造完成使用svm进行分类时候会出现错误。经过调试代码,发现上述图片在生成该图片的单词的时候所得到的单词矩阵会是一个空矩阵,即该矩阵的行列数都为0,所以在使用svm分类器时候就出错。所以在使用每个输入图片的单词矩阵的时候先做一个判断,如果该矩阵行列数都为0,那么该图片直接跳过。
Neural Networks: Tricks of the Trade
Neural Networks: Tricks of the Trade
TensorFlow MNIST数据集下载脚本input_data.py
TensorFlow的官方文档里面,关于MNIST这个例子下载数据用的文件。 原始文件url打不开,提供一个从其他渠道找到的资源供大家使用~
基于android平台的拍照以及上传到服务器,其中包括服务器部分的设计
基于android平台的拍照以及上传到服务器,其中包括服务器部分的设计
实现Android本机 视频录制播放 边录边放
实现Android本机 视频录制播放 边录边放
word调用操作
这里演示了一个word操作的最最简单的例子,开发环境是windows XP + VC6(MFC APP) + word2010, 实现了打开一个文档,向其写入指定的内容,再关闭文档的功能。这里最主要的关键点还是在于先封装一个word操作类,这个封装好的类就可以拿到其他地方去用了,而且非常方便。
基于字符识别的LPR系统
基于字符识别的LPR系统
ocr识别图像
ocr识别图像,将图像文字转换为文本文字
linux流媒体播放
1 、 能够播放歌曲文件
2 、 能通过触摸屏按钮控制mplayer 播放、暂停、快进、快退、上一首、下一首
3 、 能通过物理按键控制mplayer 播放、暂停、快进、快退、上一首、下一首
4 、 显示歌曲列表,当前播放歌曲须要反显,点击对应歌曲能切换
5 、 显示歌曲信息
6 、 显示歌曲时间
7 、 显示歌曲进度条
8 、 显示歌曲对应的歌词,并且能够和歌曲同步
9 、 能够自动换歌(播放完一首歌曲后,自动播放下一首歌)
二维码的识别程序
vc++写的QR code二维码的解码器,不包含编码,包括图形过滤、探测、校正、纠错等,可用于参考。
注:本程序的解码功能尚未完成
条形码识别源代码
通过对图像的剪切,灰度化,二值化,去噪点,来识别条形码、二维码。本源码附参考文献和测试图像。
二维码解码器
此程序为二维码的解码程序,编译运行无错误,可出现最终的处理界面
二维码解码
本程序为二维码解码器源代码,可用vc软件实现,经调试运行可出现处理界面。
二维码生成程序
可以实现任意输入的文本信息转换成二维码图形,经反复试验程序是可行的
ICA进行语音的实时采集,加噪分离
盲源分离采用独立分量ICA进行对加噪的实时语音信号进行分离的matlab编程