SVM分类模型工程化应用


1      序

         写这篇文章主要目的是总结经验,做了很多简省,把与该文章没有关系的东西删掉了,请大家谅解。本人是个初学者,有些问题的解决方法可能很笨,也有漏洞,请大家指正一下。

2      需求

我们做的是一个web应用,大家都知道一个web应用通常包含前台和后台。在我们的应用中,后台有一台服务器,且只部署一个实例,用于数据管理;前台有5台服务器,每台服务器上部署4个实例。对于初学者来说,可能不会遇到这样的部署情况,也就一个实例罢了,呵呵,慢慢来,大流量的web应用有很多讲究。像某部门的售票网站,就是没有处理好大流量的实例。在这方面,国内三座大山都做得不错了。

回归正题,下图是我们应用的大致框架图:


我们的需求是:

1.      SVM模型的原始训练数据存储在数据库中

2.      SVM训练过程在后台进行

3.      前台定时更新SVM模型数据

3      分析与设计

需求看上去比较简单,但是有一些需要注意的地方。

1.      后台训练数据会随时变更的,这里的变更可能是模型类别的改变(增加或减少),也可能是类别数据的改变(增加或减少)。

2.      后台改变了训练数据,需要尽快训练出模型,让前台更新,因此不是每次训练模型都进行特征计算,参数选择。可能直接使用默认的参数进行训练来减少训练时间。

3.      新模型数据如何保存,如何传给前台的每个实例。

4.      新模型数据如果有错,需要切换到一个默认的正常版本。

为了解决上述问题,我们试着采用的方案如下:

1.      每次训练数据改变后,执行一次模型训练程序,如果不采用默认参数训练,则往redis中设置一个值,模型训练程序每次都去redis中读取进行判断。当次训练结束后需从redis中清除这个值。

2.      模型训练完成后,把模型文件上传到文件系统,并在redis中设置版本号。

3.      前台每个实例启动时从默认的版本加载,我们的默认版本直接放在了war包里面。每隔1分钟去redis中获取版本号与当前版本号对比,进行更新。

4.      通过手动更新redis中版本号,如设为0,使每个实例重新加载默认版本。这里会有一个问题,设为0后,每隔一分钟又会重新加载,因此需要记录上一次是否成功加载过默认版本。如果是,就不用加载了。

4      遗留问题

如何验证前后台数据的一致性,毕竟是通过网络传输的。目前,我们并没有做验证。

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
这是opencv svm图像分类的整个工程代码,在VS2010下打开即可。整个工程文件以及我的所有训练的图片存放在这里,需要的可以下载,自己在找训练图片写代码花了很多时间,下载完后自行解压,训练图片和测试图片可以从这免费下载http://download.csdn.net/detail/always2015/8944959,project data文件夹直接放在D盘就行,里面存放训练的图片和待测试图片,以及训练过程生成的间文件,现在这个下载object_classfication_end则是工程文件,我用的是vs2010打开即可,下面工程里有几个要注意的地方: 1、在这个模块使用到了c++的boost库,但是在这里有一个版本的限制。这个模块的代码只能在boost版本1.46以上使用,这个版本以下的就不能用了,直接运行就会出错,这是最需要注意的。因为在1.46版本以上对比CsSVM这个类一些成员函数做了一些私有化的修改,所以在使用该类初始化对象时候需要注意。 2、我的模块所使用到的函数和产生的间结果都是在一个categorizer类声明的,由于不同的执行阶段间结果有很多个,例如:训练图片聚类后所得到单词表矩阵,svm分类器的训练的结果等,间结果的产生是相当耗时的,所以在刚开始就考虑到第一次运行时候把他以文件XML的格式保存下来,下次使用到的时候在读取。将一个矩阵存入文本的时候可以直接用输出流的方式将一个矩阵存入,但是读取时候如果用输入流直接一个矩阵变量的形式读取,那就肯定报错,因为输入流不支持直接对矩阵的操作,所以这时候只能对矩阵的元素一个一个进行读取了。 3、在测试的时候,如果输入的图片太小,或者全为黑色,当经过特征提取和单词构造完成使用svm进行分类时候会出现错误。经过调试代码,发现上述图片在生成该图片的单词的时候所得到的单词矩阵会是一个空矩阵,即该矩阵的行列数都为0,所以在使用svm分类器时候就出错。所以在使用每个输入图片的单词矩阵的时候先做一个判断,如果该矩阵行列数都为0,那么该图片直接跳过。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值