使用SVM分类器做颜色分类走过的坑

1、保存与调用训练模型,通常训练一个模型需要很长时间,如果我们每一次想使用这个模型都需要重新训练的话,会浪费大量时间,所以我们需要用到模型的保存与调用,用到了sklearn库中的joblib模块,具体用法为:

from sklearn.externals import joblib
joblib.dump(classifier,”train_model.m”)#使用dump函数保存,classifier为训练好的				分类器模型,双引号内的为所保存模型的名字,.m为保存模型的格式。
#从本地调回模型的语法为:
classifier = joblib.load(“/../../train_model.m”)#调用模型,双引号里的是模型存储的绝对路径。

2、测试训练模型,在测试集上测试加载的模型语法为:

classifier.predict(X_test)#X_test表示的是测试集。

3、sklearn中的classification_report函数主要用于显示主要分类指标的文本报告。
4、训练集的区分,SVM一般是针对二分类而言,所以要设置对影的训练集和训练label,训练集的分类:

class01=out_image_list[0]#标注为0和1的图像分别输出到out_image_list数组中
class02=out_image_list[1]
class_0=class01[class01!=0].reshape(-1,3)#转换数据存储形式
class_1=class02[class02!=0].reshape(-1,3)
相对应的label 设定:
color_average0=np.sum(class_0,axis=1)/class_0.shape[1]#(R+G+B)/3,灰度平均值作为特征向量矩阵
color_average1=np.sum(class_1,axis=1)/class_1.shape[1]

num_label1=len(color_average0)#得出训练集长度,方便下一步建立标记label数组
num_label2=len(color_average1)
train_data=np.r_[color_average0,color_average1]#设置训练输入数据集X
train_label=np.vstack((np.zeros((num_label1,1),dtype='uint8'),np.ones((num_label2,1),dtype='uint8')))#设置训练标签y

这里训练集含有两种类型,对应的标签应该也有两种类型,并且训练集与标签集的长度和维度都应该是一致的。

5、在进行SVM训练的时候,要注意选择对应的核函数,也就是初始化分类器,在对于核函数的选择,有时linear线形分类核函数并不能够很好的分类出两种类型,而只能分类出其中的一种,另一种的recall率为0,可以选择更换高斯核函数进行尝试:

#初始化SVM,训练分类器
params = {'kernel':'rbf'}
classifier1 = SVC()
classifier1.fit(train_data,train_label)#y_train.ravel()#扁平化处理,可去除警告,fit函数训练分类器

6、训练好的模型的保存与加载:

#模型的保存
#classifier1 = joblib.dump(classifier1,'/home/zhangqi/SVM/classifier1.pkl')
#模型的加载
#clf = joblib.load('/home/zhangqi/SVM/classifier1.pkl')

这里的pkl可以更改不固定,有的是使用的.m,有的是使用的.pkl,还有的用modle,这个可以依照需求自行查阅。
7、想将分类器应用到整幅或者多幅图像时,需要写一个循环函数,用于遍历图像中所有的像素点,将每个像素点放到分类器中进行识别,分类器会返回一个response,response含有两个值:-1与1,也就是我们前文定义的正负样本,我们可以根据这个response来进行重新规划像素点,从而实现图像的二分类。
8、在测试数据模型时,关于效果不好的时候注意调整分类器参数,如LinearSVC中的惩罚系数,SVC中gamma值等。

关于修改参数,我单独写了一篇博客,详见:

9、在测试程序运行时间时,我选择了time模块,具体实现方法为:

  from time import time 
    if __name__ == '__main__':
    	t1 = time()
    	.....#程序执行
    	t2 time()
    	time=t2-t1
    	print("time秒")

然而调试并不能通过,报错如下:

TypeError: 'float' object is not callable

单精度浮点类型追溯错误,我网上查了很多,这种类型的错误,各式各样,但是很少是关于我这种类型的,于是我开始更改float类型,强制format time的格式为float,结果可想而之,依旧报错,最后在一个同事的帮助下,将模块导入切换成如下,便可轻松解决问题:

import time 
if __name__ == '__main__':
	t1 = time.time()
	.....#程序执行
	t2 time.time()
	time=t2-t1
	print("time秒")

真的是,永远不要自以为是的认为这种情况是不可能出错的,路漫漫其修远兮,没改完所有的bug你就别说你什么bug都能改啊~

  • 3
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值