使用SVM分类器做颜色分类走过的坑

最新推荐文章于 2024-06-30 17:10:06 发布

莫负好春光

最新推荐文章于 2024-06-30 17:10:06 发布

阅读量2.7k

点赞数 3

分类专栏：深度学习笔记 SVM 文章标签： SVM

本文链接：https://blog.csdn.net/weixin_39975436/article/details/89024205

版权

深度学习笔记同时被 2 个专栏收录

3 篇文章 0 订阅

订阅专栏

SVM

2 篇文章 1 订阅

订阅专栏

1、保存与调用训练模型，通常训练一个模型需要很长时间，如果我们每一次想使用这个模型都需要重新训练的话，会浪费大量时间，所以我们需要用到模型的保存与调用，用到了sklearn库中的joblib模块，具体用法为：

from sklearn.externals import joblib
joblib.dump(classifier,”train_model.m”)#使用dump函数保存，classifier为训练好的				分类器模型，双引号内的为所保存模型的名字，.m为保存模型的格式。
#从本地调回模型的语法为：
classifier = joblib.load(“/../../train_model.m”)#调用模型，双引号里的是模型存储的绝对路径。

2、测试训练模型，在测试集上测试加载的模型语法为：

classifier.predict(X_test)#X_test表示的是测试集。

3、sklearn中的classification_report函数主要用于显示主要分类指标的文本报告。
4、训练集的区分，SVM一般是针对二分类而言，所以要设置对影的训练集和训练label，训练集的分类：

class01=out_image_list[0]#标注为0和1的图像分别输出到out_image_list数组中
class02=out_image_list[1]
class_0=class01[class01!=0].reshape(-1,3)#转换数据存储形式
class_1=class02[class02!=0].reshape(-1,3)
相对应的label 设定：
color_average0=np.sum(class_0,axis=1)/class_0.shape[1]#（R+G+B）/3，灰度平均值作为特征向量矩阵
color_average1=np.sum(class_1,axis=1)/class_1.shape[1]

num_label1=len(color_average0)#得出训练集长度，方便下一步建立标记label数组
num_label2=len(color_average1)
train_data=np.r_[color_average0,color_average1]#设置训练输入数据集X
train_label=np.vstack((np.zeros((num_label1,1),dtype='uint8'),np.ones((num_label2,1),dtype='uint8')))#设置训练标签y

这里训练集含有两种类型，对应的标签应该也有两种类型，并且训练集与标签集的长度和维度都应该是一致的。

5、在进行SVM训练的时候，要注意选择对应的核函数，也就是初始化分类器，在对于核函数的选择，有时linear线形分类核函数并不能够很好的分类出两种类型，而只能分类出其中的一种，另一种的recall率为0，可以选择更换高斯核函数进行尝试：

#初始化SVM，训练分类器
params = {'kernel':'rbf'}
classifier1 = SVC()
classifier1.fit(train_data,train_label)#y_train.ravel()#扁平化处理，可去除警告,fit函数训练分类器

6、训练好的模型的保存与加载：

#模型的保存
#classifier1 = joblib.dump(classifier1,'/home/zhangqi/SVM/classifier1.pkl')
#模型的加载
#clf = joblib.load('/home/zhangqi/SVM/classifier1.pkl')

这里的pkl可以更改不固定，有的是使用的.m，有的是使用的.pkl，还有的用modle，这个可以依照需求自行查阅。
7、想将分类器应用到整幅或者多幅图像时，需要写一个循环函数，用于遍历图像中所有的像素点，将每个像素点放到分类器中进行识别，分类器会返回一个response，response含有两个值：-1与1，也就是我们前文定义的正负样本，我们可以根据这个response来进行重新规划像素点，从而实现图像的二分类。
8、在测试数据模型时，关于效果不好的时候注意调整分类器参数，如LinearSVC中的惩罚系数，SVC中gamma值等。

关于修改参数，我单独写了一篇博客，详见：

9、在测试程序运行时间时，我选择了time模块，具体实现方法为：

  from time import time 
    if __name__ == '__main__':
    	t1 = time()
    	.....#程序执行
    	t2 time()
    	time=t2-t1
    	print("time秒")

然而调试并不能通过，报错如下：

TypeError: 'float' object is not callable

单精度浮点类型追溯错误，我网上查了很多，这种类型的错误，各式各样，但是很少是关于我这种类型的，于是我开始更改float类型，强制format time的格式为float，结果可想而之，依旧报错，最后在一个同事的帮助下，将模块导入切换成如下，便可轻松解决问题：

import time 
if __name__ == '__main__':
	t1 = time.time()
	.....#程序执行
	t2 time.time()
	time=t2-t1
	print("time秒")

真的是，永远不要自以为是的认为这种情况是不可能出错的，路漫漫其修远兮，没改完所有的bug你就别说你什么bug都能改啊～

莫负好春光

关注

3
点赞
踩
15

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录