Kaggle入门模板:以手写识别Digit Recognizer为例

本文以Kaggle的Digit Recognizer挑战为例,介绍如何使用sklearn中的支持向量机(SVM)进行多分类手写数字识别。核函数采用高斯核(rbf),C参数设为5。通过训练和测试,发现SVM在效率上优于KNN,但准确率可能较低。文章还分享了在Kaggle提交过程中遇到的浮点数标签问题和提交注意事项。
摘要由CSDN通过智能技术生成

首先本文参考了点击打开链接 这篇博客,然后可能时间有点久远,Kaggle的这道题给的数据文档和之前的不一样了,以及还有一些注意点这篇文章里没有突出。因此这里重新做个总结,希望大家能早点入个门。

这里我使用的sklearn中的支持向量机来解决手写识别问题。这里的svm是可以解决多分类问题的。核函数使用的是高斯核(rbf),松弛变量c选择的是5.

kaggle这道题一共提供了3个文件:train.csv,test.csv,sample_submission.csv 。 分别表示训练集,测试集,提交样例。

下面上python代码。本人的macbook pro16,运行时间为575秒。svm的准确率在这个问题上可能不及knn,但是运行的效率要比knn高了许多。。。

#!/usr/bin/python  
# -*- coding: utf-8 -*-  
  
from numpy import *  
from sklearn import svm    
import csv   
import datetime

#把数组中的字符串转换成整数
def toInt(array): 
    array=mat(array)  
    
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值