kaggle入门digits Recognizer

该博客介绍了在Kaggle digits Recognizer问题中,使用KNN、随机森林(RF)和SVM结合PCA进行数字识别的方法。作者通过sklearn、pandas和numpy库实现,指出KNN的数据提取过程冗长,RF在1分钟内达到96%的准确率,而SVM结合PCA进行了特征降维。
摘要由CSDN通过智能技术生成

经典的数字识别问题,调用Knn,  randforest,   svm&pca这3种方法。

主要利用的是sklearn库,pandas库, numpy库


1.knn是是看了别人的博客,然后自己动手重复了一下,后来发现这种方法的提取数据太冗长了,后续会贴出更精炼的code

from numpy import *
import operator
import csv
def loadTrainData():
    l = []
    with open('train.csv') as file:
        lines = csv.reader(file)
        for line in lines:
            l.append(line)
    l.remove(l[0])
    l = array(l)
    label = l[:,0]
    data = l[:,1:]
    return nomalizing(toInt(data)),toInt(label)
    #label 1*42000 data 42000*784
    #return data label

def toInt(array):
    array = mat(array)
    m,n = shape(array)
    newArray = zeros((m,n))
    for i in xrange(m):
        for j in xrange(n):
            newArray[i,j] = int(array[i,j])
    return newArray

def nomalizing(array):
    m
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值