机器学习实战 2-4 2-5

  程序清单2-4 和2-5大部分都是前边用过的,如果前边学得好,程序理解起来就会非常简单。
#程序清单2-4  分类器针对约会网站的测试代码
def datingClassTest():
    hoRatio = 0.10#这个值之后要用到,即选取整体数据的10%用于测试分类器
    datingDataMat,datingLabels = file2matrix('F:\\机器学习\\MLiA_SourceCode\\machinelearninginaction\\Ch02\\datingTestSet2.txt')#对原始数据处理,得到分类器可以处理的形式
    normMat,ranges,minVals = autoNorm(datingDataMat)#归一化数值后返回三个值,分别为归一化后的数值,每一列中最大值与最小值的差值,每一列的最小值
    m = normMat.shape[0]#得到normMat矩阵的行数
    numTestVecs = int(m*hoRatio)
    errorCount = 0.0#这个变量为分诶错误次数
    for i in range(numTestVecs):
        classifierResult = classify0(normMat[i,:],normMat[numTestVecs:m,:],\
                                     datingLabels[numTestVecs:m],3)     #对测试数据进行分类
        print('the classifier came back with:%d,the real answer is:%d' %(classifierResult,datingLabels[i]))
        if (classifierResult != datingLabels[i]):errorCount += 1.0#当测试的数据分类不正确时,errorCount+1
    print('the total error rate is : %f' %(errorCount/float(numTestVecs)))#打印出分类器的错误率

#程序清单2-5 约会网站预测函数
def classfyPerson():#这是真正与用户交互的程序,按照自己的习惯对原书的英文问答改为了中文,代码都是之前介绍过的,不重复做解释了,
    #唯一需要注意的是在python3.0中print与python2.0有较大差别,raw_input()不再适用
    resultList = ['讨厌','一般喜欢','非常喜欢']
    percentTats = float(input('打视频游戏所占时间比:'))
    ffMiles = float(input('飞行常客里程数:'))
    iceCream = float(input('每周消耗的冰淇淋公升数:'))
    datingDataMat,datingLabels = file2matrix('F:\\机器学习\\MLiA_SourceCode\\machinelearninginaction\\Ch02\\datingTestSet2.txt')
    normMat,ranges,minVals = autoNorm(datingDataMat)
    inArr = array([ffMiles,percentTats,iceCream])
    classifierResult = classify0((inArr-minVals)/ranges,normMat,datingLabels,3)
    print('你是否会喜欢这个人:%s' %resultList[classifierResult-1])

看一下运行结果

>>> k.classfyPerson()
打视频游戏所占时间比:10
飞行常客里程数:10000
每周消耗的冰淇淋公升数:0.5
你是否会喜欢这个人:一般喜欢

OK,到这里就成功的在数据上建立了分类器

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值