机器学习——adaboost

最新推荐文章于 2021-03-15 23:53:59 发布

韩绘锦

最新推荐文章于 2021-03-15 23:53:59 发布

阅读量154

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/weixin_45569785/article/details/103447753

版权

机器学习专栏收录该内容

37 篇文章 0 订阅

订阅专栏

在这里插入图片描述

from numpy import *
def loadSimpData():
    datMat=matrix([1,2],[2,1],[1,1],[1,1],[2,1])
    classLabels=[1,1,-1,-1,-1]
    return datMat,classLabels
def loadDataSet(fileName):
    numFeat=len(open(fileName).readline().split('\t'))
    dataMat=[];labelMat=[]
    fr=open(fileName)
    for line in fr.readlines():
        lineArr=[]
        curLine=line.strip().split('\t')
        for i in range(numFeat-1):
            lineArr.append(float(curLine[i]))
        dataMat.append(lineArr)
        labelMat.append(float(curLine[-1]))
    return dataMat,labelMat
def stumpClassify(dataMatrix,dimen,threshVal,threshIneq):
    retArray=ones((shape(dataMatrix)[0],1))
    if threshIneq=='lt':
        retArray[dataMatrix[:,dimen]<=threshVal]=-1.0
    else:
        retArray[dataMatrix[:,dimen]>threshVal]=-1.0
    return retArray
def buildStump(dataArr,classLabels,D):
    dataMatrix=mat(dataArr);labelMat=mat(classLabels).T
    m,n=shape(dataMatrix)
    numSteps=10.0;bestStump={};bestClasEst=mat(zeros((m,1)))
    minError=inf
    for i in range(n):
        rangeMin=dataMatrix[:,i].min();rangeMax=dataMatrix[:,i].max()
        stepSize=(rangeMax-rangeMin)/numSteps
        for j in range(-1,int(numSteps)+1):
            for inequal in ['lt','gt']:
                threshVal=(rangeMin+float(j)*stepSize)
                predictedVals=stumpClassify(dataMatrix,i,threshVal,inequal)
                errArr=mat(ones((m,1)))
                errArr[predictedVals==labelMat]=0
                weightedError=D.T*errArr
                if weightedError<minError:
                    minError=weightedError
                    bestClasEst=predictedVals.copy()
                    bestStump['dim']=i
                    bestStump['thresh']=threshVal
                    bestStump['ineq']=inequal

    return bestStump,minError,bestClasEst
def adaBoostTrainDS(dataArr,classLabels,numIt=40):
    weakClassArr=[]
    m=shape(dataArr)[0]
    D=mat(ones((m,1))/m)
    aggClassEst=mat(zeros((m,1)))
    for i in range(numIt):
        bestStump,error,classEst=buildStump(dataArr,classLabels,D)
        alpha=float(0.5*log((1.0-error)/max(error,1e-16)))
        bestStump['alpha']=alpha
        weakClassArr.append(bestStump)
        expon=multiply(-1*alpha*mat(classLabels).T,classEst)
        D=multiply(D,exp(expon))
        D=D/D.sum()
        aggClassEst+=alpha*classEst
        aggErrors=multiply(sign(aggClassEst)!=mat(classLabels).T,ones((m,1)))
        errorRate=aggErrors.sum()/m
        print("total error :",errorRate)
        if errorRate==0.0:
            break
        return weakClassArr,aggClassEst

def adaClassify(datToClass,classifierArr):
    dataMatrix=mat(datToClass)
    m=shape(dataMatrix)[0]
    aggClassEst=mat(zeros((m,1)))
    for i in range(len(classifierArr)):
        classEst=stumpClassify(dataMatrix,classifierArr[i]['dim'],classifierArr[i]['thresh'],classifierArr[i]['ineq'])
        aggClassEst+=classifierArr[i]['alpha']*classEst
        print(aggClassEst)
    return sign(aggClassEst)
dataMat,labelMat=loadDataSet('.\horseColicTraining2.txt')
datMat,labelmat=loadDataSet('.\horseColicTest2.txt')
weakClassArr,aggClassEst=adaBoostTrainDS(dataMat,labelMat)
print(weakClassArr)
a=adaClassify(datMat,weakClassArr)
print(a)

在这里插入图片描述

韩绘锦

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习——adaboost

from numpy import *def loadSimpData(): datMat=matrix([1,2],[2,1],[1,1],[1,1],[2,1]) classLabels=[1,1,-1,-1,-1] return datMat,classLabelsdef loadDataSet(fileName): numFeat=len(open(f...
复制链接

扫一扫