使用python对决策树算法进行学习

最新推荐文章于 2023-11-06 21:54:44 发布

小游园

最新推荐文章于 2023-11-06 21:54:44 发布

阅读量318

点赞数

分类专栏：智能钻完井 Python在石油工程中应用

本文链接：https://blog.csdn.net/s0302017/article/details/106625175

版权

#-*-coding:utf-8-*-
from math import log
import operator

def calcShanonEnt(dataSet):
    '''
    计算给定数据集的香农熵
    :param dataSet:
    :return:shanonEnt
    '''
    numEntries = len(dataSet)
    labelCounts={}
    for featVec in dataSet:
        currentLabel = featVec[-1]
        if currentLabel not in labelCounts.keys():
            labelCounts[currentLabel]=0
        labelCounts[currentLabel] +=1
    shanonEnt = 0.0
    for key in labelCounts:
        prob= float(labelCounts[key])/numEntries
        shanonEnt -= prob*log(prob,2)
    return shanonEnt
def splitDataSet(dataSet,axis,value):
    '''
    按照给特定特征划分数据集
    :param dataSet:
    :param axis:
    :param value:
    :return:
    '''
    retDataSet=[]
    for featVec in dataSet:
        if featVec[axis] == value:
            reducedFeatVec = featVec[:axis]
            reducedFeatVec.extend(featVec[ax

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

小游园

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
使用python对决策树算法进行学习

#-*-coding:utf-8-*-from math import logimport operatordef calcShanonEnt(dataSet): ''' 计算给定数据集的香农熵 :param dataSet: :return:shanonEnt ''' numEntries = len(dataSet) labelCounts={} for featVec in dataSet: currentLab.
复制链接

扫一扫