OneR算法python实现

最新推荐文章于 2023-02-27 15:44:17 发布

29DCH

最新推荐文章于 2023-02-27 15:44:17 发布

阅读量665

点赞数

分类专栏： python python数据挖掘机器学习文章标签：数据分类算法

本文链接：https://blog.csdn.net/CowBoySoBusy/article/details/80509038

版权

python 同时被 3 个专栏收录

23 篇文章 1 订阅

订阅专栏

机器学习

10 篇文章 0 订阅

订阅专栏

python数据挖掘

5 篇文章 0 订阅

订阅专栏

OneR算法（分类应用，寻找最佳的特征值用于分类）
计算数据错误率，不属于最多类的特征值个数，把各个取值的错误率相加，选取错误率最低的特征作为唯一的分类准则(One Rule)，用于接下来的分类。
//OneR

from collections import defaultdict
from operator import itemgetter
#参数分别是数据集，类别数组，选好的特征索引值，特征值
def train_feature_value(X,y_true,feature_index,value):
    class_counts=defaultdict(int)
    for sample,y in zip(X,y_true):
        if sample[feature_index]==value:
            class_counts[y]+=1
    sorted_class_counts=sorted(class_counts.items(),key=itemgetter(1),reverse=True)
    most_frequent_class=sorted_class_counts[0][0]
    incorrect_predictions=[class_count for class_value,class_count
                       in class_counts.items()
                       if class_value!=most_frequent_class]
    error=sum(incorrect_predictions)
    return most_frequent_class,error

def train_on_feature(X,y_true,feature_index):
    values=set(X[:,feature_index])
    predictors={}
    errors=[]
    for current_value in values:
        most_frequent_class,error,error = train_feature_value(X,y_true,feature_index,current_value)
        predictors[current_value]=most_frequent_class
        errors.append(error)
    total_error=sum(errors)
    return predictors,total_error

29DCH

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
OneR算法python实现

OneR算法（分类应用，寻找最佳的特征值用于分类）计算数据错误率，不属于最多类的特征值个数，把各个取值的错误率相加，选取错误率最低的特征作为唯一的分类准则(One Rule)，用于接下来的分类。 //OneRfrom collections import defaultdictfrom operator import itemgetter#参数分别是数据集，类别数组，选好的特征索...
复制链接

扫一扫