探究Smote算法对决策树分类结果有何影响?

本文通过对比实验,使用决策树和结合Smote算法的决策树对UCI气球数据集进行分类,探讨Smote如何改善类不平衡问题并提升分类精度。
摘要由CSDN通过智能技术生成

描述:我将用决策树分类和Smote+决策树组合对同一组数据进行实验,比较两次的分类结果精度,从而探究Smote算法对决策树分类结果有何影响?

数据:数据来源于UCI机器学习数据库中的气球数据,有5列:color、chicun、act、age、inflated。共有20*5组数据。

smote算法

import random
from sklearn.neighbors import NearestNeighbors
import numpy as np
import pandas as pd
from pandas import  *
from numpy import *
import csv
from sklearn import tree
from sklearn.tree import export_graphviz

class Smote:
    def __init__(self,samples,N,k=5):
        self.n_samples,self.n_attrs = samples.shape
        self.N = N
        self.k = k
        self.samples = samples
        self.newindex = 0



    @property
    def over_sampling(self):
        N = int(self.N/100)
        self.synthetic = np.zeros((self.n_samples * N,self.n_attrs))
        neighbors = NearestNeighbors(n_neighbors=self.k).fit(self.samples)
        print 'neighbors',neighbors

        for i 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值