机器学习数据倾斜处理手法

最新推荐文章于 2022-07-12 21:49:47 发布

Kwjdefulgn

最新推荐文章于 2022-07-12 21:49:47 发布

阅读量1.1k

点赞数

文章标签：机器学习 python 人工智能

本文链接：https://blog.csdn.net/weixin_42038564/article/details/121208183

版权

1. SMOTE

smote属于过采样，但过采样过程中采用了KNN，具体的算法实现流程如下图。
在这里插入图片描述

具体代码实现如下：
参考链接：https://blog.csdn.net/panda_zjd/article/details/79200493

#!/usr/bin/env python2
# -*- coding: utf-8 -*-
from sklearn.neighbors import NearestNeighbors
import numpy as np
import warnings
from sklearn.datasets import load_iris
warnings.filterwarnings("ignore")

class Smote(object):
    """data为少数类"""
    # N 为采样原样品的N%, 若N > 100, 则N/100的整数部分直接全拿原始data，N%100余数部分随机从原始data中挑，这样构成初始的sample集合
    def __init__(self,data,N=100,k=5):
        self.data = data
        self.N = N 
        self.k = k+1
        self.n_attrs = data.shape[1]

    def oversample

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Kwjdefulgn

关注关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
机器学习数据倾斜处理手法

1. SMOTEsmote属于过采样，但过采样过程中采用了KNN，具体的算法实现流程如下图。具体代码实现如下：参考链接：https://blog.csdn.net/panda_zjd/article/details/79200493#!/usr/bin/env python2# -*- coding: utf-8 -*-from sklearn.neighbors import NearestNeighborsimport numpy as npimport warningsfrom
复制链接

扫一扫