imblearn库 怎样安装_如何使用imblearn和SMOTE生成分类合成样本?

本文介绍了如何在分类数据集中使用imblearn库的SMOTE(Synthetic Minority Over-sampling Technique)生成合成样本。作者遇到的问题是SMOTE生成的数据点为浮点数而非整数,适合于分类任务。通过LabelEncoder将分类特征转换为整数,然后应用SMOTE进行过采样,最后发现生成的合成数据不是期望的整数类型。
摘要由CSDN通过智能技术生成

我正在寻找使用imblearn的SMOTE为机器学习算法生成合成样本。我有几个分类特征,我已经使用sklearn预处理.LabelEncoder转换为整数。如何使用imblearn和SMOTE生成分类合成样本?

我遇到的问题是,当我使用smote生成合成数据时,数据点变成浮点数而不是我需要用于分类数据的整数。

from collections import Counter

from sklearn.datasets import make_classification

from imblearn.over_sampling import SMOTE

import pandas as pd

from matplotlib import pyplot as plt

from sklearn.decomposition import PCA

import numpy as np

from sklearn import preprocessing

if __name__ == '__main__':

df = pd.read_csv('resample.csv')

y = df['Result']

accounts = df['Account Number']

df.drop('Result',axis=1,inplace=True)

df.drop('Account Number', axis=1, inplace=True)

df.fillna(value=0, inplace=True)

le = preprocessing.LabelEncoder()<

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值