不平衡数据分类

最新推荐文章于 2024-07-26 00:35:11 发布

yzw哒哒哒

最新推荐文章于 2024-07-26 00:35:11 发布

阅读量717

点赞数 3

文章标签：分类数据挖掘人工智能

本文链接：https://blog.csdn.net/weixin_53158501/article/details/127317111

版权

任务描述

本关任务：完成不平衡数据分类的学习。

编程要求

根据提示，在右侧编辑器补充代码，完成随机过采样对不平衡数据分类。

测试说明

平台会对你编写的代码进行测试：

预期输出：

<bound method DataFrame.info of Pregnancies Glucose ... DiabetesPedigreeFunction Age
0 6 148 ... 0.627 50
1 1 85 ... 0.351 31
2 8 183 ... 0.672 32
3 1 89 ... 0.167 21
4 0 137 ... 2.288 33
5 5 116 ... 0.201 30
6 3 78 ... 0.248 26
7 10 115 ... 0.134 29
8 2 197 ... 0.158 53
9 8 125 ... 0.232 54
10 4 110 ... 0.191 30
11 10 168 ... 0.537 34
12 10 139 ... 1.441 57
13 1 189 ... 0.398 59
14 5 166 ... 0.587 51
15 7 100 ... 0.484 32
16 0 118 ... 0.551 31
17 7 107 ... 0.254 31
18 1 103 ... 0.183 33
19 1 115 ... 0.529 32
20 3 126 ... 0.704 27
21 8 99 ... 0.388 50
22 7 196 ... 0.451 41
23 9 119 ... 0.263 29
24 11 143 ... 0.254 51
25 10 125 ... 0.205 41
26 7 147 ... 0.257 43
27 1 97 ... 0.487 22
28 13 145 ... 0.245 57
29 5 117 ... 0.337 38
.. ... ... ... ... ...
970 8 176 ... 0.467 58
971 0 167 ... 0.839 30
972 0 109 ... 0.855 38
973 6 125 ... 0.565 49
974 8 105 ... 0.239 45
975 0 179 ... 0.455 22
976 0 137 ... 2.288 33
977 7 159 ... 0.383 36
978 0 162 ... 0.759 25
979 2 174 ... 0.646 24
980 1 128 ... 0.613 24
981 0 179 ... 0.686 23
982 3 171 ... 0.199 24
983 0 131 ... 0.196 22
984 5 116 ... 0.660 35
985 2 118 ... 0.693 21
986 5 124 ... 0.220 38
987 5 112 ... 0.261 41
988 3 139 ... 0.402 22
989 10 148 ... 1.001 51
990 8 124 ... 0.687 52
991 7 114 ... 0.258 42
992 4 183 ... 0.212 36
993 0 146 ... 0.334 28
994 5 130 ... 0.956 37
995 10 125 ... 0.205 41
996 7 161 ... 0.165 47
997 1 181 ... 0.328 38
998 6 119 ... 1.318 33
999 7 103 ... 0.344 31
[1000 rows x 8 columns]>

开始你的任务吧，祝你成功！

代码如下：

import pandas as pd
from imblearn.over_sampling import RandomOverSampler

data_url = "/data/workspace/myshixun/step1/diabetes.csv"
df = pd.read_csv(data_url)
X = df.iloc[:,0:8]
y=df.iloc[:,8]
###### Begin ######
# 随机过采样
ros = RandomOverSampler(random_state=0)
###### End ######
X_resampled, y_resampled = ros.fit_resample(X, y)
# 显示采样后的数据
print(X_resampled.info)