案例二:SVC真实数据案例——预测明天是否会下雨

1.导库导数据,探索特征

(1)将特征矩阵和标签分开,确定X和Y
(2)探索数据类型

X.info()

(3)探索缺失值——每个特征中缺失值的比例

X.isnull.mean()

(4)探索标签的分类

np.unique(Y)

2.分集,并优先探索标签

在现实中,应当先分训练集和测试集,再进行数据预处理。因为测试集在现实中往往是不可获得的,或者被假设为不可不可获取的,我们不希望建模的任何过程受到测试集数据的影响,否则的话,就相当于提前告诉模型一部分预测的答案。在这里,为了让案例尽量接近真是的样貌,所以采用了现实中的处理方式:先分训练集和测试集,再一步步进行预处理。

(1)分训练集和测试集,并恢复训练集和测试集的索引

(2)探索标签<

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值