数据集特点

1.训练集各类样本比例不均(样本不平衡)

方法:

1.过采样:

  缺点:错误(噪声)样本可能造成较大影响

2.欠采样:

  缺点:丢样本 损失较大

3.扩大数据集:

  a.抽取部分样本,求平均

  b.随机噪声

(2.如果训练集样本与测试集样本本身有巨大的gap,训练的过程总是让人煎熬)

 

  

转载于:https://www.cnblogs.com/alilliam/p/10774017.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值