关闭

干货| 针对实际数据做机器学习的相关处理

标签: 机器学习数据
186人阅读 评论(0) 收藏 举报
分类:

1.首先是数据样本问题

       实际上在教学中,构建分类器时,样本类都是平衡的——也就是说,每个类中的样本数量是大致相同的。数据库通常是净化过的,这样老师才能够把注意力集中在教授特定算法或技巧上,而不被其它问题干扰。

      但是在实际真是生活中,数据样本参差不齐,不会平衡,存在大量的误差甚至错误点,导致不平衡。

       解决可以使用过采样和欠采样,待续。。。。。。

1
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:340241次
    • 积分:4799
    • 等级:
    • 排名:第7617名
    • 原创:112篇
    • 转载:351篇
    • 译文:6篇
    • 评论:17条
    最新评论