- 博客(1)
- 收藏
- 关注
原创 常见数据挖掘算法和Python简单实现
1、K近邻算法 原理:计算待分类样本与每个训练样本的距离,取距离最小的K个样本,这k个样本,哪个类别占大多数,则该样本属于这个类别。 优点:1、无需训练和估计参数,2、适合多分类,3、适合样本容量比较大的问题 缺点:1、对测试样本内存开销大,2、可解释性差,无法生成规则,3、对样本量小的问题,容易误分 经验:K一般低于样本量的平方根,基于交叉验证 问题:类别判断:投票
2017-04-21 11:15:03 14032
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人