你可能不知道的一些机器学习事儿


                                  你可能不知道的一些机器学习事儿

       最近零零碎碎地看了很多机器学习方法的东西,增长了不少新知识。有很多小技巧虽然不会出现在教科书中,但它们真的很实用。

(1)随机森林模型不适合用稀疏特征。

(2)测试集必须使用与训练集相同的方法进行预处理。

(3)L1正则(特征选择)最小样本数目m与特征n呈log关系,m = O(log n) ;

         L2正则(旋转不变)最小样本数目m与特征n呈线性关系,m = O(n) 。

(4)标准的PCA是一种线性转换技术。

(5)呈长尾分布的特征通常需要进行对数转换。

(6)线性SVM适合小样本。

(7)AUC适合作为类不平衡问题的衡量标准。

(8)在nested k-foldcross validation中,“外层循环”的目的是模型评估,“内层循环”的目的是模型选择。

(9)在样本数量较少的情况下,极大似然估计的效果比普通的最小二乘法差。


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值