![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
ML
42~
这个作者很懒,什么都没留下…
展开
-
ML模型特点以及区别
线性回归优点:1、简单,运算速度块2、可以根据系数对变量做出解释缺点:1、对异常值敏感LR优点:1、形式简单,可解释性好2、模型效果好3、训练速度快4、资源占用少,尤其是内存5、方便输出结果的调整(人工设定阈值)缺点:1、准确率可能并不是很高2、很难处理数据不平衡的问题3、处理非线性数据麻烦4、LR本身无法筛选特征5、对异常值敏感SVM优点:...原创 2019-05-30 09:09:59 · 5663 阅读 · 0 评论 -
过拟合
原因样本数据问题样本数量太少;抽样方法错误,抽出的样本数据不能有效足够代表业务逻辑或业务场景。比如样本符合正态分布,却按均分分布抽样,或者样本数据不能代表整体数据的分布;样本里的噪音数据干扰过大;模型问题模型复杂度高 、参数太多;训练过度;权值学习迭代次数足够多(Overtraining),拟合了训练数据中的噪声和训练样例中没有代表性的特征.解决方式数据方面增加训练...原创 2019-06-09 15:25:45 · 147 阅读 · 0 评论 -
一些ML的经验
特征比数据量还大时,选择什么样的分类器?线性分类器,因为维度高的时候,数据一般在维度空间里面会比较稀疏,很有可能线性可分对于维度很高的特征,你是选择线性还是非线性分类器?理由同上对于维度极低的特征,你是选择线性还是非线性分类器?非线性分类器,因为低维空间可能很多特征都跑到一起了,导致线性不可分下面是吴恩达的见解:如果Feature的数量很大,跟样本数量差不多,...原创 2019-06-09 15:59:57 · 692 阅读 · 0 评论