机器学习-1

zsjmfy

于 2017-03-17 16:57:14 发布

阅读量332

点赞数

分类专栏：个人记录

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zsjmfy/article/details/62891785

版权

个人记录专栏收录该内容

16 篇文章 0 订阅

订阅专栏

基本问题的经典算法
分类：svm、最大熵、adaboost、分类回归树、随机森林
回归：分类回归树、随机森林、GBDT
排序：GBRank
聚类：K-Means
结构标注：隐马尔可夫模型、条件随机场。

机器学习=表示（算法、特征的表示）+评价（loss+cost评价算法好坏的函数）+优化（寻找使评价函数得分最高的搜索方法比如梯度下降、牛顿法）

如何权衡训练误差和预测误差（拟合能力和泛化能力，bias-variance，损失函数和推广能力、经验风险和结构风险）
a. 正则化。正则化是结构风险最小化策略的实现，与模型复杂度相关，减少参数的候选空间，让模型更加简洁。
b. 交叉验证。交叉验证的思想是将训练集随即划分成若干个块，每个块称为训练集和验证集，训练集用于训练模型，验证集用于评估训练模型的好坏，在每个块上找到风险最小化函数，然后综合把结果综合起来考虑。
为何梯度下降时需要输入特征归一化？
优化过程中，不同尺度下的参数会使梯度步长更新不一致，造成收敛速度慢；不同尺度的参数也会给计算精度产生影响；模型的正则化效果会由于尺度问题造成偏差。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。