Advice for applying Machine Learning -- Andrew Ng

最新推荐文章于 2020-07-21 22:32:58 发布

zealscott

最新推荐文章于 2020-07-21 22:32:58 发布

阅读量197

点赞数

分类专栏： MachineLearning 文章标签：机器学习吴恩达

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/crazy_scott/article/details/89342223

版权

MachineLearning 专栏收录该内容

16 篇文章 1 订阅

订阅专栏

Key ideas:

Diagnostics for debugging learning algorithms.
Error analyses and ablative analysis.
How to get started on a machine learning problem.
- Premature (statistical) optimization.

Debugging Learning Algorithms

Bias vs Variance

一般来说，在讨论我们模型的可用性时，考虑bias和variance两个方面。

我们可以通过Test data和Train data的特征进行推测

Typical learning curve for high variance（Overfitting）:

主要的特征表示为：

当样本量增大时Test error也依然减小，表明更多的数据有帮助
Large gap between training and test error

Typical learning curve for high bias:

主要表现的特征是：

在训练集的error也依然太高了
Small gap between training and test error.

Optimization algorithm

在不改变模型的情况下，优化目标就变得非常重要了。有两个主要的问题：

算法是否已经收敛？
目标函数是否合适？

如果当目标函数已经够小，但表现出来的结果却不好，那么很有可能是目标函数的问题

如果当目标函数不够小，且表现结果不够好，那么有可能是算法还没收敛

Error Analysis

作者这里以人脸识别为例子，认为分析每一个部分的error非常重要。对于一般的任务来说，我们很多时候希望使用更少的feature达到更好的效果。因此，我们可以去掉某一个feature，看Accuracy是否减少，如果减少的不多，那么该feature并不是特别重要。

Getting started on a learning problem

作者给出了两种设计思路

Careful design.
- 从feature selection，数据收集，清理，算法设计等各个方面进行考虑，然后再进行训练
- 这样得到的架构是非常清晰和完整的
Build-and-fix.
- 首先实现了再说，通过之前的分析找不满意的地方，然后再fix

Premature statistical optimization

作者提出的一个建议为非常的认同：我们很多时候过早的进行统计优化了。

例如，拿到一个新问题，不应该直接尝试复杂的模型，或者设计复杂的算法，而是应该将数据plot出来，找到数据中存在的规律和错误。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

zealscott CSDN认证博客专家 CSDN认证企业博客

码龄7年

196: 原创

3万+: 周排名

225万+: 总排名

70万+: 访问

: 等级

7007: 积分

322: 粉丝

393: 获赞

119: 评论

1774: 收藏

私信

关注

热门文章

分类专栏

最新评论

KMP算法详解（C++实现）
2401_84256088: 又臭又长还有错，看我写的 /** * @param s 待匹配的字符串 * @param p 模式串 * @return s是否包含p * next[j]表示以p[j]结尾的子串，的最长相等先后缀的长度 */ bool kmp (const string &s, const string &p) { int n = s.size(), m = p.size(), next[m], i, j, k; next[0] = 0; for (j = 1; j < m; j++) { for (k = next[j-1]; k && p[j] != p[k]; k = next[k - 1]); next[j] = p[j] == p[k] ? k + 1 : 0; } for (i = 0, j = 0; i < n && j < m;) { if (s[i] == p[j]) i++, j++; else j = next[j]; } return j == m; }
矩阵求导法则与性质
Jerry fk: 我也在纠结这玩意儿，我刚看了定义，他那个刚好写反了
hexo下LaTeX无法显示的解决方案
风翼飞镰: 这是关键啊:CDN地址！
python plot hist 密度图概率和不为1
尚未填写: 有用，感谢！想要绘制多组数据的概率图的话，只需把不同的weights添加到一个列表即可，比如： x_value = [train_points, test_points] train_weights = np.ones_like(train_points)/float(len(train_points)) test_weights = np.ones_like(test_points)/float(len(test_points)) weights = [train_weights, test_weights] plt.hist(x_value, bins=10, histtype="bar", alpha=0.5, label=["training set", "test set"], weights=weights) plt.legend() plt.show()
根据坐标点位置计算方位角（python实现）
Auto_yaoyao: 请问你计算的方位角是地面的？是当前时刻还是下一时刻

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。