吴恩达机器学习第六周笔记+编程

最新推荐文章于 2024-03-06 02:25:04 发布

YzarrK

最新推荐文章于 2024-03-06 02:25:04 发布

阅读量761

点赞数 1

分类专栏：编程

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/YzarrK/article/details/89101979

版权

本文介绍了机器学习中评价算法的重要概念，包括训练集与测试集的划分，学习曲线的分析，以及在垃圾邮件分类问题中如何优先处理。探讨了查准率和查全率的概念，强调了在偏斜类问题中单纯依赖准确率的不足，并提出了精度与召回率之间的权衡。最后，提到了F1分数作为评估指标的优势。

摘要由CSDN通过智能技术生成

Evaluating a Learning algorithm

假设在用linear regression 预测房价，然后你发现预测结果与实际结果偏差甚远。what should you try next？

然后这里引入两个概念，训练集和测试集。一般来说，训练集占70%，测试集占30%。

一般来说，都是先通过训练集求得θ然后再丢到测试集中测试测试误差。

图中，test error 公式跟linear regression的一样，就下标变了。

、

为了进一步精确我们的hypothesis我们引入交叉验证Cross validation

其中，训练集占60%，交叉验证集占20%，测试集占20%

以上所交代的是关于机器学习模式的选择，考虑该使用哪种多项式，然而regularization正则化中的λ 和样本数量m也是影响算法性能的重要元素。以下引入偏差(bias)和方差(variance)

前面我们所学习过的overfit和underfit中，underfit(欠拟合)就是典型的高bias，overfit则是典型的高variance

最低0.47元/天解锁文章

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。