如何构建机器学习的项目

最新推荐文章于 2024-06-18 08:34:35 发布

开火车的小Tomas

最新推荐文章于 2024-06-18 08:34:35 发布

阅读量126

点赞数

分类专栏：吴恩达深度学习课程系列文章标签：机器学习人工智能 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42815552/article/details/126072313

版权

吴恩达深度学习课程系列专栏收录该内容

4 篇文章 0 订阅

订阅专栏

1、机器学习策略

1.1、正交化

通常要做好一个监督学习系统，我们要注意以下四件事：

系统在训练集上的结果比较好，能够接受。如果表现不好，我可能需要训练更大的网络或切换到更好的优化算法。
系统在开发集上的结果能够接受。如果表现不好，可能需要通过正则化使之达到要求或者增大训练集。
系统在测试集上的结果能够接受。如果表现不好，可能需要更大的开发集。
在实际使用中的表现也令人满意。如果表现不好，可能需要改变开发集或成本函数

2、设定目标

2.1、单一数字评估指标

precision：在全部预测中，有多少预测成功了
recall：在全部真的类别当中，有多少是被准确预测分类的

评估的时候，有一个定义明确的开发集来测量查准率和查全率（上面俩个），再加上下面的一个单一数字评估指标，能快速判断哪一个模型更好

调和平均值：

$F_1 score = \frac{2}{\frac{1}{P} + \frac{1}{R}}$

2.2、满足和优化指标

优化指标：尽可能地寻找最优解
满足指标：达到最低要求即可
通过设定好一个优化指标，其余都设置为满足指标，这样在观察多个成本类型时，能够快速地选出最好的那个。当然，这些指标需要在训练验证测试集中获得。接下来我们对如何设置这些进行说明。

2.3、训练集、开发集、测试集的划分

测试集的目的：在完成系统开发后，测试集能够帮助评估投产系统的性能
首先要保证它们都是属于同分布

3、错误分析

3.1、进行误差分析

如在一个猫分类的项目中，有些狗的照片被分类成了猫，那么此时我们是新建一个分类狗的项目以区分开还是用别的方法呢？
如果新建一个项目可能又要花费几个月的时间。
此时应该分析下，如果取100个错误例子，有多少个是狗的例子呢？手动检查后发现只有5%的错误是狗图片，那么我们可以发现改善这种情况对我们的帮助不是很大。否则的话，可以进行改善。
如果有多个情况需要分析，可以分别对它们进行错误分析，列出表格。总的来说，在错误分析中，就看看算法识别错误的开发集例子。

开火车的小Tomas

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
如何构建机器学习的项目

一些机器学习的策略
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。