机器学习系统构建

看了NG视频关于机器学习系统构建的建议,感觉很实用,记录下来作为听课笔记。

首先是机器学习系统构建的流程:


NG推荐方法:首先快速实现一个可能并不是很完美的算法系统,进行交叉验证,画出学习曲线去学习算法问题之处,是high bias or high variance 细节看这篇博文介绍:bias和variance在机器学习中应用

最重要一步:错误分析,手工检验算法错误学习的样本,找到算法在什么类型例子上犯错误!然后几种经历在处理这类错误上。

下面以垃圾邮件系统举例:



反垃圾邮件系统发现误分类最多的是Steal passwords所以集中经历去解决这部分问题!这样能比较高效率。

还有一个小窍门就是:学习算法我们需要有数值量化标准来评估算法!

课上NG提到Spam Email 中是否使用词干提取器,最好的办法就是实验两次分别使用和不适用,通过数值量化标准进行评估来选择是否采用词干提取器。


然后视频中特别提到需要在cross validation 集上进行错误分析验证,看下面题目:


前面提到数值量化标准,有一种倾斜类状态看下图,会发现通常情况下的错误率衡量标准问题所在:


癌症病人比例为0.5% ,如果我们有一个算法错误率为1%,通常情况下这样的错误率是比较好,但是如果我不用任何算法就预测病人没有癌症,我的错误率也只有0.5%,所以需要引入新的数值评价标准:precision  recall 见实例很好懂意思。


通常情况下,我们定义fscore来进行precision recall 的trade off 


有句话可以参考:It's not who has the best algorithm that wins It's who has the most data。

意思在强调数据重要性,但是这个不完全对,在上一篇博文中提到,在某些状态下一味增加数据量是没有作用的!什么时刻增加数据是有意义的了?看下图



我们设定学习算法比较多参数,使用大的训练集,使得系统low bias low variance 这就是我们需要达到的目标!


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
JavaWeb学习系统是一个用于学习和实践JavaWeb开发技术的在线教育平台。该系统通过提供丰富的学习资料、在线编程实践环境和互动交流平台,帮助学习者系统地学习并应用JavaWeb开发技术。 首先,JavaWeb学习系统提供了全面且结构化的学习资料。学习者可以在系统中浏览各种教程、文档和案例,深入学习JavaWeb的相关知识。这些学习资料从基础知识开始,逐步深入,帮助学习者建立起完整的知识体系。 其次,该系统还提供了一个方便的在线编程实践环境。学习者可以在系统中编写JavaWeb代码,并立即运行、调试和查看结果。这样的实践环境可以让学习者在实际操作中加深对知识的理解和掌握,并帮助他们在实践中掌握解决问题的能力。 另外,JavaWeb学习系统也注重互动交流。学习者可以在系统中与其他学习者进行互动,共同解决问题、分享经验。此外,系统也提供了在线讨论区和答疑板块,学习者可以向专业人员提问,并得到及时的解答和指导。这种互动交流的方式有助于学习者更好地理解和应用JavaWeb开发技术。 总的来说,JavaWeb学习系统通过提供全面的学习资料、便捷的编程实践环境和互动交流平台,帮助学习者系统地学习和应用JavaWeb开发技术。通过该系统,学习者可以获取知识、实践技能,并和其他学习者一起成长。这样的学习系统对于提高学习效果和培养实际能力非常有帮助。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值