《A Few Things to Know about Machine Learning》读后感

本文是《A Few Things to Know about Machine Learning》的读后感,探讨了机器学习中的思维转变、泛化能力、数据重要性、集成学习与特征工程、简单性与因果性。强调泛化能力而非过拟合,数据质量和量的影响,以及临床场景中模型解释性的重要性。
摘要由CSDN通过智能技术生成

最近读了华盛顿大学教授Pedro Domingos在2012年发表的《A Few Things to Know about Machine Learning》,文中总结了在机器学习过程中常会遇到12个问题进行了总结。这些问题从理论出发,紧密联合实际。看完之后感触很深,其中很多知识点是也是实践经验后丰富之后才能够有所体会,现在结合自己在医疗临床领域进行数据分析时遇到的情况进行总结和分享吧。

转变思维:从”工具“到”套路“

还记得在刚开始接触机器学习时,最大的挑战莫过于去学习各种令人眼花缭乱的算法和模型了,让人应接不暇。很多的机器学习教材在介绍具体知识的时候通常会按照模型的表示形式去划分不同的章节,却忽视了模型之间的相关性。这就造成初学者难以从全局的角度去看待机器学习的问题,疲于掌握不同的“小工具”而不是用模型实际问题的“套路”。文中开篇就列出了机器学习问题的通用公式:

Learning = Representation + Evaluation + Optimization

这个公式为我们在解决具体问题时提供了一个很好的框架:首先根据具体场景和问题选择具体的模型表示;再根据具体情况确定评价方式,即损失函数;最后再根据损失函数的形式去选择高效适当的优化算法。

对于新手来说,最需要做的是形成对于机器学习的知识体系,而不是纠结于某些具体的算法,完成思维的转变。

泛化即”正义“

机器学习的模式是在训练数据上训练模型,同时在测试数据上完成模型性能的评价,因此我们最需要关注的就是训练好的模型在测试数据上的泛化能力如何,其中最需要避免的就是过拟合(Overfitting)。

文中关于泛化讨论了三个问题&#

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值