统计学与机器学习

2018/10/29
我觉得我这边比较感兴趣的一件事,同时兼顾统计学和机器学习的部分,就是在样本空间的大小上,比较有结合点。


另外就是,从统计学数据分布的角度来讲,数据的分布应该是什么样才能实现一个泛化能力比较强的分类器。
更深入的说,应该有一个什么样的样本集,才能训练出一个比较好的分类器呢?
(我自己比较坚信的一个点就是,数据集一定是能够完整的描述出一个随机事件的真正内容。特别是,不要出现那种,偏差很大的。这种事情是不是可以研究一下,就比如版本更替的过程
比较正式的说法是,应该有一个有代表性的数据集来进行这些操作,不管是训练集也好,测试集也好。另外就是,我希望的是,有代表性的数据集,那么什么样才是有代表性的数据集。有没有相应的指标可以帮助我来进行区分。


2018/12/06

对于统计学和机器学习有什么结合的部分,按理说是没有的,自从你看了这么多讲机器学习的书没有哪本书告诉你统计学的知识是怎么样应用在机器学习中的。这其实突出了一点,就是对于机器学习而言,他是侧重于算法,他对底层的概率分布并不敏感;直到最近的时候,我看统计学习部分的内容时候也是,他希望得到一个有代表性的数据集。

应该从很久之前,大概去年的这个时候,我开始关注一些机器学习的内容。但我对机器学习与统计学习部分的关联非常好奇,现在如此看来,就如同那篇论文,机器学习与统计学习只是很多同样的材料组合起来不同的名字。当然,他们两者的侧重点有所不同。重点就在于机器学习是比较关注算法,更高层次来讲,它是一个针对自动化的过程。但统计部分,这里插一句,我们谈论统计学的时候,很少能看到它与机器学习相同的内容,可能是我看的书不一样的缘故,你看到那些统计学习的书籍的时候就更能得到这样的结论了。

https://www.r-bloggers.com/whats-the-difference-between-machine-learning-statistics-and-data-mining/
https://www.educba.com/machine-learning-vs-statistics/
https://www.svds.com/machine-learning-vs-statistics/
https://machinelearningmastery.com/relationship-between-applied-statistics-and-machine-learning/
https://machinelearningmastery.com/what-is-statistics/
https://www.edvancer.in/machine-learning-vs-statistics/
https://www.analyticsvidhya.com/blog/2015/07/difference-machine-learning-statistical-modeling/

https://towardsdatascience.com/no-machine-learning-is-not-just-glorified-statistics-26d3952234e3

看了这么多材料,反而不知道怎么来归纳这个内容了。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值