数据挖掘
guohecang
数据为王时代,让大数据释放大价值
展开
-
数据清洗的一些梳理
数据清洗, 是整个数据分析过程中不可缺少的一个环节,其结果质量直接关系到模型效果和最终结论。在实际操作中,数据清洗通常会占据分析过程的50%—80%的时间。国外有些学术机构会专门研究如何做数据清洗,相关的书籍也不少。转载 2016-09-11 11:20:45 · 4311 阅读 · 0 评论 -
生成模型与判别模型
生成模型与判别模型转自链接:@zouxy09链接:http://blog.csdn.NET/zouxy09 一直在看论文的过程中遇到这个问题,折腾了不少时间,然后是下面的一点理解,不知道正确否。若有错误,还望各位前辈不吝指正,以免小弟一错再错。在此谢过。 一、决策函数Y=f(X)或者条件概率分布P(Y|X) 监督学习的任务就是从数据中学习一个模型转载 2016-10-31 16:14:48 · 464 阅读 · 0 评论 -
无约束优化方法读书笔记—入门篇
优化方法读书笔记声明:1)该博文的绝大部分内容抄自课本《最优化理论与方法》,作者袁亚湘,孙文瑜2)该博文只是列出优化算法大体框架,没有深入去推导各种公式。2)本文仅供学术交流,非商用,有些部分本来就是直接从课本复制过来的。如果某部分不小心侵犯了大家的利益,还望海涵,并联系老衲删除或修改,直到相关人士满意为止。3)本人才疏学浅,整理总结的时候难免出错,还望各位前辈不吝指正,谢谢。转载 2016-10-31 16:26:40 · 879 阅读 · 0 评论 -
从最大似然到EM算法浅解
从最大似然到EM算法浅解转自:http://blog.csdn.net/zouxy09/article/details/8537620 机器学习十大算法之一:EM算法。能评得上十大之一,让人听起来觉得挺NB的。什么是NB啊,我们一般说某个人很NB,是因为他能解决一些别人解决不了的问题。神为什么是神,因为神能做很多人做不了的事。那么EM算法能解决什么问题呢?转载 2016-10-31 16:27:04 · 451 阅读 · 0 评论 -
OWL-QN算法
OWL-QN算法转自:http://www.cnblogs.com/vivounicorn/archive/2012/06/25/2561071.html一、BFGS算法 算法思想如下: Step1 取初始点,初始正定矩阵,允许误差,令; Step2 计算; Step3 计算,转载 2016-10-31 16:27:32 · 903 阅读 · 0 评论 -
EM算法学习笔记
EM算法学习笔记声明:1)该博文是多位博主以及书籍作者所无私奉献的论文资料整理的。具体引用的资料请看参考文献。具体的版本声明也参考原文献2)本文仅供学术交流,非商用。所以每一部分具体的参考资料并没有详细对应,更有些部分本来就是直接从其他博客复制过来的。如果某部分不小心侵犯了大家的利益,还望海涵,并联系老衲删除或修改,直到相关人士满意为止。3)本人才疏学浅,整理总转载 2016-10-31 16:28:41 · 1096 阅读 · 0 评论 -
LDA入门级学习笔记
LDA入门级学习笔记声明:1)该博文是多位博主以及科学家所无私奉献的论文资料整理的。具体引用的资料请看参考文献。具体的版本声明也参考原文献2)本文仅供学术交流,非商用。所以每一部分具体的参考资料并没有详细对应,更有些部分本来就是直接从其他博客复制过来的。如果某部分不小心侵犯了大家的利益,还望海涵,并联系老衲删除或修改,直到相关人士满意为止。3)本人才疏学浅,整理转载 2016-10-31 16:29:31 · 1376 阅读 · 0 评论