七月机器学习之算法
一个人的旅行qiu
我原因用我10年的生命换一个闪耀的人生
展开
-
七月机器学习之工作流程与模型调优7
本图包含了实际工作中的所有情况,须仔细阅读 1.wrapper包裹型 1.当数据小于50的时候,需要去采集更多的数据 2.category分类:是连续值的预测还是离散值的预测 3.分类,回归,聚类(cluster), 1.分为train,cv,test,train用来建模,cv是交叉验证集用来帮助我们做参数和模型的选择,test用来测试模型效果 实际工作中很少自己实现一个模型,大多都是原创 2017-03-27 19:58:46 · 531 阅读 · 0 评论 -
七月机器学习之推荐系统9
一个叫准确度,一个叫召回 长尾效应是说,热门的有很多人喜欢,但是个性化的,不同的人有不同的喜好,但是数量较少 马太效应是说,只推荐热门的东西 I是商品集 H是信息熵,在所有的Pi都相等的时候,熵最大,它可以更精准的定义覆盖率 u为均值 同一部电影,不同的用户,u是均值 同一个用户,不同的电影 SVD矩阵的分解原创 2017-03-30 22:43:34 · 696 阅读 · 0 评论 -
七月机器学习之决策树随机森林和adaboost11
信息是对不确定性的度量 平均互信息是衡量两个概率分布之间的相似性,互信息高那么相似性就比较大 他们之间的运算关系都在这个图里 I是互信息 熵减去条件熵就是互信息 条件熵是衡量差异性的 也就是说,之前的不确定性减去之后的不确定性等于不确定性的减少,不确定性的减少意味着确定性的增加,实际上就是我们寻找的相关性 主要理解ID3即可 A是特征,D是标签label 决策树的面试会问 由以下原创 2017-03-31 23:12:28 · 791 阅读 · 0 评论 -
七月机器学习之贝叶斯方法
先验概率与后验概率 事情还没有发生,要求这件事情发生的可能性的大小,是先验概率. 事情已经发生,要求这件事情发生的原因是由某个因素引起的可能性的大小,是后验概率. 一、先验概率是指根据以往经验和分析得到的概率,如全概率公式,它往往作为“由因求果”问题中的“因”出现。后验概率是指在得到“结果”的信息后重新修正的概率,如贝叶斯公式中的,是“执果寻因”问题中的“因”。先验概率与后验概率有不可分割的原创 2017-04-01 16:09:42 · 591 阅读 · 0 评论