数据挖掘
文章平均质量分 88
micro小宝
这个作者很懒,什么都没留下…
展开
-
数据挖掘导论:从包含d个项的数据集提取的可能规则总数
在数据挖掘导论(完整版)一书中的第6章讲到了关联分析,并在6.1问题定义中提到了关联规则。 其中第203页中直接给出了公式(6-3):从包含d个项的数据集提取的可能规则总数为R=3d−2d+1+1R = 3^d-2^{d+1}+1,并要求自己证明,同时也是第251页的习题5。该公式的证明过程用到了排列组合的知识,现在把我的证明过程和大家分享一下。原创 2015-09-07 17:18:43 · 5413 阅读 · 0 评论 -
Logistic 回归推导
Logistic 回归是机器学习中经典的分类方法,常见的二项 Logistic 回归模型是一种二项分类模型,由条件概率分布P(Y|X)P(Y|X)表示,形式为参数化的Logistic 分布。为了更好地理解 Logistic 回归,我们先从线性回归开始说起。 假设有mm个样本点,记为{(x(i),y(i)),i=1,2,3...,m(x^{(i)},y^{(i)}),i=1,2,3...,m},原创 2016-03-10 15:39:22 · 2202 阅读 · 0 评论 -
决策树算法
决策树是一种树型结构,其中每个内部结点表示在一个属性上的测试,每个分支代表一个测试输出,每个叶结点代表一种类别。决策树学习是以实例为基础的归纳学习,采用的是自顶向下的递归方法,其基本思想是以信息熵为度量构造一棵熵值下降最快的树,到叶子结点处的熵值为零,此时每个叶节点中的实例都属于同一类。决策树学习算法的最大优点是,它可以自学习。原创 2016-03-08 17:42:55 · 1016 阅读 · 0 评论 -
统计学习方法概论
本文是学习李航写的《统计学习方法》一书第一章“统计学习方法概论”所做的一个笔记,主要就是对第一章的总结。 1. 统计学习: 统计学习是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科,统计学习也称统计机器学习。由此可以看出统计学习的研究对象是数据,目的是对数据进行预测与分析。同时,统计学习关于数据的基本假设是同类数据具有一定的统计规律性,这是统计学习的前提。原创 2016-03-12 22:58:54 · 747 阅读 · 0 评论