机器学习
Charlotte-le
这个作者很懒,什么都没留下…
展开
-
决策树
决策树是一种贪心算法,每次选取的分割数据的特征都是当前的最佳选择,并不关心是否达到最优。ID3使用信息增益作为属性选择度量,选择具有最高信息增益的属性A作为节点N的分裂属性。对D中的元组分类所需要的期望信息(熵): 是任意元组属于类Ci 的概率。熵越小,说明样本集合D的纯度越高。按某个属性A划分对D的元组分类所需要的期望信息:信息增益:Gain(A)= - 一般...原创 2019-04-15 16:01:52 · 289 阅读 · 0 评论 -
朴素贝叶斯
设为一个待分类项,而每个a为x的一个特征属性。有类别集合 。计算。如果,则 。那么如何计算第3步中的各个条件概率呢?1、找到一个已知分类的待分类项集合,这个集合叫做训练样本集。2、统计得到在各类别下各个特征属性的条件概率。3、如果各个特征属性是条件独立的,则根据贝叶斯定理有如下推导: P(yi|x)=P(x|yi)P(i)/P(x)因为...原创 2019-04-15 16:09:14 · 249 阅读 · 0 评论