- 博客(3)
- 收藏
- 关注
原创 cart回归决策树和id3的的区别
信息熵公式是:条件信息熵计算方法是:信息增益为:H(C)-H(C|X)取使信息增益最大的特征分割样本,ID3使用这种方法,他是多分支的树,每一个特征取值变为一个子树。而cart回归树为二叉树,使用gini系数确定分割特征和分割点,如下: 在分类问题中,假设有K个类,样本点属于第k类的概率为Pk,则概率分布的gini指数的定义为: 如果样本集合D根据某个特征A被分割为D1,D2两个部...
2018-03-31 22:07:05 923
转载 最大似然法和最小二乘损失函数的异同
最大似然估计和最小二乘估计的区别与联系 转载 2014年03月09日 15:57:11 标签:估计方法 最小二乘 最大似然 ...
2018-03-16 10:23:24 5299
转载 聚类性能评估
聚类模型性能评价指标有监督的分类算法的评价指标通常是accuracy, precision, recall, etc;由于聚类算法是无监督的学习算法,评价指标则没有那么简单了。因为聚类算法得到的类别实际上不能说明任何问题,除非这些类别的分布和样本的真实类别分布相似,或者聚类的结果满足某种假设,即同一类别中样本间的相似性高于不同类别间样本的相似性。聚类模型的评价指标如下:1. Adjusted Ra...
2018-03-16 09:36:58 1089
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人