- 博客(4)
- 收藏
- 关注
转载 数据挖掘十大经典算法
一、 C4.5 C4.5算法是机器学习算法中的一种分类决策树算法,其核心算法是ID3 算法. C4.5算法继承了ID3算法的优点,并在以下几方面对ID3算法进行了改进: 1) 用信息增益率来选择属性,克服了用信息增益选择属性时偏向选择取值多的属性的不足; 2) 在树构造过程中进行剪枝; 3) 能够完成对连续属性的离散化处理; 4) 能够对不完整数据进行处理。 C4.
2017-03-30 21:30:17 356
转载 Heron-新一代实时流处理
CSDN日报20170315——《年近 30 ------职业回顾与思考》 程序员2月书讯 【直播】用面向协议的思想简化网络请求 博客一键搬家活动开始啦
2017-03-16 19:40:52 3177
转载 主题模型-LDA浅析
上个月参加了在北京举办SIGKDD国际会议,在个性化推荐、社交网络、广告预测等各个领域的workshop上都提到LDA模型,感觉这个模型的应用挺广泛的,会后抽时间了解了一下LDA,做一下总结:(一)LDA作用 传统判断两个文档相似性的方法是通过查看两个文档共同出现的单词的多少,
2017-03-14 15:37:31 835
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人