- 博客(3)
- 资源 (3)
- 收藏
- 关注
原创 【机器学习实战-python3】K-均值聚类算法
本篇的数据和代码参见:https://github.com/stonycat/ML-in-Action 一、K-均值聚类算法 聚类是一种无监督的学习,它将相似的对象归到同一簇中,类似全自动分类。簇内的对象越相似,聚类的效果越好。K-均值聚类是每个类别簇都是采用簇中所含值的均值计算而成。聚类与分类的区别在于分类前目标已知,而聚类为无监督分类。 K-均值算法的伪代码如下:创建k个点作为起始质心(通常
2017-04-21 17:35:38 8607 2
原创 【机器学习实战-python3】树回归
本篇的数据和代码参见:https://github.com/stonycat/ML-in-Action 本篇博客部分参考Forec blog 一、数据建模问题 前面介绍了贪心算法的决策树,构建算法是ID3,每次选取当前最佳特征来分割数据,并且按照这个特征的所有可能取值来划分,一旦切分完成,这个特征在之后的执行过程中不会再有任何用处。这种方法切分过于迅速,并且需要将连续型数据离散化后才能处理,这
2017-04-07 19:20:43 10468 10
原创 【论文笔记】CHI '16 Embracing Error to Enable Rapid CrowdSourcing
最近读到一篇显著提升标记数据速度的文章,原文Embracing Error to Enable Rapid Crowdsourcing 本篇博客记录个人对论文的总结和翻译理解,如有不足之处欢迎指正。Embracing Error to Enable Rapid Crowdsourcing ——————————————————————————————————————————————— 一作是来自
2017-04-07 11:41:12 1057
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人