数据挖掘、机器学习算法
文章平均质量分 63
shu_linway
这个作者很懒,什么都没留下…
展开
-
数据挖掘中的关联分析方法
关联规则是揭示事物之间的某种联系,支持度与置信总是伴随着关联规则存在,是对关联规则的必要补充。支持度和置信度例子:购买计算机的客户趋向于购买财务管理软件的关联规则表示: 计算机=>财务管理软件【support = 2%,confidence = 60%】支持度:表示有2%的用户同时购买了计算机和财务管理软件;置信度:表示购买计算机顾客中原创 2013-08-15 09:48:44 · 5147 阅读 · 0 评论 -
数据挖掘算法--分类与预测笔记
分类和预测是两种数据分析形式,可以用于提取描述重要数据量的模型或预测未来的数据趋势。然而,分类是预测分类标号,而预测建立连续值函数模型。数据分类两过程:1.建立模型,描述预定的数据类或概念集。学习模型用分类规则、判定树或数学公式的形式提出。2.使用模型进行分类。利用测试集评估模型的预测准确率,如果准确率可以接受,可以用来对未知数据元组分类。预测是构造和使用模型评估无原创 2013-08-15 14:39:13 · 1854 阅读 · 0 评论 -
R语言 linux安装
转载一篇文章,感谢这位博主:http://blog.sina.com.cn/s/blog_551d7bff0101423f.html感谢,学习了。。。由于希望在Hadoop集群上配置RHadoop,自然需要在每个服务器节点上安装R语言。在安装过程也碰到了一些小问题,因此记录一下。 首先服务器系统版本为centos5.6,R版本为2.13.2。下转载 2014-01-22 11:19:58 · 831 阅读 · 0 评论 -
supervised learning
有监督学习是指通过已经识别的样本来调整学习模型的参数来达到最佳效果。这样经过监督学习后的模型具有更高的分类效果和识别效果。常见的监督学习有:神经网络、决策树、分类、svm、K-近邻学习原创 2014-02-08 11:45:44 · 686 阅读 · 0 评论