人工智能
__承_影__
Interested in iOS/Android/WP, an undistinguished mobile device application developer.
展开
-
十大数据挖掘算法及各自优势
国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive Bayes, and CART. 不仅仅是选中的十大算法,其实参加评选的18种算法,转载 2014-03-24 15:44:46 · 1274 阅读 · 0 评论 -
机器学习之开源库大总结
研究数据挖掘和机器学习有一段时间了,对数据挖掘来说,商用软件有SAS、Clementine、Oracle数据挖掘组件等等;由于个人学习和版权、算法定制等问题,开源的数据挖掘与机器学习软件(库)目前也十分必需,现在就跟大家介绍下比较流行和常用的机器学习开源库。 以前在学校用过matlab,说实话真方便,通常一个模型只要几十行甚至十几行代码就能搞定,但是正版matlab较贵,而且不太适合商业开发转载 2014-03-24 17:06:09 · 1128 阅读 · 0 评论 -
k-近邻算法(kNN)
k-近邻算法(kNN) 引言 本节介绍kNN算法的基本理论以及如何使用距离测量的方法分类物品。其次,将使用python从文本文件中导入并解析数据,然后,当存在许多数据来源时,如何避免计算距离时可能碰到的一些常见的错识。 k-近邻算法概述 k-近邻(k Nearest Neighbors)算法采用测量不同特征之间的距离方法进行分类。它的工作原理是:存在一个样本数据集合,并且样本集中每个数据都转载 2014-03-25 15:28:49 · 1130 阅读 · 0 评论 -
【机器学习实战】:C++实现K-近邻算法KNN
本文不对KNN算法做过多的理论上的解释,主要是针对问题,进行算法的设计和代码的注解。 KNN算法: 优点:精度高、对异常值不敏感、无数据输入假定。 缺点:计算复杂度高、空间复杂度高。 适用数据范围:数值型和标称性。 工作原理:存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一个数据与所属分类的对应关系。输入没有标签的新数据后,将新数据的每个特征转载 2014-03-25 09:57:06 · 1514 阅读 · 1 评论 -
数据挖掘:K最近邻(KNN)算法的java实现
1.急切学习与懒惰学习 急切学习:在给定训练元组之后、接收到测试元组之前就构造好泛化(即分类)模型。 属于急切学习的算法有:决策树、贝叶斯、基于规则的分类、后向传播分类、SVM和基于关联规则挖掘的分类等等。 懒惰学习:直至给定一个测试元组才开始构造泛化模型,也称为基于实例的学习法。 属于急切学习的算法有:KNN分类、基于案例的推理分类。 2.KNN的优缺点 优点:原理简单,转载 2014-03-25 00:51:03 · 2479 阅读 · 0 评论