机器学习
haoshenwang
Alibaba大神
展开
-
Python机器学习实战<一>:环境的配置
具体要学习的书籍就是《机器学习实战》Machine Learning in Action,Peter Harrington Windows下要安装3个文件,分别是; 1.Python(由于python不是向下兼容的,所以推荐2.7版本),网址:http://www.python.org 2.numpy(python的科学计算包),网址:http://sourceforge.net/proje原创 2014-05-17 18:38:08 · 1823 阅读 · 0 评论 -
Python机器学习实战<二>:机器学习概述
1.机器学习的真实含义是利用数据来彰显数据背后的真实含义。 2.机器学习的一般用例:人脸识别、手写数字识别、垃圾邮件过滤、产品推荐等等。 3.机器学习的主要任务是分类,即将实例数据划分到合适的分类中。另一项任务是回归,主要用于预测数值型数据。分类和回归属于监督学习,之所以称为监督学习,是因为这类算法必须知道预测什么,即目标的分类信息。另一种机器学习方式是无监督学习,此时数据没有类别信息,也没有原创 2014-05-17 19:09:36 · 1891 阅读 · 0 评论 -
Python机器学习实战<三>:k-邻近算法
k邻近算法采用测量不同特征值之间的距离方法进行分类。优点:精度高、对异常值不敏感、没有数据输入假定;缺点:计算复杂度高、空间复杂度高(占内存);使用数据范围:数值型和标称型。 k-邻近算法的工作原理是:存在一个训练样本集,并且每个数据都存在标签,即我们知道每个数据都对应的哪个分类。输入一个没有标签的新数据,将新数据的每个特征和样本集中的所有数据进行笔记哦啊,提取出样本集中特征最相似(邻近)的分类原创 2014-05-18 13:14:12 · 1855 阅读 · 0 评论 -
关联规则挖掘算法:Apriori
所谓的关联规则(Association Rule)主要是指数据中的并发关系,最典型的的应用就是对购物篮的分析,发现所有的老爸买尿布的时候都会买啤酒。 关联规则挖掘中有一些容易混淆的术语,详见http://blog.sina.com.cn/s/blog_4d8d6303010009kb.html ,这里有两个很重要的概念:支持度和置信度。通俗的说,支持度就是所有的顾客中有多少顾客买了尿布和原创 2014-09-21 16:33:32 · 3895 阅读 · 0 评论