[完]机器学习实战第一章机器学习基础（Maching Learning Foundation）

最新推荐文章于 2018-11-27 09:23:11 发布

namelessml

最新推荐文章于 2018-11-27 09:23:11 发布

阅读量622

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/namelessml/article/details/52351375

版权

机器学习专栏收录该内容

16 篇文章 0 订阅

订阅专栏

                    
                        
                    
                    训练集：为算法输入大量已分类数据作为算法的训练集。
目标变量：是机器学习算法的预测结果，在分类算法中目标变量的类型通常是标称型、离散型的，而在回归算法中通常是连续型的。
分类（Classification）和回归（Regression），分类的任务，将数据划分到合适的分类中。回归的任务，用于预测数值型数据，回归的例子–数据拟合曲线。
监督学习：分类和回归通常属于此类学习，这类算法必须知道预测什么，即目标变量的分类信息。
无监督学习：数据没有类别信息，也不给定目标值。在无监督学习中，将数据集合分成由类似的对象组成的多个类的过程称为聚类。将寻找描述数据统计值的过程称之为密度估计。无监督学习还可以减少数据特征的维度。
开发机器学习应用程序的步骤： 
 
  1、收集数据（爬虫、RSS、物联网）；
2、准备输入数据（为机器学习准备特定的数据格式）；
3、分析输入数据（空值、数据模式、异常值、图形展示数据），确保数据集中没有垃圾数据；
4、训练算法（从格式化数据中抽取知识和信息），无监督学习，由于数据中没有目标变量值，不需训练算法；
5、测试算法；
6、使用算法。