上篇即第一篇文章简短的介绍了机器学习,让读者大致了解了机器学习是干啥的:
先来看看机器学习具体解决一些什么问题,从功能的角度出发,机器学习主要可以具体解决以下两个问题:
1、分类与预测问题
分类与预测问题是预测问题的两种主要类型,分类主要是预测分类标号(离散属性),通过构造一个分类模型,输入样本的属性值,输出对应的类别,将每个样本映射到原先定义好的类别。而预测主要是建立连续值函数模型,预测给定自变量对应的因变量的值。
应用实例:手写数字的识别(分类)、垃圾邮件的识别(分类)、电影票房的预测(回归分析)、未来房价的预测(回归分析)
2、聚类问题
分类问题是已知结果对数据特征进行分类,属于“监督学习”,而聚类则不需要知道样本所属标签,即没有给定划分类别的情况下,根据数据之间的相似度对数据进行划分,属于“非监督学习”。如常见的k-means聚类算法,通过样本之间的距离将数据分为