什么是机器学习?
人们很难从原始数据本身获得所需信息。
如:单独一个单词没有太大作用,获取不到信息。但是某特定几个单词出现,辅助考察邮件长度及其他因素,就可以获得有效信息。
机器学习对任何需要解释并操作的数据领域都有益处。
首先要选择合适的算法:
预测目标变量的值:监督学习。
离散型:分类算法
连续型:回归算法
无监督学习:
将数据划分为离散的组:聚类算法
如果还需要估计数据与每个分组的相似程度,使用密度估计算法。
什么是机器学习?
人们很难从原始数据本身获得所需信息。
如:单独一个单词没有太大作用,获取不到信息。但是某特定几个单词出现,辅助考察邮件长度及其他因素,就可以获得有效信息。
机器学习对任何需要解释并操作的数据领域都有益处。
首先要选择合适的算法:
预测目标变量的值:监督学习。
离散型:分类算法
连续型:回归算法
无监督学习:
将数据划分为离散的组:聚类算法
如果还需要估计数据与每个分组的相似程度,使用密度估计算法。