有监督学习:
给定某些特征去估计因变量,即因变量存在的时候,我们称这个机器学习任务为有监督学习,包括回归和分类。例如根据一个人的身高,体重,心率,饮食等特征来预测患心脏病的概率,这类被称为回归问题。也可以根据当天日期是否是周末/节假日,天气情况,所处地点等因素来预测某个人是否会使用共享单车,这类问题成为分类问题。
常用的有监督学习算法有:线性回归;xgboost;SVM;决策树;随机森林;逻辑回归(虽然叫回归,但实际是分类);k近邻;朴素贝叶斯
无监督学习:
给定某些特征但不给定因变量,建模的目的是学习数据本身的结构和关系。例如根据天猫用户每天的使用时长,消费次数,消费金额等因素将不同用户进行分类,从而分别提供针对性的服务。
常用的无监督学习算法有:k-mean;PCA;