1:机器学习:有监督、无监督、强化学习。
强化学习:不给定标签的情况下,对自己的预测结果进行评判。也就是自我评估,通过自我评估,学生不断学习预测结果不断提高。
2:回归、分类、异常检测、聚类、降维。
1)回归:回归的目标变量为连续型,也即是回归对连续型变量做出预测。从连续统计数据中获得数学模型,这些数学模型可用作分类或预测。
七种回归:Linear Regression线性回归、Logistic Regression 逻辑回归、Polynomial Regression 多项式回归、Stepwise Regression 逐步回归、Ridge Regression 岭回归、Lasso Regression 套索回归、ElasticNet回归。
2)异常检测:异常检测又可以看做一个二分类的任务。
异常检测实际是一种非监督学习,异常检测通常有大量负样本、没有或只有很少正样本,异常检测中的异常多种多样而且样本稀少,无法对异常进行学习。
3.机器学习模型:线性(加法、乘法),核模型(高斯核函数),层级模型(神经网络)
4.鲁棒学习:可有效出来机器学习中的异常值,实现有效性和鲁棒性之间简单平衡。
1)l1损失:对于L1损失LS, 只要中间值不变, 异常值对最终结果影响不大。
2)Huber损失:Huber损失LS能很好地平衡有效性和鲁棒性。Huber混合使用了L1和L2损失
3)Tukey损失:同