监督学习:
1.回归方法:
----1.单因子线性回归
----2.多因子线性回归
2.分类方法:
----1.逻辑回归 利用sigmoid函数, 进行二分类
----2.神经网络
----3.决策树 利用数据特征分类, 根据信息增益值决定顺序
----4.KNN邻近模型 在距离输入空间最近的K个数据中占比最大的那部分所属的类别
无监督学习:
1.Kmeans聚类算法, 参数 k==分类数
2.Meanshift聚类算法, 参数 r==搜索半径
其他技术:
数据降维技术, 实现技术--主成分分析(PCA)
异常检测技术, 可以基于高斯分布实现
模型评估:
评估分类算法: 通过混淆矩阵, 得到模型评估指标, 准确率, 错误率, 召回率, 特异度, 准确率, F1分数