1.朴素贝叶斯
模型形式:生成模型
优点:
实现简单,所需要的估计参数很少,很好的利用了先验知识,学习和预测效率都很高。
对小规模的数据表现很好,能处理多分类任务,适合增量式训练。
对缺失数据不太敏感。
缺点:
对发生频率较低的事件预测效果不好。
2.KNN算法
模型形式:判别模型
优点:
模型不需要预先构造
对异常值不敏感
缺点:
搜索邻居样本计算量大
需要大量的内存
需要预先设置k值
3.决策树
模型形式:判别模型
优点:
计算量简单,可解释性强,效率高
比较适合处理有缺失属性值的样本
缺点:
容易过拟合(后续出现了随机森林,减小了过拟合现象);
忽略了数据之间的相关性;
4.线性回归
优点:
实现简单,计算简单;
缺点:
不能拟合非线性数据;
5.Logistic回归
优点:
实现简单;
分类时计算量非常小,速度很快,存储资源低;
可以处理非线性数据
缺点:
容易欠拟合,一般准确度不太高
模型形式:生成模型
优点:
实现简单,所需要的估计参数很少,很好的利用了先验知识,学习和预测效率都很高。
对小规模的数据表现很好,能处理多分类任务,适合增量式训练。
对缺失数据不太敏感。
缺点:
对发生频率较低的事件预测效果不好。
2.KNN算法
模型形式:判别模型
优点:
模型不需要预先构造
对异常值不敏感
缺点:
搜索邻居样本计算量大
需要大量的内存
需要预先设置k值
3.决策树
模型形式:判别模型
优点:
计算量简单,可解释性强,效率高
比较适合处理有缺失属性值的样本
缺点:
容易过拟合(后续出现了随机森林,减小了过拟合现象);
忽略了数据之间的相关性;
4.线性回归
优点:
实现简单,计算简单;
缺点:
不能拟合非线性数据;
5.Logistic回归
优点:
实现简单;
分类时计算量非常小,速度很快,存储资源低;
可以处理非线性数据
缺点:
容易欠拟合,一般准确度不太高