文章纯属个人愚见,欢迎指正!
分类:分类就是通过一些学习(监督学习),弄错一个分类器或者说分类模型,当你把一个参数(数据)放入时,可以告诉你你这参数(数据)应该放到哪个类,类似于猫狗分类。
一:朴素贝叶斯(Naive Bayes, NB)
http://www.ruanyifeng.com/blog/2011/08/bayesian_inference_part_one.html
二:Logistic回归(Logistic Regression, LR)
https://blog.csdn.net/qq_20073741/article/details/102647497
三:决策树(Decision Tree, DT)
基本术语:
- 根节点(Root Node):它代表整个种群或样本,并进一步分为两个或更多个同类集。
- 拆分(Splitting):这是将节点划分为两个或更多个子节点的过程。
- 决策节点(Decision Node):当子节点分裂成更多的子节点时,它被称为决策节点。
- 叶子/终端节点(Leaf/ Terminal Node):不分割的节点称为叶子或终端节点。
- 修剪(Pruning):当我们删除决策节点的子节点时,此过程称为修剪。 你可以说相反的分裂过程。
- 分支/子树(Branch / Sub-Tree):整个树的子部分称为分支或子树。
- 父节点和子节点(Parent and Child Node):划分为子节点的节点称为子节点的父节点,其中子节点是父节点的子节点。
https://blog.csdn.net/qq_39384184/article/details/79940305
四:随机森林(Random Forest, RF)
https://blog.csdn.net/qq_20073741/article/details/103537438
五:支持向量机(Support Vector Machine, SVM)
特点:数据量少
分类算法评估指标:
(1)分类准确度
(2)召回率
(3)虚警率
(4)精确度