- 博客(3)
- 收藏
- 关注
原创 决策树(ID3)
简介决策树(Decision Tree)是一种逼近离散值目标函数的方法,在这个方法中学习到的函数表示为一颗决策树。学习到的决策树也能再表示为多个if-then的规则,提高可读性。决策树算法是最流行的归纳推理算法之一。 决策树的核心思想是对于给定的训练样本集,每次选取一个特征将样本集切分为若干个子集,递归地对每一个子集进行特征选取和样本切分,直到样本子集中的元素分类都相同或者没有剩余特征可以选取。如
2016-03-09 23:11:06
434
原创 分类问题之K-近邻算法
K-近邻算法K-近邻算法(k-Nearest Neighbors)简单地说,k-近邻算法采用测量不同特征值之间的距离方法进行分类。该算法的核心思想是: 存在一个样本数据集合,并且样本集中的每个数据都存在标签(分类)。即我们知道样本集中每一数据与所属分类之间的对应关系。输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似(最邻近)的分类标签。最
2016-03-09 23:06:47
392
原创 分类问题之朴素贝叶斯模型
简介朴素贝叶斯模型(Naive Bayes)是一种基于贝叶斯决策理论的分类方法。其核心思想就是选择具有最高概率的决策。如果用p1(x)表示特征向量x对应数据属于类别1的概率,用p2(x)表示特征向量x对应数据属于类别2的概率,那么可以利用下面的规则来判断它的类别: - 如果p1(x) > p2(x), 那么类别为1。 - 如果p2(x) > p1(x), 那么类别为2。 也就是说,我们更倾向于
2016-03-09 23:00:36
837
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人