数据挖掘
文章平均质量分 94
公众号:AI自习室
这个作者很懒,什么都没留下…
展开
-
数据挖掘十大算法之 naïve Bayes
朴素贝叶斯法是基于贝叶斯定理和特征条件独立假设的分类方法。朴素贝叶斯法实现简单,学习与预测的效率都很高,被广泛应用于文本分类、垃圾邮件过滤、自然语言处理等场景。下面我们来介绍贝叶斯定理,在介绍贝叶斯定理之前,先介绍下条件概率和全概率公式。 条件概率 所谓条件概率,就是在事件 BBB 发生的条件下,事件 AAA 发生的概率,用 P(A∣B)P(A|B)P(A∣B) 来表示。在下面的文氏图中,定义了事件 AAA 和 BBB,以及他们的交集 A∩BA\cap BA∩B,A‾\overline AA 为 AAA 的原创 2021-01-25 17:02:37 · 677 阅读 · 2 评论 -
数据挖掘十大算法之 k-NN
kkk-NN (kkk-nearest neighbor) 由 Cover 和 Hart 于 1968 年提出,属于机器学习算法中的监督学习算法,可以用来解决分类和回归问题。 kkk-NN 的工作原理 为了对 kkk-NN 算法有个直观的认识,我们看个例子: 有两类物体 A 和 B,它们在坐标轴中的分布如上图所示。现在来了一个未知类别的物体,由图中的正方形表示,我们该把它归为哪一类呢?kkk-NN 算法的工作原理是看离待分类物体最近的 kkk 个物体的类别,这 kkk 个物体的大多数属于那个类别,待分类物原创 2021-01-22 09:37:25 · 848 阅读 · 0 评论