机器学习算法
文章平均质量分 82
Thank_T_F
这个作者很懒,什么都没留下…
展开
-
基于概率论的分类方法:朴素贝叶斯
其实朴素贝叶斯分类用一个区分是否是侮辱性句子的应用来说就是: 我们先通过训练集来算出 当句子是侮辱性句子时,单词(要计算很多个单词)出现的概率W,然后通过概率W来预测测试句子是否是侮辱性句子。使用朴素贝叶斯进行文档分类:以社区的留言板为例,运用朴素贝叶斯算法,对文本自动分类是否是侮辱性句子 一,准备数据 1.生成测试集包括一...原创 2018-04-16 17:22:55 · 744 阅读 · 0 评论 -
KNN最邻近算法
优点:精度高,对异常值不敏感,无数据输入假定。缺点:计算复杂度高,空间复杂度高。适用范围:数值型和标称型。KNN算法是在预测的时候才进行运算的。简要介绍步骤就是,准备好一堆样本,想象一下每个样本在空间分布,它的坐标就是他的几个特征值。 当需要预测时,求出与样本距离最近的几个点,通过这几个点来判断预测点的分类。在判断的时候,可以通过数不同样本的数量数,最多的即为预测类但是一般情况,与样本的距离不同,...原创 2018-04-30 23:23:56 · 357 阅读 · 0 评论