- 博客(2)
- 资源 (7)
- 收藏
- 关注
原创 机器学习笔记(2)——使用朴素贝叶斯算法过滤(中英文)垃圾邮件
在上一篇文章《使用朴素贝叶斯算法对文档分类详解》中,我们实现了用朴素贝叶斯算法对简单文档的分类,今天我们将利用此分类器来过滤垃圾邮件。 1. 准备数据——文本切分 之前算法中输入的文档格式为单词向量,例如['my', 'dog', 'has', 'flea', 'problems', 'help', 'please'],而实际情况中通常要处理的是文本(例如邮件),那么就要先将文本转换为词向量,...
2018-08-30 15:48:20 10008 9
原创 我的第一篇学习笔记——使用朴素贝叶斯算法对文档分类详解
朴素贝叶斯算法可以实现对文档的分类,其中最著名的应用之一就是过滤垃圾邮件。先做一个简单的分类,以论坛的留言为例,构建一个快速的过滤器,来区分哪些留言是负面言论,哪些是正面言论。 我对算法思路的理解:首先计算训练集中每个词语分别在正面(负面)文档中出现的概率以及正面(负面)文档的概率,再计算待分类样本中的每个词语属于正面(负面)文档的概率和正面(负面)文档概率的乘积,即为该样本属于正面(负面)样本...
2018-08-28 14:38:01 2664 3
HCluster.py
2020-01-02
Logistic算法(随机梯度下降法)的Python代码和数据样本
2019-03-12
Logistic回归算法的Python代码和数据样本
2019-01-28
C4.5决策树算法的Python代码和数据样本
2018-12-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人