- 博客(2)
- 收藏
- 关注
转载 贝叶斯分类算法 -- 概率推导
贝叶斯分类算法是基于一种古典概率统计学的一种非常简单的分类方法。废话不多说,尽快进入推导过程,因为很简单。假设 x1,x2... x3 是判断因素,y 是类别结果。那么我们做如下假设:1. x1,x2 ... x3 是离散事件,即可以统计出 p(x1),p(x2).... p(x3) ,否则贝叶斯算法失效。2.x1,x2, ... x3 互相独立,即 p(x1|x2) = p(x1)...
2018-09-13 14:12:28 2026
转载 winnowing 算法 -- 提取文档指纹特征
关于 winnowing 算法的简单的解释就是:基于 k-gram 的哈希码,以最小规则提取部分gram 的哈希码作为文档特征指纹,并记录gram的位置。源码和步骤如下:(1)对文档进行字符标记,比如 "asdf",变成 [(0,"a"),(1,"s"),(2,"d"),(3,"f")]def sanitize(text): """Removes irrelevant featu...
2018-09-04 14:53:24 3044
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人