![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
文本检索
文章平均质量分 74
六个轱辘
我在武汉大学。快死了~~
展开
-
马尔科夫模型初探
对马尔科夫模型以及隐马尔科夫模型的学习笔记。原创 2015-03-25 21:50:36 · 795 阅读 · 0 评论 -
信息熵
对信息熵的学习笔记。原创 2015-03-26 20:54:51 · 672 阅读 · 2 评论 -
SimHash和网页查重
方法出自Google文章Detecting Near-Duplicates for Web Crawling(2007 WWW)。Google要解决的问题是当crawler得到一个网页时,如何判断该网页是否是已经存在的或存在相似的。解决这个问题分为两步,第一是对网页的内容进行hash,得到网页的“指纹”;第二是给定某个网页的指纹,如果快速的在数据库中找到相似的指纹。解决第一个问题使用的原创 2015-04-01 15:04:06 · 1060 阅读 · 0 评论 -
拼音转汉字算法(隐马尔科夫、维特比算法)
求解拼音转化为语句的问题,在该问题中会使用到隐马尔科夫模型和维特比算法。原创 2015-04-01 20:50:23 · 6552 阅读 · 0 评论 -
机器学习中的常用分布
总结一下机器学习中的几个常见概率分布和共轭先验的概念!原创 2015-03-31 11:35:42 · 8463 阅读 · 0 评论 -
文档生成模型:多元贝努利vs多项式
对比文档生成模型中的多元贝努利模型和多项式模型!原创 2015-05-05 15:20:55 · 2316 阅读 · 0 评论 -
朴素贝叶斯模型
简单介绍朴素贝叶斯(NB)模型。原创 2015-05-06 15:16:44 · 1976 阅读 · 0 评论