算法
文章平均质量分 74
chuanzhongdu1
这个作者很懒,什么都没留下…
展开
-
非常好的理解遗传算法的例子
遗传算法的手工模拟计算示例 为更好地理解遗传算法的运算过程,下面用手工计算来简单地模拟遗传算法的各 个主要执行步骤。 例:求下述二元函数的最大值:转载 2014-05-10 09:14:36 · 1116 阅读 · 0 评论 -
海量数据相似度计算之simhash和海明距离
通过 采集系统 我们采集了大量文本数据,但是文本中有很多重复数据影响我们对于结果的分析。分析前我们需要对这些数据去除重复,如何选择和设计文本的去重算法?常见的有余弦夹角算法、欧式距离、Jaccard相似度、最长公共子串、编辑距离等。这些算法对于待比较的文本数据不多时还比较好用,如果我们的爬虫每天采集的数据以千万计算,我们如何对于这些海量千万级的数据进行高效的合并去重。最简单的做法是拿着待比较的文本转载 2014-05-10 09:20:25 · 977 阅读 · 0 评论 -
贝叶斯算法
贝叶斯算法是一种分类算法,它以贝叶斯公式为基原创 2014-05-18 11:06:17 · 1229 阅读 · 0 评论