算法
taczeng
最简单的代码完成尽可能复杂的功能
展开
-
浅谈我对算法理解
内容持续更新总结中...... 算法,一直是看似复杂的东西,但是,深入本质,其实算法,是很有趣的; 算法,其实就是对于一堆输入的内容,转换成你想要的输出的内容的一个计算序列! 栗子:从A到B有很多条路,最快到B是时间复杂度(多长时间),走路流汗最少是空间复杂度(用了多少内存空间); 算法技术点(借用知乎的一张思维导图)—— 需要的基础数学知识: 求导、nlgn等等这种时...原创 2019-12-05 15:35:50 · 3280 阅读 · 0 评论 -
使用simhash进行海量文章数据相似度去重
1.原理理解: 这篇文章相当好: https://www.cnblogs.com/maybe2030/p/5203186.html https://www.cnblogs.com/qcloud1001/p/10059709.html 理解了整体思路,中间有个地方不好理解: 1.如何分桶,分桶的目的,只是缩小比较次数,尽快找到待比较的文本,进行海明计算: 现在一个text文本...原创 2019-06-24 17:20:46 · 3136 阅读 · 1 评论