- 博客(2)
- 收藏
- 关注
原创 LSH(Locality Sensitive Hashing)原理与实现
LSH(Locality Sensitive Hashing)翻译成中文,叫做“局部敏感哈希”,它是一种针对海量高维数据的快速最近邻查找算法。在信息检索,数据挖掘以及推荐系统等应用中,我们经常会遇到的一个问题就是面临着海量的高维数据,查找最近邻。如果使用线性查找,那么对于低维数据效率尚可,而对于高维数据,就显得非常耗时了。为了解决这样的问题,人们设计了一种特殊的hash函数,使得2个相似度很高
2016-11-14 11:23:35 78337 47
原创 Python--正则表达式
现实中,经常要做的一项任务,是在文本中检索某种模式。所谓模式,就是满足一定规则的字符串的总称,例如只由大写字母构成的单词就是一种模式,所有电子邮件的地址,也是一种模式。我们检索这样符合一定规则的字符串,按照之前字符串的知识,当然能设计出相关的函数,完成这些任务,可是当要检索的模式非常复杂时,设计这样的函数显然费时费力,那就需要一种高级的,便捷的模式检索的方法,帮助我们解决这个问题。这也就引出了
2016-11-02 14:46:20 2493
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人