数据结构及算法
liang_wen_bo
这个作者很懒,什么都没留下…
展开
-
老鼠毒药问题
科学方法论--信息论、老鼠毒药问题、称球问题(全文) 一道有关用老鼠检测毒药瓶的附加题: 有100只一模一样的瓶子,编号1-100。其中99瓶是水,一瓶是看起来像水的毒药。只要老鼠喝下一小口毒药,一天后则死亡。现在,你有7只老鼠和一天的时间,如何检验出哪个号码瓶子里是毒药? 这儿把它叫做‘问题1’,解决此题的方法可谓二进制应用的经典: 首先,将瓶子的10进制编转载 2013-04-13 18:25:02 · 6061 阅读 · 1 评论 -
霍夫曼树
1.基本概念 霍夫曼树又称最优二叉树,是一种带权路径长度最短的二叉树。所谓树的带权路径长度,就是树中所有的叶结点的权值乘上其到根结点的路径长度(若根结点为0层,叶结点到根结点的路径长度为叶结点的层数)。 树的带权路径长度:设一棵二叉树有 n 个叶子结点,每个叶子结点拥有一个权值W 1 ,W 2 , ...... W n ,从根结点到每个叶子结点的路径长度分别为 L1 , L2...转载 2013-04-12 23:11:27 · 986 阅读 · 0 评论 -
数据挖掘数据集下载网站
1、气候监测数据集 http://cdiac.ornl.gov/ftp/ndp026b 2、几个实用的测试数据集下载的网站 http://www.fs.fed.us/fire/fuelman/ http://www.cs.toronto.edu/~roweis/data.html http://www.cs.toronto.edu/~roweis/data.html http转载 2013-05-07 12:20:14 · 1628 阅读 · 0 评论 -
min_hash
在计算机科学领域,最小哈希(或最小哈希式独立排列局部性敏感哈希)方法是一种快速判断两个集合是否相似的技术。这种方法是由Andrei Broder (1997),[1]发明的,最初在AltaVista搜索引擎中用于在搜索结果中检测并消除重复Web页面。[2] 它同样也应用于大规模聚类问题,比如通过文档间包含的词语相似性进行聚类。[1] 目录 [隐藏] 1 雅转载 2013-05-07 12:24:48 · 935 阅读 · 0 评论 -
LSH之1
包括lsh的详细介绍以及针对不同距离函数的LSH。 作用: 解决的问题:相似性计算,避免两两计算,提供一组Hash函数,将相似的pair放在一个bucket里面,降低计算规模。 约束: Hash函数的要求: 1.相似的pair比不相似的paire更容易成为candidate 2.识别candidate paire的效率要比从所有pair中识别candidate pair效率高(利用mi转载 2013-05-07 11:34:37 · 947 阅读 · 0 评论