![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
算法思想
文章平均质量分 82
dhtx_wzgl
这个作者很懒,什么都没留下…
展开
-
从B 树、B+ 树、B* 树谈到R 树
作者:July、weedge、Frankie。编程艺术室出品。说明:本文从B树开始谈起,然后论述B+树、B*树,最后谈到R 树。其中B树、B+树及B*树部分由weedge完成,R 树部分由Frankie完成,全文最终由July统稿修订完成。出处:http://blog.csdn.net/v_JULY_v 。 第一节、B树、B+树、B*树1.前言:动态查找树主要有:二叉查找树转载 2015-10-04 17:12:21 · 424 阅读 · 0 评论 -
PayPal高级工程总监:读完这100篇论文 就能成大数据高手
PayPal高级工程总监:读完这100篇论文 就能成大数据高手阅读目录关键架构层(Key architecture layers)架构的演进(Architecture Evolution)文件系统层(FIle Systems) 数据存储(Data Stores)资源管理层(Resource Managers)资源协调层(Coordination)计算框架(Computati转载 2016-05-25 18:48:49 · 1002 阅读 · 0 评论 -
四叉树空间索引原理及其实现
转自http://blog.csdn.net/zhouxuguang236/article/details/12312099今天依然在放假中,在此将以前在学校写的四叉树的东西拿出来和大家分享。四叉树索引的基本思想是将地理空间递归划分为不同层次的树结构。它将已知范围的空间等分成四个相等的子空间,如此递归下去,直至树的层次达到一定深度或者满足某种要求后停止分割。四叉树的结构比较简单,并且当转载 2016-02-27 15:20:30 · 1102 阅读 · 0 评论 -
超酷算法:用四叉树和希尔伯特曲线做空间索引
转自http://blog.jobbole.com/81106/随着越来越多的数据和应用和地理空间相关,空间索引变得愈加重要。然而,有效地查询地理空间数据是相当大的挑战,因为数据是二维的(有时候更高),不能用标准的索引技术来查询位置。空间索引通过各种各样的技术来解决这个问题。在这篇博文中,我将介绍几种:四叉树,geohash(不要和geohashing混淆)以及空间填充曲线,并揭示它们转载 2015-11-14 15:37:51 · 1037 阅读 · 0 评论 -
空间索引
转自:http://www.cnblogs.com/Kane_zzt/archive/2009/04/13/1434708.html在介绍空间索引之前,先谈谈什么叫“索引“。对一个数据集做”索引“,是为了提高对这个数据集检索的效率。书的”目录“就是这本书内容的”索引“,当我们拿到一本新书,想查看感兴趣内容的时候,我们会先查看目录,确定感兴趣的内容会在哪些页里,直接翻到那些页,就OK了,而不转载 2015-11-14 15:36:31 · 426 阅读 · 0 评论 -
k-d tree算法的研究
转自:http://underthehood.blog.51cto.com/2531780/687160By RaySaint 2011/10/12 本文的主要目的是讲一下如何创建k-d tree对目标物体的特征点集合进行数据组织和使用k-d tree最近邻搜索来加速特征点匹配。上面已经讲了特征点匹配的问题其实上是一个最近邻(K近邻)搜索的问题。所以为了更好的引出k-d转载 2015-11-14 15:34:23 · 478 阅读 · 0 评论 -
从K近邻算法、距离度量谈到KD树、SIFT+BBF算法
从K近邻算法、距离度量谈到KD树、SIFT+BBF算法前言 前两日,在微博上说:“到今天为止,我至少亏欠了3篇文章待写:1、KD树;2、神经网络;3、编程艺术第28章。你看到,blog内的文章与你于别处所见的任何都不同。于是,等啊等,等一台电脑,只好等待..”。得益于田,借了我一台电脑(借他电脑的时候,我连表示感谢,他说“能找到工作全靠你的博客,这点儿小忙转载 2015-10-26 14:44:12 · 921 阅读 · 0 评论 -
超酷算法:用四叉树和希尔伯特曲线做空间索引
原文出处:http://blog.jobbole.com/81106/随着越来越多的数据和应用和地理空间相关,空间索引变得愈加重要。然而,有效地查询地理空间数据是相当大的挑战,因为数据是二维的(有时候更高),不能用标准的索引技术来查询位置。空间索引通过各种各样的技术来解决这个问题。在这篇博文中,我将介绍几种:四叉树,geohash(不要和geohashing混淆)以及空间填充曲转载 2015-10-26 14:38:24 · 6735 阅读 · 0 评论 -
四叉树空间索引原理及其实现
原文出处:http://blog.csdn.net/zhouxuguang236/article/details/12312099今天依然在放假中,在此将以前在学校写的四叉树的东西拿出来和大家分享。四叉树索引的基本思想是将地理空间递归划分为不同层次的树结构。它将已知范围的空间等分成四个相等的子空间,如此递归下去,直至树的层次达到一定深度或者满足某种要求后停止分割。四叉树的结构比较简单,并且转载 2015-10-26 14:33:08 · 884 阅读 · 0 评论 -
LSM树由来、设计思想以及应用到HBase的索引
原文地址:http://www.cnblogs.com/yanghuahui/p/3483754.html点击打开链接讲LSM树之前,需要提下三种基本的存储引擎,这样才能清楚LSM树的由来:哈希存储引擎 是哈希表的持久化实现,支持增、删、改以及随机读取操作,但不支持顺序扫描,对应的存储系统为key-value存储系统。对于key-value的插入以及查询,哈希表的复杂度都是O(1转载 2015-09-26 20:53:17 · 613 阅读 · 0 评论 -
SkipList跳表基本原理
为什么选择跳表目前经常使用的平衡数据结构有:B树,红黑树,AVL树,Splay Tree, Treep等。想象一下,给你一张草稿纸,一只笔,一个编辑器,你能立即实现一颗红黑树,或者AVL树出来吗? 很难吧,这需要时间,要考虑很多细节,要参考一堆算法与数据结构之类的树,还要参考网上的代码,相当麻烦。用跳表吧,跳表是一种随机化的数据结构,目前开源软件 Redis转载 2015-10-22 08:45:20 · 333 阅读 · 0 评论 -
我为什么要使用哈希(Hash)
本文作者:XadillaX,UPYUN 已经获得授权原文链接: http://t.cn/RUvEtXQ什么是哈希(Hash)本来这里不应该出现这一节的,因为实际上大家应该都知道什么是哈希。不过有时候为了文章的完整性,我这里就稍微教条性地说明一下吧。散列(英语:Hashing),通常音译作哈希,是电脑科学中一种对资料的处理方法,通过某种特定的函数、算法将要转载 2015-10-22 08:31:04 · 3003 阅读 · 0 评论 -
经纬度搜索(1)-Geohash算法原理
原文链接:http://hankesi2000.iteye.com/blog/1344914geohash作为Solr的位置信息搜索算法,有必要了解其基本的实现原理。geohash算法的wiki链接为http://en.wikipedia.org/wiki/Geohash,这里再结合自己的理解,重新复述一下。 由经纬度变成base32标识 geohash的思想,是将所有的经纬度坐标转载 2015-10-11 21:28:17 · 1956 阅读 · 0 评论 -
数据映射--跳表(skiplist)
转自:http://blog.sina.com.cn/s/blog_693f08470101n2lv.html本周我要介绍的数据结构,是我非常非常喜欢的一个数据结构,因为咱也是吃过平衡二叉树的苦的人啊T_T ,神马左旋,右旋,上旋,下旋,看原理的时候就已经晕晕乎乎的了,再看源码,发现比原理还复杂,心理就想,这东西是不是就是为了让我挂科给学校交重修费来拯救学校财政的东西啊?!。。转载 2015-10-23 09:18:21 · 408 阅读 · 0 评论 -
LSM-Tree (BigTable 的理论模型)
LSM-Tree理论模型:来源:http://www.cnblogs.com/raymondshiquan/archive/2011/06/04/2072630.html Google的BigTable架构在分布式结构化存储方面大名鼎鼎,其中的MergeDump模型在读写之间找到了一个较好的平衡点,很好的解决了web scale数据的读写问题。MergeDump的理转载 2016-07-08 08:57:05 · 1270 阅读 · 0 评论