- 博客(5)
- 资源 (4)
- 收藏
- 关注
原创 【数据结构之二叉树】(二)B+树比B树更适合做文件索引的原因
2015-04-01 23:54 1938人阅读 评论(0) 收藏 举报 分类: 数据结构与算法(17) 版权声明:本文为博主原创文章,未经博主允许不得转载。 目录(?)[+] 原因:相对于B树, (1)B+树空间利用率更高,可减少I/O次数, 一般来说,索引本身也很大,不可能全部存储在内
2017-08-25 00:29:48 465
原创 HBase查找一条数据的过程
Hbase中的Client如何路由到正确的RegionServer 在hbase中,大部分的操作都是在RegionServer完成的,Client端想要插入,删除,查询数据都需要先找到相应的 RegionServer。什么叫相应的RegionServer?就是管理你要操作的那个Region的RegionServer。Client本身并 不知道哪个RegionServer管理哪个Regio
2017-08-08 15:34:24 282
原创 Cloudera Manager(CDH5)内部结构、功能包括配置文件、目录位置等 2016-05-26 15:46 2112人阅读 评论(0) 收藏 举报 分类: CDH(19) 1. 相关
1. 相关目录 /var/log/cloudera-scm-installer : 安装日志目录。 /var/log/* : 相关日志文件(相关服务的及CM的)。 /usr/share/cmf/ : 程序安装目录。 /usr/lib64/cmf/ : Agent程序代码。 /var/lib/cloudera-scm-server-db/data : 内嵌数据库目录。 /usr/bin
2017-08-03 13:46:42 288
原创 Hbase原理、基本概念、基本架构
概述 HBase是一个构建在HDFS上的分布式列存储系统; HBase是基于Google BigTable模型开发的,典型的key/value系统; HBase是Apache Hadoop生态系统中的重要一员,主要用于海量结构化数据存储; 从逻辑上讲,HBase将数据按照表、行和列进行存储。 与hadoop一样,Hbase目标主要依靠横向扩展,通过不断增加廉价的商用服务器
2017-08-03 01:06:45 192
原创 从头开始实现神经网络:入门
从头开始实现神经网络:入门 获取代码:接下来,为了匹配文章的内容,所有的代码都会在Github上以iPython笔记的形式提供。 本文中我们会从头实现一个简单的3层神经网络。我们不会推导所有的数学公式,但会给我们正在做的事情一个相对直观的解释。我也会给出你研读所需的资源链接。 这里假设你已经比较熟悉微积分和机器学习的概念了。比如,你知道什么是分类和正则化。当然你也应该了解
2017-08-02 23:11:26 336
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人