安装文档
文章平均质量分 86
一个不会写代码的小黑
君子之交淡如水,小人之交甘若醴。
展开
-
Hbase
nosql:hbaseRDBMS:MySQL Oracle SQLserver db2 access excel 啥意思base为什么有hbase随着数据量越来愈大,传统的关系型数据库不能满足需求hive虽然能够满足存储的要求,但是不能满足非结构的半结构画的数据存储和高效查询是什么是一个开源的、分布式的、多版本的、可扩展、非关系型数据库。是bigtable的开源java版本。hba...原创 2019-01-16 21:05:14 · 423 阅读 · 0 评论 -
hive
hivehive出现fscebook最初研发来用于处理海量的社交数据和机器学习简化分析:使用sqlhive简介Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。hicve架构用户连接客户端:cli、jdbc/odbc web gui第三方服务:thrift servermetastore:hive的元数据(库名、表名...原创 2018-12-11 19:30:51 · 813 阅读 · 0 评论 -
mapreduce
mapreduce是什么?分布式并行离线计算框架,是一个分布式计算程序的编程框架,时用户开发“基于Hadoop的数据分析应用" 的核心框架###mapreduce的核心功能将用户编写的业务逻辑代码和自带默认组建整合成一个完整的分布式运算程序,兵法运行在Hadoop集群上关键词关键字解释job用户的每一个计算请求称为一个作业。Task每一个作业,都需要拆分...原创 2018-12-04 20:01:36 · 222 阅读 · 0 评论 -
zookeeper
zookeepe基础什么是zookeeperzookeeper是一个分布式协调服务,就是为用户的分布式程序提供协调服务zookeeper是为别的分布式程序提供服务的zookeeper本身也是一个分布式应用程序(只要有半数以上的节点存活,就可以对外提供服务)zookeeper的功能1、为用户提供数据的注册查询功能2、为用户提供数据监听服务3、通过心跳感知用户状态特点一个lead...原创 2018-11-30 20:48:54 · 309 阅读 · 0 评论 -
hadoop
Hadoop生态圈HDFS:分布式文件系统YARN:分布式资源调度系统MAPREDUCE:分布式计算框架HIVE:数据仓库工具 HBASE:分布式海量数据库ZOOKEEPER:分布式协调服务基础组件MAHOUT:基于mapredue、spark、flink等分布式计算框架的机器学习算法库OOZIE/AZKABAN:工作流调度平台SQOOP:数据导入导出工具FLUME:分布式...原创 2018-11-23 09:55:52 · 3252 阅读 · 0 评论 -
Linux
Linux忘记密码开机的时候按'e'进入编辑模式选择kernel,按e进入kernel编辑模式输入(空格 1)---->按b重启Linux目录结构目录作用/Linux系统的根目录,一般只存放目录/bin和/usr/bin命令(二进制)文件目录,包含可+供root用户和普通用户所使用的Linux命令和二进制文件,包含shell解析器等/boot...原创 2018-11-20 10:06:06 · 579 阅读 · 0 评论