- 博客(3)
- 资源 (2)
- 收藏
- 关注
原创 集群时间同步
1、rpm -qa | grep ntp 查看服务是否已安装 2、如果没有安装 1>搜索:yum list | grep ntp 2>安装 yum -y install ntp.x86_64(小编这里是ntp.x86_64) 3、配置时间服务器 vi /etc/ntp.conf # Hosts on local network are less restricted. #res...
2018-12-11 20:18:41 176
原创 hive
hive hive出现 fscebook最初研发来用于处理海量的社交数据和机器学习 简化分析:使用sql hive简介 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。 hicve架构 用户连接客户端:cli、jdbc/odbc web gui 第三方服务:thrift server metastore:hive的元数据(库名、表名...
2018-12-11 19:30:51 803
原创 mapreduce
mapreduce是什么? 分布式并行离线计算框架,是一个分布式计算程序的编程框架,时用户开发“基于Hadoop的数据分析应用" 的核心框架 ###mapreduce的核心功能 将用户编写的业务逻辑代码和自带默认组建整合成一个完整的分布式运算程序,兵法运行在Hadoop集群上 关键词 关键字 解释 job 用户的每一个计算请求称为一个作业。 Task 每一个作业,都需要拆分...
2018-12-04 20:01:36 211
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人