![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据的学习
EllisonPei
NULL
展开
-
Google在大数据方面的三篇神文
MapReduce: http://blog.csdn.net/active1001/archive/2007/07/02/1675920.aspx GFS: http://blog.csdn.net/xuleicsu/archive/2005/11/10/526386.aspx BigTale: http://blog.csdn.net/accesine960/archive/2006/02/0...转载 2019-04-12 10:56:04 · 194 阅读 · 0 评论 -
错误总结
centos7错误总结: 1、centos7配置完成后无法访问hadoop101:50070 ? 1关闭防火墙 systemctl stop firewalld.service 2配置hdfs-site.xml <?xml version="1.0"?> <configuration> <property> <name>dfs....原创 2019-08-14 19:50:34 · 77 阅读 · 0 评论 -
hadoop命令总结
1、Centos7 命令大全:https://blog.csdn.net/qq_40087415/article/details/79367151。 与Centos其他版本不同的地方:https://blog.csdn.net/xiaojin21cen/article/details/83714177 2、关闭NodeManager 、ResourceManager和Hi...原创 2019-08-14 19:48:37 · 120 阅读 · 0 评论 -
Hadoop相关知识点
1、修改虚拟机IP地址、用户名: vim /etc/sysconfig/network-scripts/ifcfg-eth0 //永久性的修改主机名称,重启后能保持修改后的。 hostnamectl set-hostname xxx 2、配置文件说明: Hadoop配置文件分两类:默认配置文件和自定义配置文件,只有用户想修改某一默认配置值时,才需要修改自定义配置文件,更改相应属...原创 2019-08-14 19:46:22 · 148 阅读 · 0 评论 -
大数据界域的文章
MapReduce:http://blog.csdn.net/active1001/archive/2007/07/02/1675920.aspx GFS:http://blog.csdn.net/xuleicsu/archive/2005/11/10/526386.aspx BigTale:http://blog.csdn.net/accesine960/archive/2006/02/09...转载 2019-08-14 19:45:11 · 145 阅读 · 0 评论 -
LInux操作命令总结
目录 第1章 Linux入门 1.1 概述 1.2 Linux和Windows区别 1.3 Centos下载地址 第2章 VM与Linux的安装 2.1 VMWare安装 2.2 CentOS安装 2.3 VMTools安装 第3章 Linux文件与目录结构 3.1 Linux文件 3.2 Linux目录结构 第4章 VI/VIM编辑器 4.1 是什么 4.2 测试数据...转载 2019-04-18 17:09:56 · 791 阅读 · 0 评论 -
CDH平台——Cloudera虚拟机入门
官方说明文档:https://www.cloudera.com/documentation/enterprise/5-13-x/topics/hbase.html Apache Hbase :是一个可扩展,分布式,面向列的数据存储区。Apache HBase提供对HDFS上托管的大型数据集的实时读/写随机访问。 Hive:数据仓库软件可以在分布式存储中读取,写入和管理大型数据集。使用与SQL非常相...原创 2019-04-12 11:03:48 · 570 阅读 · 0 评论 -
ETL过程详解
ETL讲解(很详细!!!) ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。 ETL是BI项目重要的一个环节。 通常情况下,在BI项目中ETL会花掉整个项目至少1/3的时间,ETL设计的好坏直接关接到BI项目的成败。 ETL的设计分三部分:数据抽取、数据的清洗转换、数据的加载。在设计ETL的时候我...转载 2019-04-12 11:01:32 · 1781 阅读 · 1 评论 -
centos 7 命令总结
1、Centos7 命令大全:https://blog.csdn.net/qq_40087415/article/details/79367151。 与Centos其他版本不同的地方:https://blog.csdn.net/xiaojin21cen/article/details/83714177 2、关闭NodeManager 、ResourceManager和HistoryManager ...原创 2019-04-12 10:59:53 · 161 阅读 · 0 评论 -
Cloudera虚拟机入门
官方说明文档:https://www.cloudera.com/documentation/enterprise/5-13-x/topics/hbase.html Apache Hbase :是一个可扩展,分布式,面向列的数据存储区。Apache HBase提供对HDFS上托管的大型数据集的实时读/写随机访问。 Hive:数据仓库软件可以在分布式存储中读取,写入和管理大型数据集。使用与SQL非...原创 2019-08-14 19:54:48 · 189 阅读 · 0 评论