自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 kafka基础

Kafka 中的术语 broker:中间的kafka cluster,存储消息,是由多个server组成的集群。 topic:kafka给消息提供的分类方式。broker用来存储不同topic的消息数据。 producer:往broker中某个topic里面生产数据。 consumer:从broker中某个topic获取数据。 Kafka 中的术语设计: 1、Broker 中间的kafka cluster,存储消息,是由多个server组成的集群。 2、topic与消息 kafka将所有消息组织成多个

2020-05-26 19:22:00 223

原创 HIVE基础

什么是hive:是基于Hadoop的一个数据仓库工具,可以将结构化数据文件映射为一张表,并提供SQL查询功能。 本质:将HQL转化成MapReduce程序; 1)Hive处理的数据存储在HDFS 2)Hive分析数据底层的实现是MapReduce 3)执行程序运行在Yarn上 1.2.1 优点 1)操作接口采用类SQL语法,提供快速开发的能力(简单、容易上手)。 2)避免了去写MapReduce,...

2020-05-26 18:18:43 186

原创 Scala基础复习(1)

Scala 简介 Scala 是 Scalable Language 的简写,是一门多范式的编程语言 联邦理工学院洛桑(EPFL)的Martin Odersky于2001年基于Funnel的工作开始设计Scala。 Funnel是把函数式编程思想和Petri网相结合的一种编程语言。 Odersky先前的工作是Generic Java和javac(Sun Java编译器)。Java平台的Scala于2003年底/2004年初发布。.NET平台的Scala发布于2004年6月。该语言第二个版本,v2.0,发布于

2020-05-22 15:52:30 341

原创 spark知识点总结

** 1、Spark简介 **  1)、Spark的历史:2012年发布初始版本0.6版本,已经有6年的历史了。  2)、Spark的创始人:美国加州大学的伯克利分校的AMP实验室。  3)、Spark比MR快的原因:    ①Spark是粗粒度的资源调度,资源复用。    ②Spark支持基于内存迭代,MR不支持。    ③Spark支持DAG有向无环图 task pipleline。    ④...

2020-02-14 14:56:21 352

原创 2.1 Flume安装地址

2.1 Flume安装地址 1) Flume官网地址 http://flume.apache.org/ 2)文档查看地址 http://flume.apache.org/FlumeUserGuide.html 3)下载地址 http://archive.apache.org/dist/flume/ 2.2 安装部署 1)将apache-flume-1.7.0-bin.tar.gz上传到linux的...

2019-11-29 11:47:56 286

原创 大数据技术之Hadoop(入门)

大数据技术之Hadoop(入门) 第1章 大数据概论 1.1 大数据概念 大数据概念如图下图所示。 图2-1 大数据概念 1.2 大数据特点(4V) 大数据特点如图2-2,2-3,2-4,2-5所示 图2-2 大数据特点之大量 图2-3 大数据特点之高速 图2-4 大数据特点之多样 图2-5 大数据特点之低价值密度 1.3 大数据应用场景 大数据应用场景如图2-6,2-7,2-8,2-9,2-10...

2019-11-10 21:15:50 395

原创 大数据技术之Shell

大数据技术之Shell 第1章 Shell概述 第2章 Shell解析器 (1)Linux提供的Shell解析器有: [jinghnag@hadoop101 ~]$ cat /etc/shells /bin/sh /bin/bash /sbin/nologin /bin/dash /bin/tcsh /bin/csh (2)bash和sh的关系 [jinghnag@hadoop101 bin]$ ...

2019-11-10 21:15:22 347

原创 Linux的基本安装,与常用指令

Linux目录结构简介: 目录结构 说明 /bin 是Binary的缩写,这个目录存放着最经常使用的命令 /sbin s就是Super User的意思,这里存放的系统管理员使用的系统管理程序 /home 存放普通用户的主目录,在Linux中每个用户都有自己的一个目录,一般该目录是以用户的账户命名 /root 该目录为系统管理员,也称作超级权限者的用户主目录 /lib 系统开机所需要最基本的动态连接...

2019-11-10 21:12:17 259

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除