自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 Spark学习内容

Scala安装一、官网下载安装Scala:scala-2.12.8.tgzhttps://www.scala-lang.org/download/1.将压缩包从Windows传输到Linux当前目录下SecureCRT 【File】→【Connect SFTP Session】开启sftp操作put C:/Users/l/Douments/scala-2.12.8.tgz2.安装解压...

2019-05-25 21:27:25 193

原创 安装配置Hive、MySQL及其JDBC驱动编写HiveQL语句,实现数据库、表、视图的基本操作。HiveQL语句实现wordcount程序。

MySQL安装① 官网下载mysql-server(yum安装)wget http://dev.mysql.com/get/mysql-community-release-el7-5.noarch.rpm若wget不可用,下载安装wget:yum -y install wget② 解压rpm -ivhmysql-community-release-el7-5.noarch.rpm③...

2019-05-25 16:55:21 216

原创 NoSQL的Redis和MongoDB安装以及常用命令的使用

Redis下载安装配置(Linux环境)下载: 官网:https://redis.io/在线安装:1 :进入到opt/module目录下、创建redis文件夹cd /opt/modulemkdir redis2:进入/opt/redis/目录下,下载rediswget http://download.redis.io/releases/redis-4.0.6.tar.gz如果wge...

2019-05-25 16:54:52 175

原创 NoSQL非关系数据库

**NoSQL非关系数据库**NoSQL(NoSQL = Not Only SQL ),意即"不仅仅是SQL"。是新发展起来的存储系统。是一种非关系型数据库,主要是解决是海量数据下的数据库性能和扩展能力。它最大的特点在于要求的数据量大,对事物的要求低。NoSQL 数据存储不需要固定的表结构,通常也不存在连接操作。在大数据存取上具备关系型数据库无法比拟的性能优势。NoSQL数据库的类型...

2019-05-25 16:54:04 172

原创 Hbase命令和Java API

HBase安装配置①下载压缩包(选择与自己安装的Hadoop版本的兼容版本,见后面附录)官网下载地址:https://mirrors.tuna.tsinghua.edu.cn/apache/hbase/stable/选择稳定版hbase-1.4.9-bin.tar.gz,在Windows里面下载。②将压缩包从Windows传输到Linux当前目录下SecureCRT 【File】→【Co...

2019-05-25 16:53:26 147

原创 HDFS命令和Java API

安装配置JDK+Eclipse+Maven步骤:1.安装JDK→2.安装Eclipse→3.安装Maven→4. Eclipse里配置Maven (下载Windows版本,在Windows里安装使用。)1.安装配置JDK①官网下载Java开发工具安装包jdk-8u201-windows-x64.exe:https://www.oracle.com/technetwork/java/javas...

2019-05-25 16:52:27 130

原创 MapReduce(编程调试WordCount程序 生成jar包,在虚拟机上运行)

使用Eclipse创建一个一个名为wordcound的Maven Project

2019-05-25 16:51:46 1690 1

原创 JDK+Hadoop安装配置、集群模式搭建以及Hadoop完全分布式模式配置

JDK+Hadoop安装配置、集群模式搭建成功的页面如下JDK+Hadoop安装配置、集群模式搭建步骤:1.关闭防火墙firewall-cmd–state 显示防火墙状态running/not runningsystemctl stopfirewalld 临时关闭防火墙,每次开机重新开启防火墙systemctl disablefirewalld 禁止防火墙服务。2.传输J...

2019-05-25 16:50:19 600

原创 第二次大数据学习内容

Hadoop生态圈Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。具有可靠、高效、可伸缩的特点。Hadoop的核心是YARN,HDFS和Mapreduce下图是hadoop生态系统,集成spark生态圈。在未来一段时间内,hadoop将于spark共存,hadoop与spark都能...

2019-05-19 23:32:10 243

原创 第一次大数据学习内容

大数据真的太神奇了,真的可以让改变一个企业的运营吗?答案是肯定的。大数据目前是当下最火热的词了,你要是不知道大数据这个概念,都不好意思在众人面前开口了。然而实际上很多人都对大数据的应用模糊不清。现在就让我们从下面十三个大数据应用案例来了解下最真实的大数据故事把,并鲜明得了解大数据在生活当中实际应用的情况。大数据应用案例之电视媒体  对于体育爱好者,追踪电视播放的最新运动赛事几乎是一件不可能的事情...

2019-05-19 23:31:48 712

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除