自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 elasticsearch5.5.1单机和集群安装2合1及elasticsearch的使用

特点:1.倒排索引(也就是分词后做索引)2.安装过程非常简单,解压缩就能用3.没有明确主节点,搭建集群增加节点即可(集群最好3个或3个以上节点)4.查询非常快速安装过程如下:说明:1建议不要使用注册用户root,如果用root会启动不起来(除非进行配置)2如果是搭建集群先同步时间 date -s "2018-09-30 13:57:00"同时发送到所有节点上安装步骤安装jdk1...

2018-09-30 15:10:25 465

原创 logstash-2.3.1安装和kafka结合使用

logstash-2.3.1安装和kafka结合使用说明:1.logstash必须运行于jdk7.55以上版本(可参考的我另一篇博客安装https://blog.csdn.net/qq_16563637/article/details/81738113)2.logstash开发语言JRuby,运行于jvm3.logstash可以防止数据丢失并可以采集更多数据源(https://www.el...

2018-09-30 11:00:35 1159

原创 spark1.6+hadoop2.6+kafka2.10-0.8.2.1+zookeeper3.3.6安装及sparkStreaming代码编写和调试

安装环境安装之前确保设备至少有4GB内存,推荐8GBcentos7.2docker(这个安装请参考我的另一篇博客https://blog.csdn.net/qq_16563637/article/details/81699251)目标安装软件目标安装版本实际安装版本hadoop2.62.6spark1.61.6kafka2.10-0.8.2.1...

2018-09-29 22:04:52 613

原创 spark+kafka的使用(单词计数)

kafka的安装参考我的这边博客(https://blog.csdn.net/qq_16563637/article/details/82776276)1.安装zk集群2.config/server.properties添加zk地址:zookeeper.connect=node-1:2181,node-2:2181,node-3:2181修改broker.id(唯一的):broker.id...

2018-09-27 21:21:34 381

原创 sparkStreaming+flume实现内存计算(小数据量情况下)

架构分析sparkStreaming一般结合kafka使用,但是如果你的数据量比较小,就可以不用搭建kafka集群,那么flume提供了两种提供数据给sparkStreaming的方式一种是push,一种是Pull,Pull是sparkStreaming向flume拉取数据效果更好一些.因为push只能提供数据给一个spark,而Pull可以从多个flume进行拉取1安装flume到服务器上传...

2018-09-27 17:34:56 251

原创 spark结合hive的使用

spark对于hive的版本是有要求的spark1.6.1对应hive版本是1.2.1spark1.6.0对应hive版本是1.2.1我这里安装的版本是:spark1.6.0,hadoop2.6.0,hive 1.2.1,mysql5.6.35先安装mysql(参考我的另一篇博客https://blog.csdn.net/qq_16563637/article/details/81774...

2018-09-25 15:44:50 986

原创 sparkSql的使用

sparksql能与hive兼容并且可以读取多种数据源如sql1新建一个文件并保存1,zhangsan,182,lisi,193,wangwu,204,zhaoliu,212提交文件到hdfshdfs dfs -put person.txt /3使用map切分val rdd = sc.textFile("hdfs://node-1.itcast.cn:9000/person....

2018-09-23 17:58:19 216

原创 spark任务提交流程与管依赖和窄依赖

spark内核执行流程图代表4个阶段1构建RDD,进行join,groupBy,filter操作,形成DAG有向无环图(有方向,没有闭环),在最后一个action时完成DAG图,代表着数据流向2提交DAG为DAGScheduler,DAG调度器,主要是将DAG划分成一个个stage,并且提交stage切分的依据是宽依赖,也就是有网络的传递3TaskScheduler,Task调度器,...

2018-09-23 17:06:43 289

原创 hadoop常用命令

二、具体1、启动hadoop所有进程start-all.sh等价于start-dfs.sh + start-yarn.sh但是一般不推荐使用start-all.sh(因为开源框架中内部命令启动有很多问题)。2、单进程启动。sbin/start-dfs.shsbin/hadoop-daemons.sh --config .. --hostname .. start namenode ....

2018-09-22 17:11:38 273 2

原创 spark远程调试debug及编译spark源码

先将下面代码打包第一种方式先backage然后打断点,然后Debug执行main方法在idea中添加参数①点击Run下的Edit Configurations②配置Configuration页中的Program arguments选项,就可以在idea中传入参数,参数之间用空格隔开执行代码如下:package cn.itcast.spark.day1import org.apac...

2018-09-22 16:32:55 910

原创 spark的rdd分析

以一个简单的wc(单词计数)程序为例val rdd = sc.textFile("file:///root/wc").flatMap(_.split(" ")).map(_,1).reduceByKey(_,_).saveAsTextFile("file:///root/wc00")上面单词计数总共产生6个rdd可以执行下面语句查询rdd数量查

2018-09-22 15:35:46 370

原创 spark的RDD高级算子

http://homepage.cs.latrobe.edu.au/zhe/ZhenHeSparkRDDAPIExamples.htmlmap是对每个元素操作, mapPartitions是对其中的每个partition操作mapPartitionsWithIndex : 把每个partition中的分区号和对应的值拿出来, 看源码val func = (index: Int, iter...

2018-09-20 17:23:00 443

原创 spark的rdd算子

算子分类:具体:1、Value数据类型的Transformation算子,这种变换并不触发提交作业,针对处理的数据项是Value型的数据。2、Key-Value数据类型的Transfromation算子,这种变换并不触发提交作业,针对处理的数据项是Key-Value型的数据对。3、Action算子,这类算子会触发SparkContext提交Job作业。RDD有两种操作算子:1、Tran...

2018-09-20 16:57:30 230

原创 docker的pull过慢问题

今天启动tomcat启动了很长时间大约8分钟,发现tomcat一直卡主不滚动,日志如下Logging initialized using 'class org.apache.ibatis.logging.stdout.StdOutImpl' adapter.该程序最后能够启动起来,发现接口调用正常,所以出现这个问题以后可以正常使用时不用过多关注....

2018-09-19 22:43:55 1421

原创 docker安装kafka和zookeeper

1下载镜像docker pull wurstmeister/zookeeper docker pull wurstmeister/kafka 2启动zookeeper容器docker run -d --name zookeeper -p 2181:2181 -t wurstmeister/zookeeper3 启动kafka容器docker run -d --name ka...

2018-09-19 18:17:50 3104 2

原创 springmvc的controller即返回视图又能返回数据

在controller上面加上@ResponseBody能返回数据不加能返回视图,有没有根据入参做出判断既能返回视图又能返回数据的方式,本人尝试了一下,亲测可用@RequestMapping("/ajaxPaymentBatchApproveProcess") public Object ajaxPaymentBatchApproveProcess(String packageIds,...

2018-09-05 13:55:11 3168 2

转载 Storm之——Storm+Kafka+Flume+Zookeeper+MySQL实现数据实时分析(程序案例篇)

改文章为转载,出处为http://blog.csdn.net/l1028386804/article/details/79441007,本文已按照作者要求转载 ...

2018-09-04 11:23:25 243

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除