qq_37581329-CSDN博客

原创好久没写了

又好久没写了，工作太忙，以后还是得抽时间多写写。

2018-10-12 18:31:16 175

原创 python week01总结

这周主要学习了以下知识点：1.python的运行方式有以下两种：python hellotest.py./hellotest.py #采用这种方式必须在脚本文件中注释所使用的python解释器，如下：#!/usr/bin/env python3print("hello,world")2.python的注释方式，两种：#单行注释方式'''第一种多行注释方式'''"""第二...

2018-07-12 08:51:54 278

原创 mysql基础知识

今天来学习以下mysql常用指令的用法。1.登录mysql>mysql -h xxxxx -u root -p xxxxx;2.grant on 新增用户>>grant select,create,update,delete on *.* to zpp@localhost identified by "123456";运行zpp用户，密码123456，对本地的所有数据库的所有表...

2018-05-02 17:36:43 226

原创进入大数据行业

从去年4月份报名51CTO在线大数据培训课程，到现在，刚好1年时间，上星期刚拿到两份大数据职位的Offer，一份是大数据测试，一份是大数据运维。1年的辛苦，还是值得的，主要是实现了多年以来一直想转岗的愿望。最终选择大数据运维岗入职。全新的行业，全新的岗位，充满了挑战，虽然还没有真正入职，但从网上了解，要想做好大数据运维工作，接下来1年时间需要重点学习以下知识点：1）大数据几

2018-04-24 09:31:07 334

下载spark,并利用scp命令传到elephant节点的/opt目录，安装目录为/opt/spark我下载的是spark-2.1.2版本，cp spark-env.sh.template spark-env.shvim spark-env.sh添加以下内容export JAVA_HOME=/opt/jdk1.8.0_121export SCALA_HOME=/opt/scalaexport ...

2018-04-12 21:32:34 226

原创 HBase JAVA API实现HBase表操作

1.在centos系统中创建好hadoop,hbase集群，并启动，验证运行正常。2.新建eclipse Maven工程，工程名为MyHbase.3.把hadoop和hbase的相应配置文件分别放置到src/main/resource/hadoop和src/main/resource/hbase目录3.把上一步的hadoop目录和hbase目录文件添加到Libraries（Add Class Fo...

2018-04-05 14:20:02 1358

原创 HBase JAVA API学习

今天学习下hbase java API的知识，为后面hbase,flume,kafka,spark整合编程作准备。在网上查到一个博客，讲解的很详细，网址如下：http://www.cnblogs.com/tiantianbyconan/p/3557571.html在这里感谢原作者了，我主要根据他的资料整理总结下：1.获取配置 HBaseConfigurationHBaseConfigur...

2018-04-04 17:34:27 195

原创 flume将数据导入到hbase中

接着前面的练习，flume已经安装完成并可以正常运行。运行/opt/flume/bin/flume-ng version可以查看安装的版本。1.把/opt/hbase/lib目录下的以下文件复制替换到/opt/flume/lib目录下面[root@elephant lib]# cp protobuf-java-2.5.0.jar /opt/flume/libcp: overwrite `/opt...

2018-04-03 11:15:15 2530

原创搭建3个节点的hadoop集群（完全分布式部署）5 flume安装及flume导数据到hdfs

下载并安装flume,安装目录为/opt/flumemv flume-conf.properties.template flume-conf.propertiesmv flume-env.sh.template flume-env.sh修改flume-env.sh 环境变量,添加如下：export JAVA_HOME=/opt/jdk1.8.0_121FLUME_CLASSPATH="/op...

2018-04-02 17:41:46 1109

原创搭建3个节点的hadoop集群（完全分布式部署）4 安装scala与kafka

先只是安装在elephant节点上.先下载scala与kafka并解压放到/opt目录下面,版本如下：kafka_2.10-0.8.2.1.tgzscala-2.11.8.tgz在/etc/profile设置scala的目录启动kafkabin/kafka-server-start.sh config/server.properties新建topicbin/kafka-topics.sh --cr...

2018-04-02 16:47:06 378

原创搭建3个节点的hadoop集群（完全分布式部署）--3 zookeeper与hbase安装

zookeeper安装比较顺利，hbase安装好后总是运行不了，HMaster起来马上又掉了，折腾了两天终于搞定，下面详细介绍下这两个组件的安装。1.zookeeper在apache官网下载zookeeper组件，我下载的版本是：zookeeper-3.4.10.tar.gzscp上传到elephant节点的opt目录下面。解压缩 tar -zxvf zookeeper-3.4.10.tar.gz...

2018-04-02 13:18:58 587

原创搭建3个节点的hadoop集群（完全分布式部署）--2安装mysql及hive

网上下载mysql安装包文件，我下载的是：mysql-5.7.21-linux-glibc2.12-x86_64.tar.gz，tar解压后mv到mysql文件夹，启动mysql服务service mysqld start登录mysqlmysql -u root -p输入密码后，登录成功创建数据库hive,用来保存hive元数据create database hive;操作数据库的权限grant ...

2018-04-01 10:30:21 1885

原创搭建3个节点的hadoop集群（完全分布式部署）--1 安装虚拟机及hadoop组件

昨晚搞到晚上11.30，终于把hadoop组件安装好了，运行试了下，正常...这里记录下完全分布式hadoop集群的搭建步骤。1.VWMare平台安装之前已经安装好了，这里不详细说明。2.安装CentOS虚拟机1）下载好centos ISO安装文件，我安装的是centos6.5版本，安装mini desk模式2）安装好后，再安装VMTools，方便复制及操作centos系统。3）安装Java JD...

2018-03-29 16:40:40 1682

原创 spark java编程练习

今天练习了spark java常见操作。SparkConf conf=new SparkConf();conf.setAppName("xxxxxx");conf.setMaster("local");JavaSparkContext sc=new JavaSparkContext(conf);sc.setLogLevel("error");JavaRDD rdd1=

2017-09-22 20:34:27 827

原创用spark streaming实现黑名单实时过滤

项目介绍：本项目用spark streaming实现简单的黑名单实时过滤，用scala语言编写，用到的知识点如下：1.RDD,弹性分布式数据集2.ssc.socketTextStream("localhost",9999),利用socketTextStream接口编程，监控端口数据3.leftOuterJoin4.transform函数使用5. nc -lkv 9999

2017-09-03 11:47:20 2584

原创 2017/8/31

第一篇博客是在2017/2/17写的，当时还在学习android程序开发，记得在做无线点餐系统，转眼大半年过去了，转型开发之路并没有想象中的容易，从去年开始自学java，到后来学习android开发，也做了两个小项目，再到年后的决定学习大数据开发，一路走来，很庆幸，我没有放弃，每天晚上吃完饭，很自然就做在电脑前面，也习惯了这种状态，希望能一直保持下去。大数据课程已全部结束，但是感觉

2017-08-31 15:32:28 205

原创今天是2017.2.27，计划开始了

今天是2017.2.27，计划开始了

2017-02-27 20:35:30 225

做自己喜欢做的，并坚持做下去，就够了