自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

取个昵称好难的博客

大数据知识分享交流

  • 博客(17)
  • 收藏
  • 关注

转载 2020大数据领域十大必读书籍

相信身边有很多应届毕业生以及想转行大数据的,状态大多都是:万脸懵逼。老司机教你:看书、写代码、多交流。2020你看了几本书呢?小编为大家精心挑选了大数据领域里十本有价值的书,先干掉这几本书,再和老司机谈大数据!不过,像《大数据时代》、《数据之巅》等这些经典到“烂大街”的书我就不一一推荐了,很多人都看过,没看过的也都听说过。   一、《Presto技术内幕》Presto是Facebook开发...

2020-02-09 13:10:22 3054

原创 Centos7多次开关机出现问题:Entering emergency mode.Exit the shell to continue 解决

因多次开关机无法正常使用centos7问题解决

2023-02-06 09:16:18 850 1

原创 Sqoop从mysql数据到HDFS报错处理

sqoop从mysql导入数据到HDFS报错

2021-12-23 11:41:51 1986

原创 Google的三驾马车

Google的三驾马车Google的伟大之处,不仅因为它建立了一个很好很强大的搜索引擎,而且还在于它创造了3项革命性技术:GFS、MapReduce和BigTable,即所谓的Google三驾马车。2003年10月19—22日,Google在美国纽约召开的第19届ACM操作系统原理研讨会(Symposium on Operating Systems Principles,SOSP)上,发表了论文《Google文件系统》,系统地介绍了Google面向大规模数据密集型应用的、可伸缩的分布式文件系统——GFS

2021-02-22 09:25:18 1219

原创 SpringBoot打war包

1.修改pom.xml文件//第一处<packaging>war</packaging>//添加依赖<dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-web</artifactId> <exclusions> <exclusion> &lt

2020-05-29 13:43:55 321

原创 Kettle在centos7下运行的坑(求解答)

Kettle在centos7下运行的坑(求解答)【前言】最近在工作中使用了Kettle,在windows下执行没有任何异常,但是在centos下执行资源库中的转换和任务时,疯狂报同一个错,查看了各种帖子也没有搞定,如果有大神恰巧看到这篇帖子,还请不吝赐教。下面来说说具体的错误:先上图:在centos7系统下执行文件资源库中的转化和作业时也可以正常执行,下面是我执行的命令:./pan.sh -rep=kettle -user=admin -pass=admin -trans=test./ki

2020-05-18 17:28:25 596

原创 解决虚拟机开启后网络异常(Job for network.service failed)方法

前言:今天早晨开启虚拟机(我用的是centsos7和VM),发现连接不了,通过ip a 命令发现无法获取到ip地址。下面来说说我的解决步骤。1.我想通过重启网络命令(systemctl restart network)看看是否有用,结果出现以下提示信息Restarting network (via systemctl): Job for network.service failed. See...

2020-02-10 09:05:28 7599 4

原创 CDH版本组件端口汇总

CDH版本组件端口汇总组件端口号端口用途HDFS50020DataNode 协议端口HDFS50010DataNode 收发器端口HDFS50075DataNode HTTP Web UI 端口HDFS50475安全 DataNode Web UI 端口HDFS14000REST端口HDFS14001管理端口HDF...

2020-02-05 16:55:36 2850 1

原创 hive中的lateral view(侧视图) 与 explode函数的使用

今天偶然间发现了一个hive中列转行的小题目,需要用到lateral view 和 explode函数,刚好借这题说说lateral view 与 explode函数的使用。题目是这样:原数据表如下图moviecategory《疑犯追踪》悬疑,动作,科幻,剧情《Lie to me》悬疑,警匪,动作,心理,剧情《战狼2》战争,动作,灾难需求:将电影分...

2019-12-27 14:52:43 1532

转载 【mysql】count(*),count(1)与count(column)区别

转自: https://www.cnblogs.com/CareySon/p/DifferenceBetweenCountStarAndCount1.html在SQL Server中Count()或者Count(1)或者Count(column)或许是最常用的聚合函数。很多人其实对这三者之间是区分不清的。本文会阐述着三者的作用,关系以及背后的原理。往常我经常会看到一些所谓的优化建议不使用Cou...

2019-12-25 16:27:38 250

原创 大数据环境搭建卷五(scala+spark+kafka+flume+sqoop)

一、安装scala1.解压并重命名tar -zxvf scala-2.13.1.tgz -C /opt/module/cd /opt/module/mv scala-2.13.1/ scala21312.配置环境变量并开启测试vi /etc/profile//末行添加##SCALA_HOMEexport SCALA_HOME=/opt/module/scala2131expo...

2019-11-21 19:51:09 391

原创 大数据环境搭建卷四(mysql+hive)

一、安装hive1.解压hive,并重命名cd /opt/softwaretar -zxvf hive-1.1.0-cdh5.14.2.tar.gz -C /opt/module/cd /opt/modulemv hive-1.1.0-cdh5.14.2/ hive1102.(1)修改/opt/module/hive110/conf目录下的hive-env.sh.template名称...

2019-11-20 14:00:22 253

原创 大数据环境搭建卷三(Zookeeper和HBase安装)

【前言】本章是继一、二卷之后再hadoop集群安装Zookeeper和HBase,可在本人博客查看卷一卷二。【步骤】一、安装Zookeeper1.解压cd /opt/software //包放置的位置tar -zxvf zookeeper-3.4.6.tar.gz -C /opt/module/cd /opt/module/mv zookeeper-3.4.6 zk346cd zk...

2019-11-19 17:26:39 223

原创 大数据环境搭建卷二(hadoop集群搭建3台)

【前言】本章是在《大数据环境搭建(卷一)》的基础上进行,可参考大数据环境搭建(卷一)。【步骤如下】1)克隆两台按卷一搭建的伪集群,分别修改主机名和IP地址,以及etc/hosts中的IP与主机名:vi /etc/sysconfig/network-script/ifcfg-ens33TYPE="Ethernet"BOOTPROTO="static"DEFROUTE="yes"PEE...

2019-11-19 09:58:05 241

原创 大数据环境搭建卷一(伪集群JDK+Hadoop)

大数据环境搭建(卷一)【前言:】本篇适合已经对hadoop生态圈以及熟练linux操作的用户阅读参考。【文章重点:】伪集群(1台)模式搭建,为卷二搭建集群(3台为例做准备)。目前先安装hadoop,后续会持续更新hbase、hive、zookeeper、spark、kafka等安装教程。【环境准备:】工具是用了VMware Workstation Pro15.5,centos7,hadoop...

2019-11-18 18:33:50 244

原创 Linux、jdk、mysql安装

Linux学习第一天学习目的:掌握Linux 安装设置静态ip地址修改yum源(可参考https://blog.csdn.net/zhaluo_dehezi/article/details/86689322)安装jdk1.8及配置安装mysql及配置(可参考https://blog.csdn.net/pengjunlee/article/details/81212250)设置无秘登录...

2019-08-13 12:19:17 274 1

原创 在linux系统中使用挂载方式取得文件(高效)

以下是个人整理,如有错误请多包涵,希望可以有所帮助,谢谢~

2019-07-14 19:39:22 349

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除