自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(34)
  • 收藏
  • 关注

原创 CentOS7使用firewall-cmd来管理端口开放

CentOS7 开放端口 通过firewall-cmd来操作背景自去年11月转项目经理,工作中技术占的比重少了很多,很久没有上这个博客,今天又想起这个途径,久违的登上,有些怀念。命令CentOS7提供firewall-cmd工具来操作防火墙。firewall-cmd--permanent:表示设置为永久,配置被写入配置文件。不会立即生效,重新启动防火墙加载配置后生效。不带此参数表示本次运行,立即生效首先,最常用的,开放、查询端口# 查询某个端口是否开放。本次运行[root@insta

2021-01-28 13:06:17 440

原创 【LINUX】配置网卡后重启network失败,Failed to start LSB:Bring up/down networking

背景:解决方法第一步:禁用NetworkManagersystemctl stop NetworkManagersystemctl disable NetworkManager第二步:修改配置文件,添加mac地址查看网卡信息# ip addr1: lo: link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00 inet 127.0.0.1/8 scope host lo valid_lft forever prefe

2020-10-21 15:04:41 1268

原创 【Hadoop】Hive的特点架构及启动方式

什么是Hive?Hive是基于Hadoop的一个数据仓库工具(离线),可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。避免了直接写MapReduce延迟比较高,适用于对实时性要求不高的场景处理大数据有优势效率低,调优困难架构启动方式前提:先启动hdfs和yarn1. 方式一:使用本地的metastore,直接通过hive命令启动在hive-site.xml文件中配置使用本地mysql数据库存储metastore <property> &l

2020-09-15 10:51:59 225

原创 【Hadoop】CRC校验

https://blog.csdn.net/weixin_44388193/article/details/102863673

2020-09-07 15:24:32 215

原创 【Linux】关于ls -l查看文件权限列末尾的加号及点

一、背景这两天用脚本测试hadoop,几个命令测试失败,查看脚本发现,问题在于权限比对,生成文件权限末尾多了个点号。我用的系统是Centos7.4,问了几个同事都不了解,有的虚拟机上没有点,有的有,还有出现过x的。二、第十一位找了资料发现,原来新版ls 把acl和selinux属性加进去了,与系统无关。新版的ls,用12字符长度的字符数组来记录文件权限,前十位和老版一样,第一位表示类型,后九位表示权限,第十一位表示acl和selinux设置,最后一个是C的结尾符\0。三、关于(.)查看seli

2020-09-02 14:11:51 3084

原创 【Hadoop】Error&Solution (2)

问题描述:配置loongoop环境,配置完hbase,启动hbase 时,出现警告:原因:仔细看是因为JDK1.8做了变动,不再支持某个配置,所以去相应的文件中注释掉就可以了解决方法:修改 hbase/conf/hbase-env.sh,注释掉下面两行,再重启hbase,即可反思:太急躁,遇到报错不仔细看,靠百度解决下次遇到同样的问题还是不熟悉。配置文件中有不止一个HBASE_MASTER_OPTS和HBASE_REGIONSERVER_OPTS,太急躁会弄错问题描述:...

2020-08-31 15:32:03 99

原创 【Linux】tar解压.zip文件报错

描述:用tar 解压 lgpbenchmark-master.zip ,报错原因:tar调用了gzip,而gzip不能解压所有文件Files created by zip can be uncompressed by gzip only if they have asingle member compressed with the ‘deflation’ method解决:用unzip -d 指定输出目录将压缩文件text.zip在当前目录下解压缩 unzip test.zip将压缩文件

2020-08-28 15:03:27 383

原创 【Linux】实时监控进程命令pidstat

https://www.cnblogs.com/mululu/p/5833722.html如何安装pidstat  pidstat 是sysstat软件套件的一部分,sysstat包含很多监控linux系统状态的工具,它能够从大多数linux发行版的软件源中获得。  在Debian/Ubuntu系统中可以使用下面的命令来安装  # apt-get install sysstat  CentOS/Fedora/RHEL版本的linux中则使用下面的命令:  # yum install sy

2020-08-19 16:03:04 162

原创 【Hadoop】Spark基础知识、配置及特点等学习

SparkSpark与MapReduce的区别Spark把运算中数据放到内存中,迭代计算效率会更高;MR的中间结果需要落地磁盘,所以大量的磁盘IO操作(瓶颈),会影响性能Spark采用RDD实现高容错。RDD(Resillient Distributed Dataset)即弹性数据集,分布式存在在集群节点内存中。Spark提供transformation和action两大类多功能API,另外还设计流式处理,机器学习,图计算。Spark框架生态更加丰富,可以根据不同场景调优;MR计算框架相对简单,

2020-08-19 16:02:35 134

原创 【Hadoop】视图、分区与索引

加粗 斜体 标题 删除线 无序 有序 待办 引用 代码块 BashCC++C#CLikeCSSGoHandlebarsJavaJavaScriptKotlinMarkupObjective-CPerlPHPShellPythonRubySQLSwiftVB.NetYAMLErlangScalaClojureCobolCoffeeScriptCommonLispHtm

2020-08-19 16:02:17 534

原创 【Hadoop】Spark集群搭建学习

https://blog.csdn.net/qq_42246689/article/details/86253396一、Spark基本框架结构Spark集群由一下部分组成:Cluster Manager:集群管理器,主要负责资源的分配与管理。他将各个worker上的内存、CPU等资源分配给应用程序,但不对Executor的资源分配负责。目前,Standalone、YARN、Mesos、K8S、EC2等都可以作为Spark的集群管理器。Master: Spark集群的主节点Worker: Spar

2020-08-18 09:34:03 92

原创 【Hadoop】Hive命令

hive语句区分大小写hive> show tables;假设有一个描述学生的文件student.txt,文件里面的内容如下:zhangsan,14,165cuihua,13,160wangwu,15,168现在我们要把这些数据存放在hive中。和RDBMS一样,Hive把数据组织成表。我们使用CREATE TABLE语言为学生的数据新建一个表:创建表CREATE TABLE students(name STRING,age INT,stature INT)ROW FORMAT DE

2020-08-12 11:04:17 214

原创 【Hadoop】Hive基础

初识Hive一、什么是HiveHive是构建在hadoop之上的数据仓库。不是用来增删改查的那种数据库,那是数据库。1)数据计算是MapReduce2)数据存储是HDFS二、 认识HiveHive 是基于 Hadoop 构建的一套数据仓库分析系统,它提供了丰富的 SQL 查询方式来分析存储在 Hadoop 分布式文件系统中的数据, 可以*将结构化的数据文件映射为一张数据库表*,并提供完整的 SQL 查询功能,可以将 SQL 语句转换为 MapReduce 任务进行运行,通过自己的 SQL

2020-08-11 14:25:39 180

原创 【Mysql】记录Centos7.4安装mariadb的郁闷经历

为了搭建hive,先安装MariaDB。我先按照手册上的安装,然而公司的yum源缺少mysql-server包。网上也找不到对应版本的包。参考其他博客,基本都是直接yum或者wget到,但是网卡配置我这边没有,也不能用这个方法。后来在公司的共享文件夹中翻到了mariadb一系列rpm包,找了官方文档https://mariadb.com/kb/en/installing-mariadb-with-the-rpm-tool/,开始装依赖没问题,但是问题又来了,没有对应版本的mariadb-lib包,我这

2020-08-10 18:05:59 149

原创 【Mysql】安装报错缺少libaso.so.1

之前安装mysql都是按照一个博客教程,没有问题。最近系统换成Centos7.4,执行到scripts/mysql_install_db --user=mysql,出现报错usr/local/mysql/bin/mysqld: error while loading shared libraries: libaio.so.1: cannot open shared object file: No such file or directory缺少libaio参考了博客https://www.cnblo

2020-08-10 16:23:53 651 1

原创 【Linux】-bash: ls: command not found

最近部署大数据集群,环境变量一直有点问题,主要是不能在其他目录直接运行hadoop命令。周一回来就出现了ls也无法使用。主要是记录下,在没法vi /etc/profile的情况下(vi命令也找不到了),先进行export PATH=/bin:/usr/bin:$PATH这是临时解决方法,目的是可以去编辑/etc/profile或者.bash_profile。/etc/profile和.bash_profile的区别.bash_profile是针对用户个人环境变量设置然后修改文件,source,就o

2020-08-10 15:27:11 77

原创 【Hadoop】HBase目录结构

https://blog.csdn.net/L_15156024189/article/details/83444255

2020-08-06 18:42:18 163

原创 【Hadoop】HBase基础、数据结构及架构

关系型数据库:存储结构直观反映实体关系,内部采用库表结构,适合保存长期稳定数据,典型的有:mysql sqlserver非关系型数据库(Nosql):数据全部由键值对(key/value)组成,一般都采用内存缓存方式存在,可以更加快速的读取数据。适合追求速度和可扩展性、业务多变的应用场景。一、概要HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统。适合海量数据(如20PB)的秒级简单查询的数据库。HBase是一种列式存储的数据库,也是一种NOSQ

2020-08-06 17:33:37 193

原创 【Hadoop】HBase自带性能测试工具

PerformanceEvaluation该工具是hbase自带的性能压测工具,基本原理是用多线程模拟多用户同时访问集群的情况。命令为:hbase org.apache.hadoop.hbase.PerformanceEvaluation可以简写为 hbase pe直接在linux shell里输入命令,可以看到用法介绍options:(搭配例子一起学习更好理解)nomapred hbase pe默认使用mapreduce读写扫描数据,如果使用多线程/客户端并发来代替mapreduce

2020-08-06 15:19:09 1026

原创 【Hadoop】HBase集群搭建及基本操作

集群搭建https://blog.51cto.com/14048416/2342814https://blog.csdn.net/gongxifacai_believe/article/details/81151090

2020-08-05 16:09:45 107

原创 【Hadoop】Error&Solution

问题描述: 启动hadoop集群start-all.sh,无报错。jps查看,master上只有DataNode没有NameNode解决方法: 查看NameNode日志($HADOOP_HOME/logs/hadoop-root-namenode-master.log),发现报错信息:原因:namenode元数据被破坏,需要修复解决:恢复一下namenodehadoop namenode -recover一路选择c,一般就OK了问题描述: 启动hdfs,jps查看无DataNode解..

2020-08-05 14:40:31 232

原创 【Hadoop】Zookeeper集群搭建和命令

集群搭建参考 https://www.cnblogs.com/Dcl-Snow/p/11274807.html基本命令https://blog.csdn.net/dandandeshangni/article/details/80558383补充修改/创建节点,若数据包含空格,可用双引号括住内容,即可操作成功zk中 watcher是一次性的,触发后立即销毁...

2020-08-03 17:53:38 113

原创 【Hadoop】Zookeeper基础初探

分布式的、开源的,应用程序协调服务,是Hadoop和Hbase的重要组件提供通用的分布式锁服务,用以协调分布式应用zookeeper=文件系统+监听通知机制应用场景担任生产者和服务消费者的注册中心分布式应用配置管理统一命名服务状态同步服务集群管理容错:宕掉节点个数必须小于剩下的。用2n-1台和2n台效果一样重要基础概念Session指Zookeeper服务器与客户端会话,客户端与服务器连接使用TCP协议。客户端能够通过心跳检测与服务器保持有效的会话,也能够向Zookeep

2020-07-30 18:29:53 448

原创 【Hadoop】管理集群相关命令

查看hdfs节点的状态:在master上使用 hadoop dfsadmin -report重启挂掉的节点在挂掉的机器上sbin/hadoop-daemon.sh start datanode //启动数据节点

2020-07-30 15:25:11 127

原创 【Hadoop】Yarn框架学习

学习了两天,对整体框架、运行机制、组件的功能和关系有了大概了解(框架图和机制图手绘在笔记本上)。详细的通信过程通读了一遍,很细碎繁琐,一时间很难记住,日后有需要再做补充。时间不宽裕,在此不进行完整记录阐述,仅记录部分要点。参考文章《hadoop之yarn详解》 https://www.cnblogs.com/zsql/p/11648894.html本文仅作博主学习记录使用每个应用程序有一个ApplicationMaster,每个任务对应一个container.ApplicationMaster监

2020-07-29 14:17:05 342

原创 【Hadoop】从wordcount看MapReduce的工作机制

MapReduce的工作机制物理实体参与MapReduce作业执行涉及4个独立的实体:客户端(client):编写mapreduce程序,配置job,提交job,这就是程序员完成的工作;JobTracker:初始化job,分配job,与TaskTracker通信,协调整个作业的执行;TaskTracker:保持与JobTracker的通信(定时发送心跳),在分配的数据片段上执行Map或Reduce任务,TaskTracker和JobTracker的不同有个很重要的方面,就是在执行任务时候Tas

2020-07-28 18:12:08 155

原创 【Hadoop】HDFS文件系统命令学习

格式调用文件系统的Shell命令为: /bin/hadoop fs <args>命令参数为URL路径,HDFS目录表示为hdfs://namenode:namenodeport/parent/child (在core-site.xml里配置了默认值,可以简写为/parent/child),本地文件系统为file://大多数FS Shell命令的行为和对应的Unix Shell命令类似,出错信息会输出到stderr,其他信息输出到stdout。1、put上传(一个或多个)文件(夹)到H.

2020-07-28 14:31:57 240

原创 【Hadoop】搭建HDFS集群和YARN集群

Hadoop的两个部分:YARN集群(MapReduce2)——管理调度任务资源HDFS——分布式文件系统,解决海量数据存储安装步骤环境预处理设置节点的hostname:修改 /etc/sysconfig/network,并执行命令使修改立即生效:hostname 节点名设置节点间免密登录一、安装jdk二、安装Hadoop2.7.2直接解压安装包,放到/usr/local/hadoop目录下三、修改Hadoop配置文件hadoop配置文件都在hadoop-2.7.

2020-07-24 15:33:44 542

原创 【Linux】启用/禁用网卡

启用禁用网卡可以使用以下 5 个方法来完成:ifconfig 命令用于配置网卡。它可以提供网卡的很多信息。ifconfig [NIC_NAME] Down/Upifdown/up 命令ifdown 命令用于禁用网卡,ifup 命令用于启用网卡。ifdown [NIC_NAME]ifup [NIC_NAME]注意:这两个命令不支持以 enpXXX 命名的新的网络设备。ip 命令用于管理网卡,用于替代老旧的、不推荐使用的 ifconfig 命令。它和 ifconfig 命令很相似,但是提供了

2020-06-08 11:12:42 1612

原创 【Linux】系统解压安装mysql

MySQL解压安装配置环境:centos6.5,自带mysql 5.1,需要安装mysql5.51、关闭防火墙2、将tar包解压至/usr/local下 tar -zxvf mysql-5.6.40-linux-glibc2.12-i686.tar.gz -C /usr/local3、将解压后的文件重命名为mysql4、创建mysql用户组及用户groupadd mysqluseradd -r -g mysql mysql5、进入到mysql目录,执行添加MySQL配置的操作cp sup

2020-05-15 17:44:36 195

原创 【Linux】系统安装、升级java

Linux安装jdk一、查看系统是否有自带的jdk1、输入:java -version2、发现有输入:rpm -qa | grep java 检测jdk的安装包,(注意:rpm命令符没有时记得下载一个输入:apt-get install +命令名称)3、升级则直接跳过该步,安装需要先卸载。一个个删除包,输入:rpm -e --nodeps +包名4、最后再次:rpm -qa | grep java检查是否删除完即可二、新建装jdk包的文件夹/usr/local/java,将压缩包解压在/usr

2020-05-15 17:44:14 296

原创 【Linux】 提高CPU占用率的脚本

测试需要,提高cpu使用率

2020-04-03 14:26:52 8539 1

原创 windows server2012 安装网卡驱动

WIN SERVER 安装网卡驱动背景为了搭域控创建了一台winserver2012镜像,并建了对应虚拟云。然而开机后发现没有网络设置,虚拟云勾选了网关随机分配ip然而并没有用。镜像和虚拟云都是原因安装系统时匆忙,没有装相关驱动,导致网关无法显示。解决思路重新加载驱动即可具体操作1.用管理员权限打开命令提示符,输入以下两行,回车执行:#bcdedit -set loadoptio...

2019-05-30 16:03:30 25829

转载 【Linux】Centos7安装gcc环境

**Centos7 安装gcc背景下载解压iozone.tar后,执行make进行编辑,提示错误:原因新安装的Linux(centos7)系统没有C语言环境解决方法安装gcc这里使用yum进行安装:[linuxidc@localhost linuxidc.com]$ sudo yum -y install gcc gcc-c++ kernel-devel验证安装完成:[l...

2019-04-29 14:19:10 5095

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除