自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

大数据学习笔记

大数据学习笔记

  • 博客(28)
  • 资源 (1)
  • 收藏
  • 关注

原创 java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMet

在hive服务器运行以下命令。

2024-03-14 14:19:57 404

原创 记录一下云虚拟机lvm扩展的问题

关于云上,lvm的磁盘扩展

2023-03-17 10:46:24 163

原创 银河麒麟v10系统维护记录

占用较大,先停用 systemctl stop audit。1.aduit进程内存占用高问题。

2023-02-10 14:38:02 2589 3

原创 kingbase 创建用户报错

1)CREATE ROLE/USER: 系统管理员用户在创建普通用户时不可指定密码等选项。最近一直在根据等保要求对kingbase做安全配置,刚接触kingbase,搞得头大。2)ALTER ROLE/USER: 只有sso和普通用户本身可以更改普通用户的密码。3)ALTER ROLE/USER: 系统管理员只能修改超级用户,或超级用户权限选项。百度无解,后发现测试服务器的可以正常加,然后就对比一下两台服务器的配置。发现sso_update_user这个插件比较可疑,去除配置就正常。

2022-12-01 11:53:34 610

原创 在ubuntu 20.04使用微信和qq等常用工具

ubuntu 微信、qq、企业微信的安装使用

2022-05-04 10:27:06 1582

转载 银河麒麟V10——安装VNC实现远程桌面

​​​​​​安装图像界面yum grouplistyum groupintall -y "Server wiht UKUI GUI"systemctl get-defaultsystemctl set-default graphical.targetreboot卸载yum groupremove "Server with UKUI GUI"安装vncyum install tigervnc-server -yrpm -qa|grep tigervnc-ser..

2022-04-19 15:11:27 5977

原创 麒麟 Linux 挂载大于2T的硬盘

linux 大于2t磁盘挂载 lvm

2022-04-13 16:12:25 3210

原创 基于ubuntu制作jdk1.8的镜像

ubuntu jdk

2022-03-18 17:08:21 1796

原创 Ubuntu 20.04 安装nginx

ubuntu 安装nginx

2022-03-15 11:35:23 6946

原创 centos7 lvm 重新调整根分区大小

通过lvm的方式调整磁盘大小2.查看分区情况3.卸载删除/home4.对根目录扩容lvextend -L +800G /dev/mapper/centos-root,然后扩展/root文件系统 :xfs_growfs /dev/mapper/centos-root5.重新创建数据目录lvcreate -L 1000G -n data centos,mkfs.xfs /dev/centos/data6.挂载数据...

2021-08-27 15:49:05 2362

原创 spark 日志带来的空间问题

环境:ambari +hdp2.6.4最近发现hdfs的空间越来越少,少到影响数据分析处理了。使用名称查看一下到底是谁占了空间:hadoop fs -du -h /发现有两个文件夹站的空间是最大的:一个是/app-logs一个是/spark2-history删除文件夹下内容设置定时清理:## spark2-history日志spark.history.fs...

2019-02-28 11:43:53 538 2

原创 Yarn application has already ended! It might have been killed or unable to launch application master

环境:ambari+hdp 2.7.3出现背景:nodename服务器出现异常,发生重启。出现问题:以前能跑的pyspark脚本,运行的时候Yarn application has already ended! It might have been killed or unable to launch application master的错误。解决方法:1.在ambari中重启y...

2019-01-25 14:40:02 2771

原创 pypark处理文件异常处理。

环境:python:3.6spark:2.0datanode:3台,内存8g当使用通过spark加yarn的方式对一个4.6G的HDFS文件进行分析的时候,出现以下错误提示:org.apache.spark.shuffle.MetadataFetchFailedException:Missing an output location for shuffle 5 原因:分...

2018-09-05 09:18:36 285

原创 spark 导入文件到hive出现多小文件的问题

环境:ambari:2.6.1spark 2.1python 3.6oracle 11.2sqoop 1.4将sqoop采集到HDFS中的文件导入到HIVE数据库,导入成功后,发现hive数据库中出现多个小文件的问题,严重影响后期数据分析的加载速度。解决方法:SJTable = spark.sql("select * from " + t...

2018-09-04 17:38:57 2884 2

原创 数据清洗分析导出遇到的一些问题

本文简单记录一个学习过程,无技术含量,勿喷。环境:ambari:2.6.1spark 2.1python 3.6oracle 11.2sqoop 1.4最近一直在测试数据采集、清洗、分析、导出、展示的一系列的工作,主要数据流程如下:oracle 数据库-》hdfs-》hive-》oracle总的设计:通过任务调度的方式执行各个阶段的任务,其中各个任务通过脚本的方式实现,扩展的时候只需要增加对应的脚...

2018-06-28 10:36:56 2713

转载 Python源码安装cx_Oracle

最近需要将HIVE中的数据导入到oracle,采用了通过pyspark读取hive数据,然后通过python连接数据库,将数据插入到ORACLE的方案。所以涉及到了cx_orcacle的安装部署。以下是通过转载内容:https://www.cnblogs.com/sheng-247/p/7529289.html,其中比较纠结的是oracle_client的下载(屌丝没有oracle账号)。一、涉及...

2018-06-28 09:37:46 694

原创 通过spark sql创建HIVE的分区表

今天需要通过导入文本中的数据到HIVE数据库,而且因为预设该表的数据会比较大,所以采用分区表的设计方案。将表按地区和日期分区。在这个过程出现过一些BUG,记录以便后期查看。 spark.sql("use oracledb") spark.sql("CREATE TABLE IF NOT EXISTS " + tablename + " (OBUID STRING, BUS_ID STRING,R...

2018-06-11 14:00:50 14146

原创 通过py文件将文件中的数据导入到hive遇见的问题

因需要通过任务的方式执行将文本的数据导入到HIVE数据库中。所以考虑每次的任务通过命令执行py文件的方式来实现定时导入文件到HIVE数据库中。所以先做了一个测试,但是出行一些问题,现记录下来,供以后查看。测试脚本如下:# -*- coding: utf-8 -*-  from __future__ import print_functionfrom pyspark.sql import Spark...

2018-06-06 17:41:48 1391

原创 安装docker hue 并导入到内部服务器

环境:Centos 7.2Hue因管理需求,内部服务器不能上外网,离线安装Hue又是很苦逼的活,于是考虑在外网环境安装docker 版的hue,然后导出镜像,再导入到内部服务器。前提准备安装docker外部服务器和内部服务器都需要安装docker,内部服务器需要离线安装docker,安装步骤参考:https://mp.csdn.net/postedit/80269209外部服务器安装Docker ...

2018-05-10 17:36:08 2428 4

原创 安装docker

一、  安装 Docker1.    在线安装Docker 软件包和依赖包已经包含在默认的 CentOS-Extras 软件源里,安装命令如下:yum -y install docker-io或者执行Yum install docker2.    离线安装下载 docker-ce-selinux-17.03.2.ce-1.el7.centos.noarch.rpmhttps://download....

2018-05-10 15:57:36 263

原创 centos 7安装 mysql

环境:centos7.2mysql 5.71. 下载mysql安装源包wget http://dev.mysql.com/get/mysql57-community-release-el7-8.noarch.rpm2. 安装mysql 源yum localinstall mysql57-community-release-el7-8.noarch.rpm可以修改vim /etc/yum.repos...

2018-05-10 11:46:06 143

原创 flume采集ftp上传文件到hadoop

flume服务器环境centos 7.2jdk 1.8flume 1.8hadoop平台环境centos7.2ambari 2.6.1hdp 2.6.4jdk 1.8一、 ftp安装与配置参考:https://blog.csdn.net/qq_39160721/article/details/80250975二、flume安装与配置参考 :https://blog.csdn.net/qq_3916...

2018-05-09 16:48:49 8401

原创 flume 1.8 安装部署

环境centos:7.2JDK:1.8Flume:1.8一、Flume 安装1)        下载wget http://mirrors.tuna.tsinghua.edu.cn/apache/flume/1.8.0/apache-flume-1.8.0-bin.tar.gz2)        解压tar –zxvf apache-flume-1.8.0-bin.tar.gzmv apache-...

2018-05-09 16:12:29 13787 1

原创 spark读Hadoop文本文件到hive

环境centos:7.2python2:2.7.5python3:3.6.5spart:2.2.0ambari:2.6.1hdp:2.6.4一、指定pyspark的python 通过python3运行 1.软连接python3到/usr/bin/目录下 ln -s /usr/local/python3/bin/python3 /usr/bin/ 2.修改/usr/bin/pyspark文件 在...

2018-05-09 11:21:53 1084

原创 vsftp安装与配置

环境:centos:7.2一、安装1.查看是否安装 rpm -qa |grep vsftpd2.安装   yum install -y vsftpd2.防火墙: 查看防火墙服务状态 systemctl status firewall 查看防火墙的状态 firewall-cmd --state 查看防火墙规则 firewall-cmd --list-all  关闭防火墙 service firewa...

2018-05-09 11:19:01 889

原创 ambari 下hadoop平台各类管理地址

环境:centos:7.2oozie:2.4ambari:2.6.1hdp:2.6.4python2:2.7.5python3:3.6.5spart:2.2.0Ambari 页面:http://localhost:8080hadoop管理界面:http://localhost:8088NameNode界面:http://localhost:50070HDFS NameNode界面:http://l...

2018-05-08 16:45:51 1533

原创 安装oozie

安装oozie环境:centos:7.2oozie:2.4ambari:2.6.1hdp:2.6.41.安装通过ambari的ui安装oozie组件安装完成后,访问UI:http://10.250.11.60:11000/oozie/出现:Oozie web console is disabled.解决方法:下载http://archive.cloudera.com/gplextras/misc/...

2018-05-08 16:15:34 1054 1

原创 sqoop导orale 数据到HDFS 问题汇总

环境:数据源:oracle 11.2Ghadoop:ambari 2.6.1 hdp2.6.4sqoop :1.4.6出现的问题:问题1:ERROR sqoop.Sqoop: Got exception running Sqoop: java.lang.RuntimeException: Could not load db driver class: oracle.jdbc.OracleDrive...

2018-05-07 11:12:52 646

网络端口监控程序,查看本地监听端口的连接情况和本地连接端口情况

网络端口监控程序,查看本地监听端口的连接情况和本地连接端口情况

2022-12-06

python cx_oracle及oracle client的依赖包

cx_Oracle-6.3.1.tar.tgz,oracle client 11.2的rpm安装包,及安装说明。 cx_oracle是源文件安装,解压后,执行:python3 setup.py install

2006-03-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除