自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

星辰大数据的博客

大数据、数据处理、数据挖掘、机器学习领域博主

  • 博客(20)
  • 资源 (8)
  • 收藏
  • 关注

原创 spark 操作 MySQL数据库

pom.xml:https://blog.csdn.net/qq262593421/article/details/105769886SparkJDBCExample.scalapackage com.xtd.spark.imoocimport org.apache.spark.sql.SparkSessionobject SparkJDBCExample { def ma...

2020-04-28 17:51:42 1061

原创 CDH spark submit error:Can't create directory Permission denied

问题描述cdh系统重新配置之后,发现spark任务提交失败,报错信息是本地目录创建的权限问题Can't create directory Permission denied问题解决在yarn配置中搜索 cgroup,把“始终使用 Linux Container Executor”选项取消勾选,再重新部署配置...

2020-04-27 11:04:40 1770

原创 IDEA 编写 第一个spark项目

scala 2.11.12 下载:https://www.scala-lang.org/download/scala 2.11.12(Linux):scala-2.11.12.tgzscala 2.11.12(windows):scala-2.11.12.zipIDEA 新建一个 Maven项目Maven项目创建成功提示[INFO] BUILD SUCCESS...

2020-04-26 16:16:15 1341

原创 spark2.4.0 scala2.11.12 Maven构建 pom.xml

<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/maven-v4_0...

2020-04-26 15:25:16 3306

原创 CDH报错:Resource management is disabled for host cdh03 but at least one of its roles has cgroup parame

问题描述Resource management is disabled for host cdh03 but at least one of its roles has cgroup parame问题解决CDH进入YARN配置页面,搜索 cgroup ,将以下两个选项配置勾选将 CGroups 用于资源管理yarn.nodemanager.linux-cont...

2020-04-26 14:07:34 1319 1

原创 Linux 安装 scala2.12.11

一、下载scala安装包Linux:scala-2.12.11.tgzwindow:scala-2.12.11.zip二、上传到Linux下cd /usr/localrz三、解压scala安装包tar -zxvf /usr/local/scala-2.12.11.tgz -C /usr/local/四、创建软链接ln -s /usr/local/scal...

2020-04-23 14:45:03 2185 3

原创 windows安装cygwin,再也不用开虚拟机练习Linux命令了

前言什么是cygwin?cygwin大量GNU和开源工具的集合,它们提供的功能类似于Windows上的Linux发行版。一个提供大量POSIX API功能的DLL (cygwin1.dll)。1、Cygwin 下载http://www.cygwin.com/setup-x86_64.exe2、Cygwin 安装点击setup-x86_64.exe安装选择 I...

2020-04-22 17:32:30 2597 11

原创 cdh6.3.2 oozie HA 高可用配置

1、配置Oozie Load Balancer(1)进入Oozie配置页面,搜索关键字 port(2)在Oozie Load Balancer栏输入需要开启oozie的host,以逗号隔开cdh01,cdh02,cdh03,cdh04,cdh05,cdh062、配置 Oozie Load Balancer HTTP、HTTPSPort注意:定义的 htt...

2020-04-20 19:41:34 2447 11

翻译 CDH6.3.2 Maven Repository: report

CDH 6.3.2The following table lists the project name, groupId, artifactId, and version required to access each CDH artifact.Project groupId artifactId version Apache Avro org.apach...

2020-04-20 10:46:21 1578 2

原创 shell脚本监控文件夹文件实现自动上传数据到hive表

createtb.sh#!/bin/bash#string="tablename;field1,field2,field3,field4;partition1,partition2,partition3"string=$*group=(${string//;/ })for i in ${group[@]};do ((m++)) if [[ m -eq 1 ]]...

2020-04-16 16:54:18 1854

原创 oozie调用shell脚本

job.propertiesnameNode=hdfs://cdh01:8020resourceManager=cdh01:8032queueName=defaultexamplesRoot=examplesoozie.wf.application.path=${nameNode}/user/${user.name}/${examplesRoot}/apps/sshexec...

2020-04-14 19:23:41 1887 1

原创 CDH hadoop生态的所有组件路径

目录一、CDH自身组件1、cloudera-scm-server2、cloudera-scm-agent二、Hadoop生态组件1、hadoop2、hive3、hbase4、zookeeper5、spark三、CDH加载的环境变量一、CDH自身组件1、cloudera-scm-server/etc/cloudera-scm-server/...

2020-04-11 17:57:33 3583

原创 拒绝手敲,hive创建表只需要输入表名和字段即可自动建表(shell脚本实现)

#!/bin/bash# $1:表名 $2:分区1 $3:分区2 $4-$n:基础字段# 数据库名称,这里不作为参数用自变量写了database="observation"# hive 拼接语句,分为h1,h2,h3 # h1是建表语句的前半部,h2是参数列表中间部分,h3是建表语句的后半部h1="create external table $database.$1("# ...

2020-04-10 17:30:26 2186 3

原创 shell for循环拼接字符串

# 在当前目录下创建文本文件temp,如果文件存在则清空文件$(> tempfile)# for 循环将参数追加到当前目录的temp文件,逗号分隔,echo -n 不换行for ((i=4;i<$#;i++));do echo -n ${i}, >> tempfile done# h2取tempfile文本里的字符串h2=$(cat tempfile)# ...

2020-04-10 16:14:17 12933

原创 三种方法实现Linux打印文件夹下所有文件的日期信息

ls --full-time -lt | tail -n -$(ls | wc -l) | awk '{print $6,$7}'

2020-04-09 16:15:20 1898

原创 Linux 查看目录下所有的日期信息(按最新日期排序)

# 当前目录有四个文件ll# 查看目录下文件日期的详细信息ls --full-timemonitor.sh#!/bin/bashecho "-----------------"let "total=$(ls | wc -l)"list=$(ls --full-time -lt | tail -n -$total | awk '{print $6,$7}'...

2020-04-09 14:18:46 5583

原创 Linux 离线安装 python 3.6.10

准备文件:Python-3.6.10.tgzcd /usr/local/tar -zxvf Python-3.6.10.tgzcd /usr/local/Python-3.6.10yum updateyum -y install gcc-c++./configure./configure --enable-optimizationsmake && make in...

2020-04-08 19:29:14 1274

原创 Linux shell脚本实现命令批处理和文件批量分发

vim exall.sh#!/bin/bashecho "------start execyting the shell script------"# awk 读取hosts文件的第二部分hosts=$(cat /etc/hosts | tail -n +3 | awk '{print $1}')# 传递的指令(参数)cmd=$*# for循环读取文件for host ...

2020-04-06 23:07:22 1778 2

原创 大数据入门之 ssh 免密码登录

1、root用户登录,每台机器生产公钥和密钥ssh-keygen输入之后回车键,再输入两次root用户密码,Linux会生成两个密钥:公钥和私钥公钥文件:/root/.ssh/id_rsa.pub私钥文件:/root/.ssh/id_rsa2、查看生成的公钥和私钥cd ~/.ssh/llpwd# 查看公钥cat /root/.ssh/id_rs...

2020-04-06 13:09:34 1227

原创 大数据进阶之 shell 脚本开发

shell脚本赋权chmod 777 file.sh1、for循环打印数组arr1=(20 21 23 24 25)arr2=(a b c d e f g)for i in ${arr1[*]};do echo -e $i "\c"doneechofor i in ${arr2[@]};do echo -e $i "\c"doneecho# -e:...

2020-04-04 23:30:46 973 1

DllConsole.zip

这是一个由Qt5.14.1 QT console application项目调用动态链接库即 .dll文件的例子,适用于不懂配置编写QT代码的初学者测试调用环境的Demo

2020-03-27

InitDll.zip

这是一个由Qt5.14.1生成动态链接库 .dll 文件的Demo,适用于不懂配置编写QT代码的初学者测试环境的Demo

2020-03-27

DllConsole.zip

Qt5.14.1调用动态链接库 .dll 文件的例子,调用dll库其实很简单,就是把dll文件和.h文件拷贝过来,.pro文件添加LIBS配置就可以了

2020-03-27

InitDll.zip

Qt5.14.1生成的动态链接库Demo,用于生成动态链接 .dll文件, 项目是Qt5.14.1最新版本的动态链接库Demo

2020-03-27

CrawlingWebPage.zip

Programming multi - machine multi - thread high concurrency python framework to achieve the distributed timing of news web page crawling.

2020-01-16

GraduationSubject.zip

毕业设计选题管理 增删查改:学生信息管理(导入/查/改/删)、老师(含指导老师和系领导)信息管理 业务功能:学生选老师、老师确认指导的学生、学生报题目、指导老师查看与修改题目信 息、提交报送选题给系部审核、查看审核结果。

2019-12-30

SpringMVCC.zip

这是一个用Eclipse纯手写的SpringMVC 5.1.5.RELEASE 的简单小例子,适合新手搭建时参考

2019-08-22

基于Spring+SpringMVC+Druid+Boostarp的图书馆管理系统

基于Spring+SpringMVC+Druid+Boostarp的图书馆管理系统 版本号: jdk1.8,Maven3.6,Tomcat8.0,MySQL5.7

2019-08-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除