自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 Hive 数据倾斜(调优)

1、什么是数据倾斜?由于数据分布不均匀,造成数据大量的集中到一点,造成数据热点2、数据倾斜的原因(1)key分布不均匀(2)业务数据本身的特性(3)建表时考虑不周(4)某些SQL语句本身就有数据倾斜3、容易数据倾斜情况4、主要表现任务进度长时间维持在99%(或100%),查看任务监控页面,发现只有少量(1个或几个)reduce子任务未完成。因为其处理的数据量和其他reduce差异过大。单一reduce的记录数与平均记录数差异过大,通常可能达到3倍甚至更多。 最长时长远大于平均时长。5

2021-03-02 00:35:19 201

原创 JDBC,HDBC

JDBC一、创建maven工程,导入相应的jar包因为访问数据库需要用到专门的第三方工具类的jar包,所以我们在使用时需要引入外部jar包 <!-- https://mvnrepository.com/artifact/mysql/mysql-connector-java --> <dependency> <groupId>mysql</groupId> <artifactId>mysql-connector-

2021-01-10 12:16:56 569

原创 Spark连接Hive,mysql

Spark集成Hive一、将hive/conf下的hive-site.xml拷贝到spark/conf下ln -s /opt/software/hadoop/hive110/conf/hive-site.xml /opt/software/hadoop/spark244/conf/hive-site.xml这里使用的是软连接命令,修改hive-site.xml时,两边同时会生效二、将mysql-connector-java-5.1.32.jar拷贝到spark/jars下cp /opt/down

2021-01-10 10:53:37 264

原创 Scala学习-Array的方法

Scala:ArrayScala 语言中提供的数组是用来存储固定大小的同类型元素,数组对于每一门编辑应语言来说都是重要的数据结构之一。声明数组变量并不是声明 number0、number1、…、number99 一个个单独的变量,而是声明一个就像 numbers 这样的变量,然后使用 numbers[0]、numbers[1]、…、numbers[99] 来表示一个个单独的变量。数组中某个指定的元素是通过索引来访问的。数组的第一个元素索引为0,最后一个元素的索引为元素总数减1。同时,Scala提供了

2020-12-20 12:40:57 481 1

原创 Sqoop迁移Hadoop与RDBMS间的数据

一、Mysql->Hbasesqoop import \--connect jdbc:mysql://single/kb10mysql \--username root \--password kb10 \--table student \--hbase-table kb10:mysql_student \--column-family stuPhone \--hbase-create-table \--hbase-row-key stuNo \--hbase-bulkload

2020-11-19 18:39:36 78

原创 Hive函数整理(一)

Hive函数整理(一)数学函数集合函数数学函数1、double log(double base,double a)说明:返回底数为base的a的对数例子:2、pow(double base,double p)说明:底数为base的p的幂值例子:3、conv(bigint/string base,int from_base,int to_base)说明:将数值base从from_base进制转为to_base进制例子:4、pmod(int/double a,int/dou

2020-11-19 16:53:00 276

原创 JAVA排序(希尔,桶)

#希尔排序int[] arr = {13, 46, 79, 36, 93, 58, 81, 87, 98, 99, 100, 0, 45, 76, 25};int step = arr.length;while((step=step/2)>2){ for(int i=0,t;i+step>arr.length;i++){ if(arr[i]>arr[i+step]){ t = arr[step]; arr[step] = arr[i]; arr[i] = t;

2020-10-05 15:39:54 66

原创 JAVA图形打印

#直角三角形for (int i=1;i<=5;i++){ for (int j=1;j<=i;j++){ System.out.print("*"); } System.out.println();}//倒置的直角三角形for (int i = 1;i<=5;i++){ for (int j=1;j<=6-i;j++){ System.out.print("*"); } System.out.println();}打印结果

2020-10-04 15:20:07 120

原创 JAVA排序(冒泡,选择,插入)

#JAVA排序算法首先,我们给定一个数组int[] arr = {23,56,89,12,45,78,79,46,13,52};1、冒泡排序int t;for(int i=0;i<arr.length-1;i++){ for (int j=0;j<arr.length-1-i;j++){ if (arr[j]>arr[j+1]){ t = arr[j]; arr[j] = arr[j+1]; arr[j+1] = t; } }}2、选择排

2020-10-03 15:50:50 152

原创 Java基础知识点(持续更新)

Java**Java是一个平台** JVM java virtual machine java虚拟机(用软件模拟硬件) JRE java runtime environment java运行时环境 JDK java development kit java开发工具包 目录:bin jar.exe 打jar包 java.exe 执行java字节码程序->启动虚拟机 javac.exe 编译java源程序->生成字节码程序 javadoc.exe 生成文

2020-10-02 18:07:40 128

原创 第一个web页面

<html> <head> <title>淘宝</title> <link rel="stylesheet" type="text/css" href="css/com.css"/> <link rel="stylesheet" type="text/css" href="css/taobao.css"/> </head> <body> <header class="header"&g

2020-10-02 17:13:45 469

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除