自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

皮卡帅的博客

大数据

  • 博客(14)
  • 收藏
  • 关注

原创 ID-MAPPING解绑实现(图计算)

ID-MAPPING、图算法(BFS、DFS)、数据孤岛问题

2024-09-20 16:10:54 295

原创 git命令:多人合作开发,子分支与主分支merge

git命令:多人合作开发,子分支与主分支merge

2022-08-24 15:16:03 1846 2

转载 基于字典树实现AC自动机实现内容关键词检索

package com.xdf.udf.util;import java.util.*;import lombok.Data;/** * @version V1.0 * @ClassName ACTrie * @Description 基于字典树实现AC自动机 * @Author DFT * @Date 2020/5/20 0020 * @see "" */public class ACTrie { private boolean failureSetted = false;.

2021-06-16 15:30:35 8977

原创 sql实现用户ID关系数据归一化绑定(可根据多列聚合,存在多列,任意一个列出现相等情况则这些数据属于同一个人或者说同一个标识)

sql实现数据归一化工作中真实数据因涉及法律责任不便展示,以下为模拟数据。注:务必看完此文章因为第一种实现存在bug,后边附带解释以及完整代码。模拟数据:我们拿三个列实现归一作为举例,n列同理。 SELECT '1' unionid,'3' userid,'1' phoneid UNION ALL SELECT '1' unionid,'4' userid,'3' phoneid UNION ALL SELECT '2' unionid,'3' userid,'

2021-01-15 02:08:25 14587 2

转载 Spring AOP(execution表达式)

Spring AOP(execution表达式)execution解释:AspectJ中的exection表达式小结:基本语法格式为:1)通过方法签名定义切点2)通过类定义切点3)通过类包定义切点4)通过方法入参定义切点官方文档解释及举例:备注:参考资料:Spring官网:http://spring.io/docsexecution(* com.sample.service.impl..*.*(..))execution解释:符号含义execution()表达式的主体;第一

2020-12-22 11:35:48 14697

转载 Java注释@interface@Retention@Target等的用法

Java注释@interface@Retention@Target等的用法@Override@Deprecated@SuppressWarnings@Retention@Targetjava用 @interface Annotation{ } 定义一个注解 @Annotation,一个注解是一个类@Override,@Deprecated,@SuppressWarnings为常见的3个注解。注解相当于一种标记,在程序中加上了注解就等于为程序加上了某种标记,以后,JAVAC编译器,开发工具和其他程序

2020-12-18 14:44:11 14800

原创 基于控制台的五子棋小游戏(简易)

基于控制台的五子棋小游戏(简易)话不多少上代码使用:new完直接运行 public static void main(String[] args) { new GoBang(); }GoBang类:import java.util.Arrays;import java.util.Scanner;/** * @Author Ma Shuai * @Date 2020-11-23 18:44 * @Version 1.0 */public class

2020-11-24 14:35:58 14559

转载 详细hive sql 执行顺序

执行顺序从1到91.from2.join on 或 lateral view explode3.where4.group by (group 以后可以使用别名)5.聚合函数 如sum() avg() count()6.having (group 可以在group之后再进行过滤)7.select 中若包含over() 开窗函数,执行完非开窗函数后,select执行开窗函数,开窗函数通过表数据进行分区和排序,跟select查询中的字段是平行关系,不依赖查询字段。8.distinct9.o

2020-11-16 16:50:16 15245

原创 java集合Arraylist的简单实现

java集合Arraylist的简单实现简单说明输出展示源代码public class test { public static void main(String[] args) { System.out.println("java集合Arraylist的简单实现"); //Arraylist集合的简单实现 myArr<Integer> arr = new myArr<>(); //存入数据 fo

2020-11-06 15:01:55 14612 2

转载 最全HIVE SQL字符串运算(字符串拼接、补足、拆分、截取、反转、trim修剪、ascii码、json解析、位置查找等)

最全HIVE字符串运算(字符串拼接、补足、拆分、截取、反转、trim修剪、ascii码、json解析、位置查找)加粗样式1、字符串长度函数:length语法: length(string A)返回值: int说明:返回字符串A的长度举例:hive> select length(‘abcedfg’)72、字符串反转函数:reverse语法: reverse(string A)返回值: string说明:返回字符串A的反转结果举例:hive> select reverse(

2020-09-02 16:23:43 28095

转载 HIVE 建表 插入数据 文件格式与压缩格式算法比较

HIVE 文件格式与压缩格式一: mapreduce 的压缩mapreduce 压缩 主要是在shuffle阶段的优化。shuffle 端的–partition (分区)– sort (排序)– combine (合并)– compress (压缩)– group (分组)在mapreduce 优化shuffle 从本质上是解决磁盘的IO 与网络IO 问题。减少 集群件的文件传输处理。二: hive 的压缩:压缩的和解压需要cpu的,hive 的常见的压缩格式:bzip2,gzip

2020-08-24 14:09:22 15189

原创 spark一行转多行操作并存储文件到hdfs为parquet格式

spark一行转多行操作并存储文件到hdfs为parquet格式object Run:trait SparkUtils:(这里只是构建sparksession实例并返回,可自行创建)实现结果:注意:直接上代码了,有不足之处,望大佬指正。object Run:object Run extends SparkUtils{ def main(args: Array[String]): Un...

2020-04-08 14:26:30 14765

原创 使用ambari搭建管理监控集群遇到的问题和搭建准备工作

使用ambari搭建管理监控集群遇到的问题和搭建准备工作**已亲测,强烈推荐**[Ambari具体搭建过程链接](https://www.cnblogs.com/zlslch/p/6629235.html)端口描述预准备Ambari+HDP整体介绍老的集群部署方式Ambari 集群部署方式:Ambari 部署步骤:安装ambari和hdp遇到的主要问题:已亲测,强烈推荐Ambari具体搭建过程链...

2020-01-19 11:28:25 15279

原创 HIVE面试题原理详解 统计用户连续交易的总额、连续登陆天数、连续登陆开始和结束时间、间隔天数

HIVE面试题原理详解 统计用户连续交易的总额、连续登陆天数、连续登陆开始和结束时间、间隔天数下面遇到不懂的窗口函数可自行学习创建数据表添加数据流程图第一步分析(子表a)第二步分析(子表b)第三步分析(子表c)完整的hql语句如下:总结下面遇到不懂的窗口函数可自行学习创建数据表create table lianxv(uid int comment "用户id",utime string ...

2019-12-11 16:54:58 15713 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除