自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

weixin:tchongyu

量化转型的路上

  • 博客(29)
  • 收藏
  • 关注

转载 差集、并集、交集

2020-06-04 02:08:07 1429

转载 pinbar源码

pinbar源码。

2022-08-08 22:02:06 1383

原创 hive向map类型插入多条数据

insert into map_type select map('2','t2','3','t3','4','t4','5','t5','6','t6') from (select 1) t;

2021-04-14 18:52:50 1280

原创 爬虫

https://github.com/liyangbit/PyDataRoad

2020-07-23 04:11:55 117

原创 spark2.3env配置

export JAVA_HOME=/jxdsj/opt/modules/java/jdk1.8.0_211-amd64export SCALA_HOME=/jxdsj/opt/modules/scala-2.11.12export SPARK_LOCAL_IP=CXGHDSJFXJM-10-242-24-2.domain.localdomainexport HADOOP_CONF_DIR=/jxdsj/opt/modules/hadoop-2.6.0-cdh5.14.2/etc/hadoopexp.

2020-05-09 02:36:39 116

原创 hive配置

<configuration><property> <name>javax.jdo.option.ConnectionURL</name> <value>jdbc:mysql://CXGHDSJFXJM-10-242-24-3.domain.localdomain:3306/metastore?useSSL=false</value></property><property> <name&gt.

2020-05-09 02:32:44 102

原创 spark on yarn关键配置

配置面向节点情况:每台42G内存 1.6T磁盘 总计1.3T数据<configuration><!-- Site specific YARN configuration properties --><!-- 指定哪个节点作为resourcemanager --><property> <name>yarn.resourcemanager.hostname</name> <value>CXGHDSJFXJM..

2020-05-09 02:30:28 164

原创 压缩脚本linux shell

#!/bin/bash#传入日期参数startdate=$1enddate=$2echo "startdate:${startdate} enddate:${enddate}"echo "############################################"#遍历日期for (( d=0; d<=300; d++));do if [[ ${enddate} -lt ${startdate} ]];then break fi echo "${startd.

2020-05-09 02:14:10 116

转载 arraybuffer操作

https://www.cnblogs.com/juncaoit/p/6252854.html

2020-05-01 04:02:29 174

转载 压缩与解压

linux解压tar命令tar [-cxtzjvfpPN] 文件与目录 ....参数:-c :建立一个压缩文件的参数指令(create 的意思);-x :解开一个压缩文件的参数指令!-t :查看 tarfile 里面的文件!特别注意,在参数的下达中, c/x/t 仅能存在一个!不可同时存在!因为不可能同时压缩与解压缩。-z :是否同时具有 gzip 的属性?亦即是否需要用 g...

2020-04-26 03:39:12 123

原创 sed

sed -i ‘1d’ / 删首行sed -n ‘1,10000p’ 展示第一行到第10000行

2020-04-25 11:39:12 89

原创 压缩、解压

解压:tar xf /root/go_kubelet_make.tar.xz -C /root/压缩:tar -cJvf go_kubelet_make.tar.xz go_kubelet_make/

2020-04-25 03:26:03 92

转载 Spark访问HIVE上面的数据

知识点1:Spark访问HIVE上面的数据  配置注意点:.    1.拷贝mysql-connector-java-5.1.38-bin.jar等相关的jar包到你${spark_home}/lib中(spark2.0之后是${spark_home}/jars下),不清楚就全部拷贝过去    2.将Hive的配置文件hive-site.xml拷贝到${spark_home}/conf...

2020-04-22 13:51:42 203

原创 Scala判空处理

从row中get值时, 为空问题get数值类型:如果为空, 则转化为0判空, 建议使用row.isNullAt(index)get字符串类型:如果为空则为null判空建议用:StringUtils.isEmpty() (出现""的情况)总结:获取值用getAsT判空用row.isNullAt以及StringUtils.isEmpty()...

2020-04-21 00:08:33 3394

原创 成功解决mysql目录迁移报错问题

https://m.jb51.net/article/150090.htm

2020-04-04 01:35:25 274

原创 hive,spark部分面试考察点

预警:黄牛用户统计/黑名单的统计/异常用户的统计实时ETL/实时转发对实时数据做一个预测(sparkstreaming+机器学习)

2020-03-09 02:03:46 283

转载 Hive窗口函数解析

简介本文主要介绍hive中的窗口函数.hive中的窗口函数和sql中的窗口函数相类似,都是用来做一些数据分析类的工作,一般用于olap分析(在线分析处理)。概念我们都知道在sql中有一类函数叫做聚合函数,例如sum()、avg()、max()等等,这类函数可以将多行数据按照规则聚集为一行,一般来讲聚集后的行数是要少于聚集前的行数的.但是有时我们想要既显示聚集前的数据,又要显示聚集后的数...

2019-11-04 13:24:53 176

原创 HADOOP面试核心问题总结

大数据:无法在一定时间用常规工具处理的海量信息资产企业大数据多来源于日志、数据库、爬虫等Hadoop体系架构:HDFS(Hadoop Distributed File System)、YARN、MapReduce、Common Hadoop Common: 为其他Hadoop模块提供基础设施 Hadoop HDFS: ...

2019-10-27 19:57:16 124

原创 hadoop作业遇到的问题

此处用正则表达式作为空格分割符String[] split = value.toString().split("\\s+");package com.sortpartition;import org.apache.hadoop.io.WritableComparable;import java.io.DataInput;import java.io.DataOutput;...

2019-10-23 23:21:36 138

原创 虚拟机linux安装部署

2019-10-19 20:25:16 83

原创 JAVA实现HDFS文件增删查改

package com.hadoop01;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.*;import org.apache.hadoop.io.IOUtils;import java.io.FileInputStream;import java.io.FileOutputStream...

2019-10-19 00:01:59 186

原创 oracle SQL语句

--修改表结构--添加字段alter table student add phone varchar2(11);--修改列的类型alter table student modify gender varchar2(1);--修改列的名字alter table student rename column gender to sex;--删除列alter table student ...

2019-10-17 15:16:57 97

原创 Hadoop

HDFS处理流程NameNode是主节点,存储文件的元数据如文件名,文件目录结构,文件属性(生成时间,副本数,文件权限),以及每个文件的块列表和块所在DataNode等。 DataNode 在本地文件系统存储文件块数据,以及块数据的校验和。 Secondary NameNode 用来监控HDFS状态的辅助后台程序,每隔一段时间获取HDFS元数据的快照。HDFSClient 客...

2019-10-17 13:34:04 257

原创 mysql jdbc

dao层:package com.beifeng.dao;import com.beifeng.util.CnfUtil;import java.sql.*;import java.util.ArrayList;/** * @author qiqu */public class BaseDao { Connection conn = null; ...

2019-10-10 21:55:34 168 2

原创 排序算法

冒泡排序、插入排序、希尔排序、快速排序package com.ibeifeng.javase.luojiyunsuan;import java.util.Arrays;public class PaiXu { public void bubbleSort(int arr[]) { int tmp = 0; for (int n = 0; n &...

2019-09-24 02:18:26 104 1

原创 java核心编程

Java集合框架:Collections binnerySearch()方法二进制检索,replaceAll()替换Collections sort()方法的应用:​package com.ibeifeng.javase.kaoshi;import java.util.ArrayList;import java.util.Collections;public class ...

2019-09-16 21:02:39 442

原创 面向对象(Java)

设计模式 设计原则 开闭原则: 抽象约束,封装变化 里氏替换原则: 子类可扩展父类但不能改变父类 依赖倒置原则: 面向接口编程 单一职责原则: 控制类粒度大小,使其利于重用 接口隔离原则: 为提高内聚性,降低类对接口依赖性,分解接口 迪米特法则: 限制类实体间通信宽度和深度 合成复用原则: 尽量使用聚合或组合关系 设计模式:...

2019-09-11 22:47:14 530

原创 Java基础(内存分配)

1. 常用DOS命令: dir(directory):列出当前目录文件及文件夹 exit:退出dos命令行 cls(clear screen):清屏 ipconfig:查看ip ping:尝试请求某个IP或地址,并发送数据包2. 键盘快捷键: ctrl+s:保存 ... 3. Java的优势、特点:**跨平台**,简单...

2019-09-02 23:02:21 350

原创 1.java基础笔记与JDK安装配置与卸载(2019年8月)

1.JDK下载:https://www.oracle.com/(注意:需要注册登录才可以下载)下载路径软件安装软件卸载环境变量配置选择高级系统设置——>环境变量——>win10系统两种环境变量配置方式:1.将JDK安装路径复制粘贴至系统变量PATH路径,并添加\bin.2.在系统变量中添加JAVA_HOME变量,并将jdk安装路径复制...

2019-08-30 18:37:33 133

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除