不爱写sql的小趴菜-CSDN博客

select id, age, universityfrom user_profilewhere university like ‘%北京%’；2.select id,age,universityfrom user_profilewhere university regexp ‘北京’；3.select id,age,universityfrom user_profilewhere instr(university,‘北京’)；

2022-10-14 00:07:03 188

原创 mysql基础

mysql数据库入门操作指南

2022-07-30 10:00:00 191

原创 hive sql中常用时间处理函数(还有很多慢慢相遇)

hive 内置函数_更多具体参考官网

2022-06-23 08:32:39 967

原创创建hive外部表

创建hive表映射文件类型

2022-06-23 08:24:10 1477

原创普通用户在liunx中创建软链接

创建命令：ln -s 被链接文件的路径/被链接的文件链接到那个路径/为被链接文件自定义命名例如：这里的sudo (如果个人用户权限不够的话，不能创建软链接，sudo赋予root权限)下面是将/opt/cloudera/parcels/PHOENIX-5.0.0-cdh6.2.0.p0.1308267/lib/phoenix/ 路径下的 phoenix-5.0.0-cdh6.2.0-client.jar软链接到/opt/cloudera/parcels/FLINK/lib/flin

2022-05-11 15:40:26 1240

原创用dataX向PolarDB中导数据时，出现脏数据问题怎么解决

这是我的dataX 导数据的json文件，其中有个属性fieldDelimiter 我原本设置为 \u0001执行shell 脚本直接执行 dataX 导数据的json 文件会出现导入失败的现象：直接执行shell 脚本在黑窗口中看到的日志信息有限，那么去azkaban中通过任务调度的方式去执行 dataX导数据操作：日志信息显示是由于某一个字段值得问题导致数据导入失败：这里用dataX导入的数据是数仓中的 string 类型的数据导入到PolarDB表中对应的字段是

2022-05-06 17:51:39 3618 3

原创 scala版本的flink CDC

监控mysql 一个或者多个库中的一个或者多个表中的数据变化(增删改)首先确定使用的flink 版本：FlinkCDC 2.0 版本对应 Flink 1.13在pom文件中添加 FIinkCDC的依赖： <dependency> <groupId>com.alibaba.ververica</groupId> <artifactId>flink-connector-mysql-cdc</artifactId> &

2022-03-28 22:19:43 3635 2

原创 hive数仓的可视化工具-DBeaver

通过操作DBeaver界面连接hive数据仓库输入连接hive数仓的相关参数相关文件：hive-jdbc-uber-2.6.5.0-292.jar

2022-03-24 23:13:56 1881

原创 setup scala SDK引起的，flink程序执行异常

项目新拉取下来执行某个入口类前会报异常，也会提示让setup scala SDK设置自己的scala版本为入口类设置了scala版本，但是还会报错：如下Error:(5, 23) object common is not a member of package com.* .bigdataimport com. *.bigdata.common.config.EnvConfig此时主要看报错信息，会提示某几个类(本入口类引用到的类也需要设置scala版本)按住ctrl 鼠标点击如上框选中的

2022-03-15 20:33:56 2586

原创 Caused by:java.lang.VerifyError:class scala.tools.nsc.reporters.Reporter overrides final method echo

Caused by: java.lang.VerifyError: class scala.tools.nsc.reporters.Reporter overrides final method echo.(Ljava/lang/String;)Vscala版本flink程序：在编译、打包时一值报上面的异常，不能够正常编译和打包百度搜索了，大致在说是本地win上的scala版本跟IDEA上配置的scala版本问题，需要本地的scala版本高于IDEA上的版本。我自查了本地scala 通过cmd 的do

2022-03-15 20:22:34 1524

原创 IDEA中scala程序设置显示参数类型

使用.var自动补全后，都会弹出这个弹窗，要勾线下边这个框框才行。

2022-03-09 18:04:26 584

原创 flink的yarn模式部署项目到集群上

flink的yarn模式部署项目到集群上有两种：1是yarn-session2是yarn-per-job这里介绍一下yarn-session 方式提交flink程序：先申请一定的yarn资源，以后提交的flink程序，都放在这个资源里执行，公用这块资源。如果不对这块yarn资源进行杀死，它会一致存在。如何申请：1、普通申请：yarn-session.sh -d -jm 2048MB -nm qy-push-log -s 1 -tm 4096MB这里已经踩过一个坑了jm 如果设置小

2022-03-09 17:20:15 2499

原创 hive表注释中文乱码问题

先确定hive表的元数据信息存放位置：默认存放在 derby数据库大部分用户选择放到mysql数据库 mysql数据库又分为远程数据库和本地数据库区分放在那个mysql数据库，要查看hive-site.xml配置文件我这里演示的是：hive元数据存放到本地mysql数据库先进入到本地mysql数据库:直接登录进去：查看一下数据库信息我的hive元数据放在的是hive库中：show tables重点关注一下这几张表：COLUMNS_V2 hive表中字

2022-03-09 15:46:35 482

原创 hive中两数组类型的数据进行整合(array[])

1、–dws层经过处理后的数据select table1.user_id as user_id , table1.read_book_id as arrays --arrays字段在dws_qy_profile_reads_stat ,中该字段为 array[]类型的数据 from dws_reads table1 ;2、 –dwd_qy_profile_cpsshardn_user_recently_read表提供增量数据数据来源–统计每天的数据按照user_id字

2022-03-07 18:43:00 6936

原创 IDEA中全局搜索

IDEA中全局搜索某一个类，或者方法

2022-03-07 11:33:55 3277

原创执行程序报type OBJECT rather than

配置文件中application.conf红线圈住的部分过度相似，程序识别过程中会报异常

2022-03-04 18:37:00 353

原创 hive数仓表中数组类型的字段判空

对字段值使用size() 方法size(字段名称)=0hive表中的默认空字段值使用\N填充，如果一个字段值为空，将改表中这个字段值导入到PolarDB 、clickhouse 中后相应的会出现 \N 字样如果一张表中有较多的空值存在，此时\N 比较占用空间，可以使用alter table test_null set serdeproperties('serialization.null.format' = '');修改一下表对空值的默认处理1、字段类型为array(string) C

2022-03-03 08:48:07 1572

原创操作clickhouse数据库

CREATE TABLE kafka_clickhouse_os.ldy_pageclick(id String COMMENT ‘点击唯一ID’,ldy_type String COMMENT ‘落地页类型’,ldy_platform String COMMENT ‘落地页推广平台’,ldy_id Int64 COMMENT ‘落地页Id’,app_id String COMMENT ‘appId’,ip String COMMENT ‘ip地址’,ua String COMMENT ‘用

2022-02-15 08:05:51 952

原创 scala连接mysql数据库

pom依赖：<dependency> <groupId>mysql</groupId> <artifactId>mysql-connector-java</artifactId> <version>5.1.45</version> </dependency>程序：import java.sql.DriverManager object JdbcM

2022-02-10 10:29:09 2480

原创 scala的flink程序遇到的bug

Exception in thread “main” java.lang.NoClassDefFoundError运行那个类就就进行编辑那个类

2022-01-18 13:26:40 1591

原创提交flink程序到集群上

这里我演示的是 yarn的cluster模式首先来到IDEA中将咱们需要在环境上跑的程序，进行打包。这里使用的IDEA上的图形界面进行项目打包的(还是挺方便的)执行完上面三步后：项目的下面会出现target文件夹这里产生两个jar包，如果测试环境上有项目所需的资源jar的话，可以直接将较小的jar上传到环境上执行。如果测试环境上没有程序所需资源jar包，则需要将较大的jar包上传到环境上执行。两个jar之所以不一样大小，就是一个包含程序所需资源jar包，一个不包含程序所需资源jar包。

2022-01-05 23:00:22 4020 2

原创 linux解压遇到的问题

解压过程中遇到该问题Exiting with failure status due to previous errors，因为不是root用户没有权限。解决方案：1、可以使用root用户2、解压命令前面加上sudo

2021-12-23 10:28:25 956

原创安装kafkaManager

调研kafka的监控组件安装kafkaManager管理工具：下载地址：链接：http://pan.baidu.com/s/1bQ3lkM 密码：c251安装zip解压工具： yum install -y zip unzip解压命令unzip kafka-manager-1.3.0.7.zip -d /opt/重命名mv kafka-manager-1.3.0.7 kafka-manager解压后配置文件：application.conf23行左右 kafka-manager

2021-12-21 16:17:32 1374

原创将环境中jar包拿到本地，通过命令安装到本地maven中去

将环境中jar包拿到本地，通过命令安装到本地maven中去针对IDEA中下载某些jar速度太慢命令示例mvn install:install-file -DgroupId=shade.org.apache.parquet -DartifactId=parquet-format -Dversion=1.10.2-SNAPSHOT -Dpackaging=jar -Dfile=E:\lib\parquet-format-2.4.0.jar演示示例：1、hive-exec-2.1.1-cdh6.3.2

2021-12-20 18:49:48 1369

原创 IDEA执行程序时rror running ‘sparkSession‘: Command line is too long. Shorten command line for sparkSessio

错误日志:就很莫名奇妙rror running 'sparkSession': Command line is too long. Shorten command line for sparkSession or also for Application default configuration.1.在IDEA中找到 Run-> Edit Configurations打开2.在 Environment-> Shorten command line 的内容配置为 JAR即可解决参

2021-12-18 16:31:53 433 1

原创 golang安装步骤

1.首先找到资源下载地址：https://studygolang.com/dl2.下载完毕后(下图是下载好的文件)新建一个文件夹install_path，当作安装目录此处的install_file 是下载的资源文件，install_path是安装后产生的文件3.双击打开下载好的文件，一路next ,自定义安装路径(这里我的安装路径是install_path)4.widows 版本的不需要我们自己手动配置环境变量安装过程中，系统自动为我们配置了环境变量到我们的环境变量那块去验证一下

2021-11-20 11:00:21 11323 1

原创 win10电脑连上wifi，后没有网络

win10电脑连上wifi，后没有网络：一般是ip地址冲突1、鼠标右键网络图标(我这变问题已经解决，问题未解决前还是一个网状地球图标)2、右键之后会弹出，打开“网络和Internet”设置3、选择网络共享中心4、点击更改适配器设置6、选择要进行连接的网络（右键属性）7、右键属性完后选中Internet 协议版本4（TCP/ipv4）再点击属性8、自动获取IP地址9、按照以上步骤，我的最终连上了网！...

2021-10-24 18:08:11 6548

原创解决Centos7断电后系统无法正常启动

电脑突然蓝屏，随之就关机了。开着的linux虚拟机躺枪再次重启虚拟机如下提示：度娘一顿搜：很有牌面：整齐划一的解决方案xfs_repair -v -L /dev/dm-0 我的虚拟机无动于衷!!!浏览器中一顿点点点：终于等到你还好没放弃xfs_repair -v -L /dev/sda3虚拟机展示了一波米锅大片中的场景完了重启虚拟机reboot阳光普照大地希望也能照亮你我...

2021-09-13 16:51:48 3000 1