自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(43)
  • 资源 (1)
  • 收藏
  • 关注

原创 pg库 cannot delete from table because it does not have a replica identity and publishes deletes

ALTER TABLE table_name REPLICA IDENTITY DEFAULT没用。

2024-04-28 16:34:04 169

原创 es解锁只读模式

put http://xxx.xxx.xxx.xxx:9200/_settings{“index.blocks.read_only_allow_delete”:false}

2024-04-18 21:27:50 115

原创 spark字符串解码成binary数组再转string

val a = “string”val b = DatatypeConverter.parseBase64Binary(a)val str = new String(b,“UTF-8”)

2024-03-26 10:53:22 288

原创 linux查找历史操作语句

快速查找使用该文本的shell语句。

2024-03-25 10:39:56 83

原创 spark中dataframe起别名对join过程的影响

今天之前我认为这里不应该用别名,因为join进程已经结束,两个dataFrame的组合键已经对应完成,新df的schema只有一个seq1。今天实验的时候发现别名会对结果产生影响,就像schema里有两个seq1,对不同的seq1筛选范围不一样。

2024-02-29 10:35:05 256

原创 hive修改压缩格式使可以使用删除语句

【代码】hive修改压缩格式使可以使用删除语句。

2024-02-26 11:20:34 112

原创 scala字符串转日期转数字转字符串不同格式

2024-02-20 18:06:28 113

原创 hive查看表数据大小

会显示字段名,totalSize就是数据库里表数据大小,单位为B,在计算时,要除以1024。

2024-01-31 09:39:45 331

原创 spark解决scala.matchError问题

matchError

2024-01-04 15:00:26 461

原创 postgresql拆分文本

pgsql文本拆分避免多次查询

2024-01-02 16:01:41 554

原创 GaussDB增删改查操作(备忘)

加字段alter table tablename add (column1 types1,column2 types2)改字段alter table tablename alter column columnname type types。改数据update tableName set column1=value1 where column2=value2。删数据delete from …和别的一样,基本用不到。插数据insert into…和别的一样,基本用不到。查数据select * from…

2023-12-29 17:20:51 829

原创 scala代码连接华为云dws(gaussDB 200)数据库,适用于本地jar包引入maven库(gsjdbc200.jar)

dws gauss200 本地jar引入maven

2023-10-12 18:19:20 715

原创 java.lang.NoSuchMethodError:scala.Predef$.refArrayOps

scala新旧版本冲突导致找不到方法

2023-07-10 14:10:42 1453

原创 我遇到的telnet无法打开主机连接到问题

telnet无法打开主机连接到

2023-03-10 15:00:40 2973

原创 python 字符串转dataframe

字符串转dataframe

2022-06-21 10:29:50 1225

原创 python list循环去重(比对上一行)

pthon list for循环,if...else...循环

2022-06-21 10:15:19 455

原创 python字符串截取多个指定内容,正则匹配

python 截取字符串 正则匹配 findAll

2022-06-21 09:59:06 1078

原创 紧急创建dataframe(spark版,非穷途陌路不可使用)

当插入少量文本数据进hive,使用load local data inpath …却因各种原因导致无法满足要求时,可以按照我下面的方法手动创建df并赋予字段名,以df插入hive表的方式填充import org.apache.spark.sql.{DataFrame,SparkSession}import ss.implicits._val a :DataFrame = ss.sparkContext.paralllelized(List("ABC,DEF","GHI,JKL",...)).ma...

2022-03-28 14:41:36 1513

原创 dolphinscheduler-2.0.3安装与测试(伪集群模式)

这次是在自己的虚拟机安装的dolphinscheduler2.0.3,为接下来集群模式打下基础。记录在单机集群模式下安装到测试成功的步骤与注意事项,后续有问题会继续修改。官网文档链接:https://dolphinscheduler.apache.org/zh-cn/docs/latest/user_doc/guide/installation/pseudo-cluster.html1.本机jdk与zookeeper版本:jdk:java version "1.8.0_201"zookeerpe

2022-02-23 17:55:32 2864 2

原创 zookeeper-3.6.3安装

zookeeper 安装1、xftp上传zookeeper压缩包并解压cd /opt/softlstar -zxvf apache-zookeeper-3.6.3-bin.tar.gzmv apache-zookeeper-3.6.3-bin soft/zookeeper3632、进入解压好的安装包 在conf文件夹下配置环境cd zookeeper363/cd conflscp zoo_sample.cfg zoo.cfgvi zoo.cfg 修改存储数据路径、添加zookee

2022-02-21 17:12:50 1445

原创 dolphinscheduler-2.0.3安装与测试(单机模式)

当前是简易版安装的dolphinschedule试用,所以一切只在standalone模式下使用,不适用于集群模式,或可以当作进行集群模式使用前的参考与奠基。第一步:选用一个虚拟机,装上jdk我用的jdk版本安装包是jdk-8u201-linux-x64.tar.gz按照网上来就行。其次,我本机安装的mysql版本是5.6.1。没有达到安装ds203需求的最低5.7+标准,我自己下载了8.0.16版本mysql-connect-java驱动器。目前尚无影响,后续有影响会进行重装和修改。安装d

2022-02-21 16:41:28 2145 1

原创 解决win10安装virtualBox没有host-only设置问题

在创建虚拟机时需要网络适配虚拟环境,就需要在我们的网络服务里添加能够访问虚拟机的虚拟网络如图所示(以太网2):,这里在安装虚拟机可以在设备管理器中手动添加,打开设备管理器我们的虚拟机无法访问就是缺少了VirtualBox Host-Only Ethernet Adapter,这个设备在我我们安装好虚拟机后就存在于我们的电脑之中。路径是D:\software\VB\drivers\network\netadp6,里面有个inf文件,添加到设备中就行了。添加方法是:1.先点击网络适配器,再点击操作

2022-02-18 17:11:28 7028 1

原创 win10环境安装jdk1.8,解决javac无法运行问题

win10电脑安装jdk

2022-02-15 14:45:58 4138 4

原创 统计踩坑日记(六)

leftsemi join 与 join的区别:left join 表示 " outer join " 中的左连接leftsemi join 和 left join 很像,在真实使用中也和left join 有很多相似之处leftsemi join :左半开连接会返回左边表的记录,前提是其记录对于右边表满足 on 语句中的判定条件。大多数sql语言会使用 in...exits 结构来处理这种情况。leftsemi join 是一种存在于hive中的SQL语法,在MySQL中无法使用,所以想要尝

2020-10-14 17:55:55 128

原创 统计踩坑日记(五)

统计踩坑日记(五)技术的熟练度来自于日复一日的坚持技术的提升来自于高熟练度以及偶然的灵光加油!遇到事情不能坐以待毙filter的n种写法:filter(expr("colname = '15'"))filter("COLNAME = 1")filter("A >= 1 AND B >=2 AND C>=3")filter(expr("(colname1 = '01' or colname1 = '02' or colname1 = '05') and colname2

2020-09-27 18:32:31 110

原创 统计踩坑日记(四)

scala 中val, var, def做写的博客最易懂的博主val 表示不可变变量val s = 1s = 2 //错误 s不可以被重复赋值var表示可变变量var s = 1s = 2 //正确def表示定义了一个方法def s = 1def df(a:Int,b:Int)从功能上看,def 的功能更加自由val和var都是创建对象,每次使用都会创建一个实例对象,后续所有对这个实例的操作都是基于这一个实例,除非新建对象取代实例对象的功能。def拥有val的功能,但每一

2020-09-23 16:29:05 87

原创 统计踩坑日记(三)

统计踩坑日记(三)细心决定一切程序员的下班时间是由他对当前手里项目有没有想法决定的,上周对三张表进行统计工作,就被细节问题折磨的欲仙欲死1.写代码的时候可以随心所欲点,但涉及到指标的生成、统计时就需要严阵以待。每个指标都建议大写,因为不是每个数据库都不区分大小写,比如kudu,他就不支持小写字母来对应指标名,所以一开始就养成指标名大写的习惯总是不会错的。如果不是在这上面耽误了几百分钟,我也不会在意。2.每条代码都事先写好所有的指标名的集合,可以省下繁复的drop(“column_name”)工作,

2020-09-21 18:12:56 122

原创 统计踩坑日记(二)

toDF:// 构造测试数据,有两个字段、名字和年龄val userData = Array(("A", 16), ("B", 21), ("B", 14), ("B", 18))//创建测试dfval userDF = spark.createDataFrame(userData)+-----+---+| ._1| ._2|+-----+---+| A | 16|| B | 21|| C | 14|| D | 18|+-----+---+.toDF("name

2020-08-25 22:47:05 108

原创 scala踩坑日记

统计踩坑日记:1.同一个包,同一个类下面的方法可以直接调用,实例:def stat (statDate : String):DataSet[Row] ={ val df = newstat(statDate) df}def newstat(stat:String):DataSet[Row] ={ df}2.scala可以向python一样优美,不需要各种调用,各种嵌套实例:val df1 = session.sql(s"......")df1.createTempView("df

2020-08-24 18:35:01 248

原创 elasticsearch指定文档id由输入字段两个或多个以上组成

项目场景:在使用elasticsearch时,常常会遇到需要指定文档id的场景,当文档id是由输入字段两个或多个以上组成的时候,这时候就犯了难。那么怎么处理呢?问题描述:文档id: 假设文档id由userid 和 queryTime组成,输入json字段属性为userid,username,queryTime,event 组成。这时候如何在不改变json字符串的基础上完成文档id由userid 和 queryTime组成的转变?原因分析:json字符串无法改变,elasticsearch7的特性是

2020-08-23 21:07:01 1791 3

原创 hadoop启动报错:ssh_exchange_identification: read: Connection reset by peer

今天启动hadoop首次遇到了ssh_exchange_identification: read: Connection reset by peer这个问题,在网上查找攻略后大多是下面这样的解法[root@km4 .ssh]# vi /etc/hosts.allow 追加sshd: ALL[root@km4 .ssh]# seervice sshd restart但我的问题不是这样,我...

2020-02-04 09:21:44 843

原创 Apache Hive学习

Apache Hive学习hive安装hive版本:hive-1.1.0-cdh5.14.2,环境:jdk1.8 、VirtualBox、hadoop2.6.0解压文件:关闭hadoop[root@km1 opt]#tar -zxvf hive-1.1.0-cdh5.14.2.tar.gz移动文件到soft文件夹下[root@km1 opt]#mv hive-1.1.0-cdh5.14...

2019-12-11 19:04:54 138

原创 Linux环境下安装Hadoop

Hadoop安装环境:VirtualBox,Linux,jdk1.8,hadoop-2.6.0-cdh5.14.2.tar.gzhadoop安装:首先,检查机器是不是安装了jdk1.8[root@km1 /]#java -version其次:多台虚拟机免密登录先查看用户名,看看用哪台机器作为主机[root@km1 /]#hostname[root@km1 /]#cd ~普通登录...

2019-12-09 08:49:18 90

原创 二叉树遍历与平衡二叉树

一、什么是二叉树?在计算机科学中,二叉树是每个结点最多有两个子树的树结构。通常子树被称作“左子树”(left subtree)和“右子树”(right subtree)。二叉树常被用于实现二叉查找树和二叉堆。一棵深度为k,且有2^k-1个结点的二叉树,称为满二叉树。这种树的特点是每一层上的结点数都是最大结点数。而在一棵二叉树中,除最后一层外,若其余层都是满的,并且或者最后一层是满的,或者是在右...

2019-12-05 20:16:55 601

原创 kibana简单教学

kibana简单教学按键释义:discover:探索,数据探查Visualize:画图用的Dashboard:仪表盘,同时建立两张图以上时必须先建立,就像背景板timelion:计时的Dev Tools:工具,用来写命令的Management:连上数据库,找表找工具的kibana写命令:[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-1Yvqklxc...

2019-12-05 19:47:15 304

原创 elasticsearch 增删改查(postman)

elasticsearch 增删改查(postman)1.建表:创建索引和type,也就是建库建表小飞人:PUT http://192.168.56.101:9200/mydemo(库) 关键词PUT{ "setting":{ "index":{ "number_of_shards":2, "number_of_replicas":1 } }, "mappi...

2019-12-05 15:33:53 1559

原创 centOs一小时虚拟机安装(到mysql)

一小时虚拟机安装(到mysql):第一步:新建虚拟电脑名称:mydemo文件夹:D:\bigdata类型:Linux版本:Red Hat(64-bit)内存大小:16G点选:现在创建虚拟硬盘点选:VDI(VirtualBox 磁盘映像)点选:动态分配文件大小:随便给个20G回到主页面对新建虚拟机进行设置:常规: 高级:共享粘贴板:双向 拖放:双向系统:...

2019-12-05 15:18:24 135

原创 elk重启动报错合集

昨天linux安装elk安的欲生欲死,今天重开elk也是状态百出。总结一下今天遇到的问题吧。一、启动位置出错个人习惯将elk放在/opt/soft/下,所以当我们重开elk时也当进入soft目录下去启动。soft目录下应当有下面几个安装包(安装包名字属于个人习惯):elasticsearch622 elasticsearchhead jdk180 kibana622 node11...

2019-12-03 10:52:01 377

转载 Git-remote Incorrect username or password

远程提交报密码错误,怎么解决,找这篇博客https://blog.csdn.net/mmyhs/article/details/81589419

2019-12-01 20:35:07 80

原创 idea中不小心误使用revert后怎么恢复

使用git命令提交代码,不小心使用了revert后,发现所有的代码都不能用了,这时候你的心里很焦急吧,说不着急都是假的,那么revert是什么呢?revert百度释义是恢复,回复(到以前的状态、制度或行为); 回到,重提,重新考虑(某个话题);那么解决也就是让她回到上一次提交的状态git revert HEAD在ideal代码界面最下面有一堆todo,spring啥的,在哪里点开termin...

2019-12-01 20:24:36 8793 4

基于改善初始种群的免疫遗传算法优化问题JSP问题

上传一篇关于免疫遗传算法的文档,供大家学习,最近在学习免疫优化智能算法

2018-10-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除