自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(51)
  • 收藏
  • 关注

原创 配置zookeeper的时候三个节点都启动了但是查询zookeeper的角色的时候显示没启动成功

搭建了一个音乐平台数仓,一共有五个节点,其中三个节点配置zookeeper,我的操作是先把这三个节点的zookeeper全部启动,然后再分别查询各自zookeeper的角色。

2024-04-04 04:15:48 622

原创 加载本地文件进入数仓发现大部分加载进去都变成了null

今天领导给了一个表格文件,需要导入数仓,然后和数仓的表进行join。我先把表格放入项目目录所在的本地地址,然后打开pycharm就能看到这个文件了,把这个文件上传到远程解释器。然后打开xshell,新建数仓临时表,登录hive,将本地文件加载进hive的临时表。一切和之前的操作一摸一样。但是,查询新建的临时表的时候,数据全是null,只有零星几个数字的数据有。

2024-01-17 11:52:19 399

原创 将两个excel中的不同sheet拼成一个表格

【代码】将两个excel中的不同sheet拼成一个表格。

2023-11-29 11:01:15 95

原创 hive更改表结构的时候报错

ALTER TABLE table_name ADD COLUMNS (table_name type COMMENT '竞品公司id');ALTER TABLE table_name ADD COLUMN table_name type COMMENT '竞品公司id';comment后面的文字描述应该用单引号括起来,不能用双引号。

2023-11-14 18:07:08 731

原创 通过key在数仓里查询dt的时候报错

key应该被单引号括起来,字段名称才应该被双引号括起来。把单引号换成双引号就好了。

2023-11-14 16:09:54 122

原创 python smtplib.SMTP_SSL发送邮件,只有列表或者字符串最前面的邮箱才能收到邮件

这个发送邮件的代码前面把to这个变量变成以,分割的字符串以后就直接放到sendmail()这个方法里了。此处像途中对to进行分割就可以正常发送多人邮件了。

2023-11-14 11:41:06 105

原创 网络问题导致pycharm无法提交代码到代码仓库

可能不是自己权限有问题,而是网络有问题,等网络好一点的时候重新git push就可以提交成功了。

2023-11-13 17:20:51 120

原创 hive里因为列名用了关键字导致建表失败

在hive中row和percent都是关键字,所以会报错。

2023-11-13 12:01:12 1155

原创 字段 != null在pycharm中标黄

sql里没有!= null的写法,应该是is not null。

2023-11-09 14:38:30 55

原创 pyspark将数据多次插入表的时候报错

py4j.protocol.Py4JJavaError: An error occurred while calling o129.sql.: org.apache.spark.sql.catalyst.parser.ParseException:mismatched input 'INSERT' expecting (line 12, pos 0)

2023-11-08 17:57:04 767

原创 sparksql明明插入了但是表里数据是null

将数据插入表的时候,表里的数据是null。

2023-11-08 17:24:54 172

原创 文件换行符导致linux里运行python文件找不到文件

运行python代码的时候:报错信息:: No such file or directoryon3在pycharm中把文件的分隔符给改了这样,把文件的分隔符改成Unix and macOS就可以了

2023-11-07 16:44:27 188

原创 判断是否为平衡树易错点

采用递归的方法,一层一层求节点的左子树和右子树的高度以及左子树和右子树是否平衡。

2023-10-30 10:52:59 36

原创 hive建表的时候字段和分区字段重复

这个表是按照dt进行分区的,那么建表的时候表里就不该有dt这个字段。把建表语句的dt那一行删掉就好了。

2023-10-23 15:11:55 194

原创 null和没有一个元素的List不一样

LeetCode链接:https://leetcode.com/problems/encode-n-ary-tree-to-binary-tree。

2023-10-11 17:14:15 50

原创 基于pycharm配置kerberos

点击"Test Connection"的时候报错:The specified database user/password combination is rejected: [ 08S01] Could not open client transport with JDBC Uri: jdbc:hive2://cdh2.xxx.com:10000/;principal=hive/[email protected];: Can't get Kerberos realm KrbException: Can

2023-10-07 15:18:41 96

原创 if __name__ == “__main__“:下面报错SyntaxError: invalid syntax if __name__ == “__main__“:

后来发现是main()函数里有个打印行为少了一个括号。这三行怎么改都改不对。

2023-09-25 10:21:00 336

原创 hive给查询字段起别名出现错误

hive中中文别名需要用反单引号。

2023-09-21 13:41:43 384

原创 python做两个表的差集

B.xlsx是A.xlsx的数据的一部分,要求出A.xlsx中不包含B.xlsx的部分。

2023-09-20 16:57:56 116

原创 2024届美团第一次笔试第二题

2.小美的字符串匹配度小美有两个长度为n只包含小写字母的字符串s和t,小美定义“两个字符串的匹配度”为i∈[1,n]中si​=ti​的数量,例如"abacd"和"aabdd"的匹配度就是2。现在你可以进行最多一次以下操作:对于字符串t,选择两个索引i,j(1≤i

2023-08-16 03:39:52 2709 5

原创 美团24届秋招笔试第一场第一题

虽然触发了满15元减3元,但使用折扣只需要花12元,低于使用满减的价格(20-3=17),因此最终系统会为客户推荐折扣价。2. 订单有满x元减y元的优惠。当购买的菜的价格总和不小于x元时,总价格可以减y元。“减”的价格不能超过“满”的价格。在设计定价时,原价、折扣价和满减的价格都必须是正实数。该小数代表顾客购买了全部菜各一份时,订单的总价格。由于本题的数据具有现实意义,所以读取的每个数都应该为正数,因此每次读取都应该判断一下。3. 满减优惠和折扣价是互斥的,当且仅当每个菜都选择了原价才可以触发满减。

2023-08-15 19:19:48 876

原创 Hadoop启动datanode 的时候连接不上,Incorrect configuration: namenode address dfs.namenode.servicerpc-address

linux的hostname不可以存在下划线,我的hostname为hadoop_node01,将hostname改为node1之后,并且将Hadoop相关配置中的“hadoop_node01”全部改为“node1”之后在重新启动就可以正常运行了。

2023-08-11 20:12:33 419

原创 关于初始化启动HDFS未成功/opt/bigdata/hadoop-2.6.5/bin/hdfs line 276: /usr/java/default/bin/java: No such file

hdfs文件的第276行是这样的。

2023-08-10 15:16:42 263

原创 关于Xshell连接不上虚拟机

之所以会这样是因为我的虚拟机的ip配置是192.168.150.11而我的虚拟网卡的地址是192.168.100.0。将我的虚拟机的ip配置成192.168.100.11就能成功连接上了。

2023-08-06 17:33:20 33

原创 IDEA “Cannot resolve symbol”(无关Maven,无关配置)

看了很多教程都没写这种可能性,我寻思我就写个算法题咋还牵扯到Maven,pom文件之类的了,后来看到我的算法题里:把;改了就好了。

2023-08-01 01:43:57 94

原创 ping : www. baidu .com: Name or service not knowm

检查了自己更改之后的/etc/sysconfig/network-scripts/ifcfg-ens33文件,更改之后的ip和老师一样,没问题。跟着视频学hadoop,先克隆几个虚拟机然后更改ip,准备用Xshell连接克隆后的虚拟机操作的,但是发现Xshell连接不上虚拟机了。重启了一下网络服务,也依旧连不上www.baidu.com。

2023-07-27 02:57:32 174

原创 关于荷兰国旗问题(快速排序)应当注意边界

关于荷兰国旗问题其他帖子已经给出了非常详尽的解法描述,我在这里就只是简单概括一下:给定数arr,数组的左边界为l,右边界为r,以arr[r]为划分值。如果arr[p]

2023-06-18 09:49:27 50

原创 归并排序(前缀和):左组数据比右组数据的两倍大(以及关于整型数据类型的不等式进行变形的反思)

【代码】归并排序:左组数据比右组数据的两倍大(以及关于整型数据类型的不等式进行变形的反思)

2023-06-13 11:02:43 65 1

原创 自我介绍的前端页面

可以通过首页上的“兴趣爱好”,“项目经历”,“梦想愿望”点击进去分别有一个相关页面。img图片各位可以自己设置。

2023-05-28 10:33:36 150

原创 关于单向链表反转问题空指针情况

报错信息:网上搜了搜,基本就是建议我声明next和pre指针的时候进行初始化,即pre = new Node()但是由于我给Node的定义是Node的value部分必须为int,而这个地方我需要将pre指向null,这就会变得非常麻烦。

2023-05-15 22:27:16 65

原创 关于二分法中取中点的特殊方法

二分法中取中点没有使用mid = (L + R)/ 2而是使用mid = L +(R - L) >> 2*)*主要原因是防止R和L过大导致(L + R)导致溢出。

2023-05-13 05:50:34 118 2

原创 ping其他网址时显示Name or service not known

修改CentOS7中,克隆一台虚拟机后修改虚拟机的ip。

2023-05-04 21:10:27 592 3

原创 关于VM Ware Workstation Player 14 虚拟机开机之后闪退

有可能是该虚拟机只是裸机,并没有安装操作系统。

2023-04-10 18:59:48 885 2

原创 关于错误代码500”服务器错误啦“

商城项目,错误代码500,更改数据库配置文件

2023-04-01 04:52:46 54

原创 ERROR 1045 (28000): Access denied for user ‘root‘@‘localhost‘ (using password: NO)

关于在cdm输入mysql -hlocalhost -uroot –p会报错ERROR 1045 (28000): Access denied for user ‘root’@‘localhost’ (using password: NO)这件事。看了很多网上的方法。最后发现问题出在输入的命令的字符上,如果用英文输入法重新自己打一遍,就可以正确运行了。

2023-03-31 02:27:05 50

原创 关于tomcat双击startup.bat的文件闪退

最近在做关于商城的项目,从网上能找到很多关于商城的源代码。但是从网上下载很多的项目自己跑的时候会遇到各种各样的问题。这次问题发生在某次我下载了一个新的商城项目想要自己跑的时候,一切都是按照网上最详细的教程配置的idea,tomcat用的是下载的源码自带的文件夹。

2023-03-30 06:50:01 498

原创 对xml文件中的文本数据进行提取并整合成excel表格

对HistCounts标签的数据,以“|”为分界,分别放进excel表格里。

2023-03-14 01:39:32 702

原创 python通过windowsRAR进行批量文本解压

将需要批量解压的压缩包放在一个文件夹里,并将写好的py文件保存好一起和压缩包放在同一目录 在命令行里进入py文件所在的目录下,对代码进行运行同一目录下就可以生成一个unzip文件夹 最后所有解压以后的文件夹都在unzip文件夹里啦

2023-03-14 01:31:40 386

原创 python读取文件路径问题

最简单的解决方式就是将path里面的“\”全部换成“/”就可以解决问题了。

2023-03-12 23:13:35 129

原创 操作系统的特征

并行物理极限很明显,并发可以通过优化操作系统、调度等手段去大大提高操作系统资源的利用率和吞吐量,以达到操作系统“有效性”这一目标。什么是并行,什么是并发,以及二者之间的区别。共享、虚拟、异步为什么都以并发为前提。

2023-03-06 21:15:45 31

二叉树的遍历:前序、中序、后序非递归遍历;从上至下,从左向右层次遍历;从上至下,从右向左层次遍历

(1)建立的二叉树; 节点的结构体为: typedef struct { int num; /学号 char name[10]; /姓名 } student; (2)完成二叉树前序、中序、后序非递归遍历程序;从上至下,从左向右层次遍历;从上至下,从右向左层次遍历; (3)给出程序和每种遍历程序的结果。

2023-05-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除