- 博客(9)
- 收藏
- 关注
原创 Linux miniconda3安装superset 2.1.0可能遇到的一些问题
确定目录,例如我这里是 /opt/module/miniconda3。cd后发现该目录下有一个bin目录,即PYTHONPATH。记录一下Linux miniconda3安装superset 2.1.0遇到的一些问题。解决办法:sqlparse降级处理。环境:python3.9。新建一个文件,添加内容。
2023-06-30 20:29:51
320
原创 hive 3.1.3 on spark 3.0.0 安装教程 (内附重新编译好的jar包)
一步一步教会你如何部署 hive 3.1.3 on spark 3.0.0,文章还提供了修改好的源码包~
2023-06-07 18:14:49
2037
3
原创 spark hive 本地调试 & 提交任务到yarn cluster
本文讲述spark部署在远程服务器的yarn环境下时,如何进行本地调试以及提交任务到yarn cluster首先,
2023-05-13 16:51:58
584
原创 ZooKeeper源码 Sources not found for: org.apache.zookeeper:zookeeper:3.5.7
查看ZooKeeper源码,发现Download Sources无法下载,报。下载箭头指向的文件apache-zookeeper-3.5.7.tar.gz。找到zookeeper目录,根据自己的版本进入文件夹,例如我的是3.5.7。点击源码右上角Choose Sources,选择zip压缩包。完成上述操作后,zk源码中就能看到相关说明。,放到一个方便管理的目录下。
2023-04-25 11:19:36
1322
原创 ZooKeeper创建节点报错:KeeperErrorCode = ConnectionLoss for
由于jdk向下兼容,因此Project下的SDK无需修改,仅调整Modules版本即可。完成以上修改后,重新执行代码,成功创建zk节点。观察idea和集群的jdk版本是否一致。idea下jdk为Java 12。集群jdk为 Java 1.8。调整idea下jdk版本。
2023-04-25 10:49:10
1871
原创 scala安装报错:此时不应有 \scala\scala-2.12.17\bin\..\lib\jline-2.14.6.jar
查阅资料后发现是因为安装目录中带空格的缘故。重新配置环境变量即可。
2023-04-18 20:00:13
245
1
原创 云服务器hadoop踩坑史:java.io.IOException: Got error, status=ERROR, status message , ack with firstBadLink
解决云服务器搭建hadoop报错:java.io.IOException: Got error, status=ERROR, status message , ack with firs
2023-03-29 20:59:49
770
3
原创 Pandas多列分组计算时长
Pandas多列分组计算时长马上要读研了,暑假期间找了一份数据分析岗的实习,算是找点事情做,老大建议我工作上遇到的问题可以记录在博客里,遂第一篇博客诞生了。数据由多列组成,目的是根据其中两列来划分数据,此处使用ID和name来分组,对time进行求和获取总时长df['time'] = df['time'].apply(pd.to_numeric) # 转换数据类型grouped = df['time'].groupby([df['ID'],df['name']]) # 按照ID和name列分组
2021-07-07 16:34:13
219
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人