自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 Hive 窗口函数大全

hive的窗口函数使用集合和使用示例

2023-01-03 16:50:01 3119 1

原创 spark程序提交集群运行全在driver端的问题---setMaster的坑

最近开发了一个超级简单的spark程序,也就rdd运行map再运行foreach,并提交到集群(standalone模式)运行。不知道是不是我是刚入门的小白资历尚浅的问题,但是。。但是。。。但是。。。。它为什么只运行在driver上?提交参数:spark-submit --master spark://hadoop1:7077 --num-executors 4 --driver-memory 3G --executor-memory 3G --executocores 4 --deploy-m

2021-02-09 09:25:45 3332

原创 sqoop把数据导入hive的一些问题记录

最近接了一个任务,需要把mysql的数据迁移到hive中,决定采用sqoop工具进行数据导入。

2020-11-14 14:02:05 628

原创 pandas杂记--实现excel表格数据切片--指定行列名

能用python解决的问题都不是问题需求近日接到一个任务,需要将一个有1000记录的excel数据,平均切分为50个表,并且要求按照指定格式命名;当然,手动切分是不可能的,那肯定是使用python来实现啦!实现数据源说明:大表只有一列数据,是id类的数据,没有行名和列名,切分后数据也不显示行名和列名;源数据大概是这样:代码# -*- coding: utf-8 -*-"""Created on Wed Sep 30 13:43:18 2020@author: CLP将一个表格数

2020-10-10 13:06:10 1468

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除