自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 批量将文件名为姓名的图片改为身份证号码

批量将文件名为姓名的图片改为身份证号码

2024-05-14 16:24:14 474

原创 excel批量转换为CSV格式

代码中的 fPath = “C:\Users\杜漪漪\Desktop\excle” -定义为需要转换成CSV的Excel源文件。sPath = “C:\Users\杜漪漪\Desktop\转csv”-定义为转换后的CSV文件保存位置。这两个位置需要自己按实际修改。特别注意:路径需要以\结尾。

2023-04-18 09:22:17 4425 6

原创 excel批量删除缺失数据所在的行

在数据处理的过程中,我们经常要过滤缺失值,这个在excel中如何实现呢首先 Ctrl + G,调出‘定位’,并单击‘定位条件’:选择‘空值’,如何单击‘确定’:显示缺失值的行:单击右键,选择‘删除’:选择‘整行’,单击‘确定’:结果

2023-04-16 20:39:56 863

原创 excle分组求平均值tips

下拉就每7个出现一个平均值。

2023-04-16 20:14:57 621

原创 excle表格更改日期+时间格式(%Y-%m-%d %H:%M:%S)小tips

进入后,点击下一步,勾选空格即可。选中日期表格,点击数据选项。进入数据界面,点击分列。

2023-04-16 19:50:34 465

原创 上传数据至hive

注意要是表头为空是建表时行分隔符用错了改一下就好(注意字段名不可以和数据类型一样,当时我的时间字段名为time就报错,改为shijian之后解决)查看表describe extended 表名;表信息文件夹将hdfs上的数据文件导入到表里本地路径导入:load data local inpath '/home/DYY/y.csv' into table y;批量导入导入一整个文件夹的csv文件验证数据是否导入成功如果数据量大的话,最好不要全部查出来,使用limit 查询部分数据;

2023-04-13 15:15:41 265

原创 apache-hive-3.1.3-bin安装配置

配置hive-log4j2.properties(定义日志文件存储路径)

2023-04-11 12:57:11 135

原创 hive3.1.3配置过程中出现的问题

hive安装配置遇到的问题及解决方法

2023-04-11 12:48:43 285

原创 ANSI编码文件批量转换为UTF-8编码小tips

【代码】ANSI编码文件批量转换为UTF-8编码小tips。

2023-04-09 18:03:14 1914 1

原创 通过大量地铁拍卡数据分析地铁发车时间间隔

通过大量地铁拍卡数据分析地铁发车时间间隔

2022-06-09 12:32:51 2457

原创 Kafka+Spark-Streaming实现流式计算(WordCount)

Kafka+Spark-Streaming实现流式计算(WordCount)

2022-06-02 16:10:29 351

原创 Starting zookeeper ... FAILED TO START解决方法

配置zookeeper时遇到的问题

2022-06-01 11:16:17 120

原创 配置zookeeper与kafka

配置zookeeper和kafka

2022-06-01 11:14:23 472

原创 使用GeoMesa实现时空索引并进行KNN查询

#安装geomesa-hbase版本:geomesa-hbase_2.11-3.4.0-bin.tar.gz 解压到指定目录后为其添加环境变量减压命令:tar -zxvf解压到指定目录后为其添加环境变量打开环境变量配置文件:vim /home/DYY/.bash添加环境变量:#geomesa_hbaseexport GEOMESA_HBASE_HOME=/home/DYY/geomesa-hbase_2.11-3.4.0export PATH=$PATH:$GEOMESA_

2022-05-31 14:34:41 402

原创 Spark GraphX

#Spark GraphX自定义一个文件夹simplegraphx,在simplegraphx文件夹下递归创建目录:mkdir -psrc/main/scala,在scala目录下创建scala文件如下: mkdir -p /home/DYY/spark/spark-3.1.1-bin-hadoop2.7/simplegraphx/src/main/scala在scala目录下创建scala文件: cd /home/DYY/spark/spark-3.1.1-bin-hadoop2.7/s

2022-05-29 16:36:19 264 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除