自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(101)
  • 资源 (1)
  • 问答 (1)
  • 收藏
  • 关注

原创 hive SQL谓词下推

谓词下推

2024-04-17 11:23:26 599

原创 hive的小文件如何处理

hive小文件处理思路

2024-03-21 15:27:33 444

原创 工作中常用的git命令

git 常用命令

2024-03-21 14:15:16 530

原创 工作中常用的git命令

git 常用命令

2024-03-21 11:39:09 525

原创 sqoop处理数据量过大导入

sqoop处理超大数据量

2024-03-19 14:07:53 322

原创 数据仓库的两种建模方法

范式建模和维度建模

2024-03-19 13:59:29 1283

原创 sqoop两种导入方式

sqoop两种导入方式

2024-03-19 13:43:47 349

原创 pyspark 执行 lcs

pyspark 提交到集群执行

2024-03-16 09:50:22 302

原创 hive 中少量数据验证函数的方法-stack

stack,lag,lead

2024-03-01 15:48:52 1048

原创 hive中插入数据的字段本身是String,但插入Int类型

数据插入转换

2024-02-25 09:40:56 327

原创 hive - explode 用法以及练习

explode 的用法以及练习

2024-01-26 16:31:08 515

原创 Solving environment: failed with initial frozen solve. Retrying with flexible solve.

anaconda 下载pandas报错

2024-01-24 14:17:34 509

原创 TF-IDF 找出文章关键词

tf-idf

2024-01-23 16:28:31 473

原创 文本相似度计算

文本向量余弦相似度

2024-01-23 16:06:48 467

原创 Windows 环境 - anaconda 下载jieba失败

anaconda下载依赖失败

2024-01-18 16:50:53 675

原创 Spark Stack trace: ExitCodeException

Spark Stack trace: ExitCodeException exitCode=10

2024-01-18 16:38:23 342

原创 Spark Stack trace: ExitCodeException

Spark Stack trace: ExitCodeException exitCode=10

2024-01-08 17:14:34 355

原创 Exception in thread “main“ java.lang.Exception: When running with master ‘yarn‘ either

Exception in thread "main" java.lang.Exception: When running with master 'yarn' either HADOOP_CONF_DIR or YARN_CONF_DIR must be set in the environment.

2024-01-08 17:12:01 460

原创 hive 用户自定义函数udf,udaf,udtf

自定义udf函数

2023-12-20 16:08:00 718

转载 Spark的stage源码解析

Spark的stage源码解析

2023-12-20 14:12:18 53

原创 MapReduce 的 shuffle 与 spark的 shuffle 有什么区别?

MapReduce的shuffle与spark的shuffle有什么区别

2023-12-20 13:03:24 566

原创 spark-常用算子

spark常用算子

2023-12-16 16:16:21 1084

原创 hive 常见存储格式和应用场景

常见存储格式和应用场景

2023-12-15 17:56:38 622

原创 大数据之旅-问题反思

一些问题和反思

2023-12-14 17:38:15 819 1

原创 Scala-初学

初学scala

2023-12-12 12:24:32 528

原创 hive-窗口函数

hive 窗口函数

2023-12-11 13:34:51 1048

原创 MapReduce的执行过程(以及其中排序)

MR的执行过程以及排序

2023-12-09 12:21:50 597

原创 hive 命令行中使用 replace 和nvl2 函数报错

命令行使用 replace 和 nvl2 报错

2023-12-08 12:24:36 554

原创 hive 命令记录(随时更新)

hive会用到的命令,以及可能会用到的命令

2023-11-28 18:05:00 660 1

原创 hadoop集群环境搭建和常用命令

hadoop 集群搭建和常用命令

2023-11-28 16:23:07 546

原创 python初学

python 入门

2023-09-06 22:18:55 237

原创 修复navicat 不可用

navicat恢复试用期

2023-07-31 15:11:24 1442

原创 Java代码重构学习笔记-处理概括关系

处理概况关系

2023-05-13 06:30:00 650

原创 Java代码重构学习笔记-简化函数调用

简化函数调用

2023-05-12 06:30:00 491

原创 Java代码重构学习笔记-简化条件表达式

简化条件表达式

2023-05-11 06:30:00 950

原创 Java代码重构学习笔记-重新组织数据

它的主要目的是通过使用 getter 和 setter 方法来访问类的私有属性,以提高代码的可维护性和灵活性。举个例子,假设有一个名为 Customer 的类,用于表示一个客户对象,该类包含了客户的姓名、地址等信息。现在需要在该类中添加一个新的属性,即客户的信用度 credit,但同时要限制信用度的范围在 0 到 100 之间,并且在修改信用度时要触发相应的事件通知。

2023-05-10 06:30:00 1112

原创 Java代码重构学习笔记-在对象之间搬移特性

在对象之间搬移特性

2023-05-09 06:30:00 656

原创 Java代码重构学习笔记-重新组织函数

重新组织数据的方法

2023-05-08 15:18:27 621

原创 Java代码重构学习笔记-开篇

同时,在代码重构过程中,需要保持代码的良好风格和结构,并遵循团队内部的代码规范。

2023-04-20 13:27:13 204

原创 Java 截取文件后缀名的方法

截取文件后缀名 , 以下方法都是笔者用过以及踩过坑的,欢迎补充。

2023-03-17 15:34:23 2629

正则截取文件名,文件后缀,文件路径

正则截取文件名,文件后缀,文件父路径,去掉文件后缀 FileNameUtils.getParentPath : 获取父路径 如 C:\A\B\test.txt 返回: C:\A\B\ /home/usr/test.txt 返回 /home/usr/ FileNameUtils.getSuffix : 获取文件后缀 如 C:\A\B\test.txt 返回: txt /home/usr/test.txt 返回 txt test.txt 返回: txt FileNameUtils.getFilename: 获取文件名 如 C:\A\B\test.txt 返回 test.txt /home/usr/test.txt 返回 test.txt FileNameUtils.removeSuffix : 去掉文件后缀名 如: C:\

2023-03-17

CreateXmlZipUtil.java

可以创建<root><子节点><item>value</item><item>value</item></子节点><子节点><item>value</item><item>value</item></子节点></root>这样的xml文件,还可以打包,也可以删除文件和文件夹,比如创建好文件夹以后打包,并将原来的文件和文件夹删掉,只留下压缩包,有需要的可以交流,还在改进中,谢谢

2020-09-09

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除