自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 夜莺[n9e] v6 中心机房部署

夜莺 n9e 服务监控

2023-10-13 17:05:19 309 1

原创 使用HIVE读取JSON格式数据文件

使用Hive读取Json文件

2023-04-27 11:11:41 798

原创 删除PDF中含有二维码广告的页面

使用 PyZBar 库的软件实现:PyZBar 库提供了一个软件实现的二维码解码器,不依赖于 zbar 库。您可以使用 PyZBar 库的函数进行二维码解码,而不是使用 zbar 库。需要注意的是,二维码解码是一种复杂的图像处理任务,其结果可能受到多种因素的影响,包括图像质量、二维码部分完整性、解码库的算法和参数等。因此,在实际应用中,可能需要根据具体情况进行调试和优化,以保证解码的准确性和稳定性。

2023-04-07 16:01:15 606

原创 Python实现MySQL结构转化为HIVE DDL 语句

使用 Python 实现 MySQL 和 HIVE 的 DDL 转化

2023-03-29 16:07:54 355

原创 使用Neo4j进行关系挖掘实践

使用Neo4j进行关系挖掘实践,基于企业和老板的关系数据

2023-02-26 17:38:56 556 3

原创 使用Hadoop同步Elasticsearch数据(亿级)

使用hadoop同步亿级数据到elasticsearch索引实践,同步文档 9300万,约耗时15分钟,索引大小70GB

2023-02-26 14:48:07 554

原创 使用Hadoop同步Neo4j数据(亿级)

企业和人物节点数据以及关系数据导入实践,使用hive生成csv文件,进行 apoc.load.csv 操作。

2023-02-26 12:42:35 1561

原创 Hive数仓ETL过程

Hive数仓ETL过程

2022-05-06 12:01:00 1053

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除