自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 Kettle 初级教学:数据迁移六大场景实战指南​

kettle(水壶),是ETL工具之一,而ETL 主要就是指数据清洗、流转、存储为一体的技术。而之所以叫kettle,是因为它的全称是"Kettle E.T.T.L. Environment",取首字母就是Kettle(水壶),开发者觉得数据就像水一样流动,所以用了这个名字。

2025-07-02 10:32:23 717

原创 数仓搭建常见错误汇总(一)

这两个错误其实都是hive当中存在的一个bug导致的,在自动统计时会出现这个错误,可以考虑使用insert overwrite table 替代 insert into,或者在建表之前set hive.stats.autogather=false;出现这个错误的时候,代表缺少了commons-lang-2.6.jar这个包,而这个包hive当中存在,只需要将其导入到sqoop下即可,具体操作为。如果在导入表时,表中有一个日期字段是 0000-00-00 00:00:00,就会报下面这个错误。

2025-06-17 20:49:46 165

原创 Hive的性能优化攻略(二)

Hive性能优化是门实践艺术,需要结合具体业务场景和数据特点灵活应用。记住,没有放之四海皆准的最优配置,持续监控和调优才是王道。希望这些经验能助你在Hive性能优化之路上少走弯路,早日成为真正的调优大佬!

2025-06-09 19:57:13 527

原创 Hive 性能优化攻略(一)

在大数据处理领域,Hive 作为基于 Hadoop 的数据仓库工具,凭借其强大的 SQL 查询能力和可扩展性备受青睐。但随着数据量的增长,性能问题逐渐凸显。今天,我就手把手教你从七个关键方向优化 Hive,让你的查询效率起飞!

2025-05-28 20:40:39 992

原创 一招制敌! Hive 中禁用统计的硬核操作

兄弟们,最近是不是在 Hive 里被统计信息搞得心烦意乱?有时候统计信息不仅没起到优化作用,反而影响了查询性能,或者因为某些特殊场景,咱就想临时禁用统计。别慌,今天我就来教你们怎么快速在 Hive 中临时禁用统计,让你轻松拿捏这个问题!

2025-05-20 20:44:22 669

原创 一文吃透 Hadoop 安装与 HDFS 本地模式、伪分布模式

到这里,Hadoop 的安装以及 HDFS 本地模式和伪分布模式就全部讲完了。本地模式简单易用,适合调试;伪分布模式能让你初步体验 Hadoop 的分布式特性,是迈向集群模式的重要一步。兄弟们,光看可不行,赶紧动手实操起来,遇到问题多去官网文档和社区找答案,这才是成为大佬的必经之路!

2025-05-12 20:26:42 1050

原创 别瞎搞!一文讲透虚拟机克隆全流程

还在一台台手动部署虚拟机?效率这么低怎么混技术圈?今天手把手教你用虚拟机克隆,让你一键复制整套环境!但先给你们提个醒:克隆可不是无脑操作,稍有不慎直接踩坑,老老实实跟着我的步骤来!

2025-05-10 17:05:48 2061

原创 awk 命令进阶指南

这些awk的高阶用法,都是实战里摸爬滚打总结出来的。别光看,赶紧动手练!文本处理场景千变万化,把这些技巧融会贯通,再复杂的需求都能轻松拿捏。

2025-05-10 16:22:16 491

原创 手把手教你实现 Linux 服务器间免密登录!别再输密码了,太 Low​

今天手把手教你配置 Linux 服务器间的免密登录,学会了这招,别人还在敲密码的时候,你已经优雅地完成了十台服务器的部署。​。

2025-05-08 20:25:34 1041

原创 Java常见面试题

特性HashMapArrayList底层结构数组+链表+红黑树动态数组初始容量1610扩容因子0.75(基于size/容量比)1.5倍(基于当前容量)扩容代价高(需rehash所有元素)中(只需数组拷贝)查询效率O(1)理想情况,最差O(log n)O(1)(通过索引)线程安全不安全不安全有序性无序(LinkedHashMap有序)插入顺序两者都是Java集合框架中高频使用的类,理解其内部原理有助于在不同场景下做出合适的选。

2025-05-08 20:12:21 274

原创 Linux中MySQL8.0的安装

直接将MySQL8.0的压缩包放到 /opt/modules路径下,并切换文件夹到该路径下。通过下面代码直接解压到该文件夹。

2025-05-07 20:38:45 1104 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除