自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 啥是倒排索引?(涨知识篇~)

简单来说,就是通过一个程序扫描文本中的每个单词,针对单词建立倒排索引,并保存该单词的文本位置以及出现次数。

2024-01-24 10:18:33 385 1

原创 hive优化分享第一弹!

'你是做大数据的,应该很会优化吧(滑稽的笑)' -- 今天被朋友问了这个问题简直是贴标签!我只想说,,,方法实在太多了!!!什么!!你还不会优化!!!来!!我来分享一点我觉得有用的东西!

2024-01-14 20:48:26 852

原创 code 2 问题-map端jion优化

我出现的问题是发现是本应该触发map端join的优化没有触发,是因为小表用户表的数据量变大了,超过了20M没有触发map端join,所以将小表阈值20M改成了30M。"Job failed due to a stage failure":这个错误表示某个阶段的任务失败了,可能是由于数据处理逻辑错误、资源不足等原因引起的。在此过程中发现maptask处理的数据量大小设置在320M效率是最高的,所以当时就调整了这个参数,成功执行!查找相应的任务日志:在日志目录中,找到与目标任务相关的日志文件,通常以。

2024-01-14 20:18:24 413

原创 namenode掉了?亲测有用!!

解决namenode掉进程问题解答!

2024-01-14 19:25:33 451

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除