同道大叔
码龄6年
关注
提问 私信
  • 博客:28,030
    社区:1
    28,031
    总访问量
  • 16
    原创
  • 907,450
    排名
  • 13
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:广东省
  • 加入CSDN时间: 2019-03-12
博客简介:

weixin_44765495的博客

查看详细资料
  • 原力等级
    当前等级
    1
    当前总分
    76
    当月
    1
个人成就
  • 获得42次点赞
  • 内容获得10次评论
  • 获得61次收藏
  • 代码片获得342次分享
创作历程
  • 1篇
    2024年
  • 3篇
    2022年
  • 7篇
    2020年
  • 6篇
    2019年
成就勋章
TA的专栏
  • Hive
    4篇
  • Spark
    2篇
  • idea
    2篇
  • 数据仓库
    2篇
  • Maven
    1篇
  • kafka
    1篇
  • zookeeper
    1篇
兴趣领域 设置
  • 大数据
    hadoophivestormspark
  • 人工智能
    分类
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

MaxCompute常用时间周期SQL

近3年、近1年、近6月、近3月、近1月。:去年、本年、上月、本月、上周、本周。
原创
发布博客 2024.08.02 ·
309 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

Spark写Excel报FormulaParseException The specified formula ‘=‘ starts

Spark写Excel报FormulaParseException The specified formula '=' starts
原创
发布博客 2022.09.14 ·
1132 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏

Scala运行环境报错 NoClassDefFoundError: Could not initialize class org.fusesource.jansi.internal.Kernel32

Windows11 Scala运行环境报错
原创
发布博客 2022.04.24 ·
813 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Sublime SQL Beautifier 安装及更改快捷键

Sublime 使用Package Control 安装SQL Beautifier
原创
发布博客 2022.03.21 ·
4398 阅读 ·
13 点赞 ·
1 评论 ·
5 收藏

Oracle旧版本JDK下载入口

https://www.oracle.com/java/technologies/javase/javase8-archive-downloads.html
原创
发布博客 2020.08.05 ·
466 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

IDEA JDBC Phoenix Could not initialize class org.apache.hadoop.hbase.util.ClassSize.

问题描述Unable to establish connection. Could not initialize class org.apache.hadoop.hbase.util.ClassSize.IDEA配置Driver连接Phoenix报如上错误,总结下来是IDEA和VM的JDK版本不一致。解决方式配置完Driver后,更改JDK,由IDEA默认的JAVA11改为JAVA8,问题解决。...
原创
发布博客 2020.07.14 ·
2320 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

file hdfs:// does not exist.

select mid_id from dws_uv_detail_day where dt <= '2020-07-04' group by mid_id这是一张外部表,做查询时发现有过往元数据未清除,报了file hdfs:// 文件 does not exist.,找不到被删除的数据。解决方式drop table把元数据删了,然后又重新建了这张表,把数据同步到外部表就行了load data inpath '/warehouse/gmall/dws/d
原创
发布博客 2020.07.06 ·
3160 阅读 ·
2 点赞 ·
0 评论 ·
1 收藏

No LZO codec found, cannot run.

直接Hive启动执行select语句无异常,但使用JDBC方式连接Hiveserver2报如下错误0: jdbc:hive2://hadoop102:10000> select * from ods_start_log limit 10;Error: java.io.IOException: java.io.IOException: No LZO codec found, cannot run. (state=,code=0尝试方法: 首先将hadoop-lzo-0.4.20.jar 放入Ha
原创
发布博客 2020.07.05 ·
1006 阅读 ·
0 点赞 ·
5 评论 ·
0 收藏

Spark项目实战经验

1.参数设置spark.streaming.kafka.maxRatePerPartition 控制spark streaming消费kafka速度spark.streaming.backpressure.enabled 打开背压消费速度是动态浮动的,上限由spark.streaming.kafka.maxRatePerPartition决定spark.streaming.stopGrac...
原创
发布博客 2020.03.07 ·
920 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

常见Hive SQL操作的执行过程

1、joinSELECT pv.pageid, u.ageFROM page_view pv JOIN user u ON pv.userid = u.userid ;实现过程:1)Map:以 JOIN ON 条件中的列作为 Key,如果有多个列,则 Key 是这些列的组合以 JOIN 之后所关心的列作为Value,当有多个列时,Value 是这些列的组合。在 Value ...
原创
发布博客 2020.02.21 ·
184 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

数据仓库开发规范

1. 背景为了避免底层业务变动对上层需求影响过大,屏蔽底层复杂的业务逻辑,尽可能简单、完整的在接口层呈现业务数据,建设高内聚松耦合的数据组织,使数据从业务角度可分割,显得尤为重要。从整个集团业务条线出发,形成数据仓库总体概念框架,并对整个系统所需要的功能模块进行划分,明确各模块技术细节,建设一套完整的开发规范。2. 分层规范ODS(原始数据层):ODS层是数据仓库准备区,为DWD层提供基础原...
原创
发布博客 2020.02.21 ·
1074 阅读 ·
3 点赞 ·
0 评论 ·
10 收藏

Maven依赖冲突jar包冲突类冲突ServletContext.class

当遇到依赖冲突时应该如何快速排除冲突,希望小伙伴们能赐教
原创
发布博客 2019.12.29 ·
6481 阅读 ·
20 点赞 ·
3 评论 ·
32 收藏

数据仓库Data Warehouse流程总结

OdS层向DWD导数据利用UDF、UDTF函数将单列数据细分编写主类packagehive中创建函数insert overwrite导入数据
原创
发布博客 2019.11.16 ·
540 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Idea错误: 找不到或无法加载主类

错误: 找不到或无法加载主类本方法不用删除.idea文件解决方法:1.清除缓存/重启2.重新构建项目3.Maven-install编译一下简单粗暴,行之有效。
原创
发布博客 2019.11.16 ·
1079 阅读 ·
2 点赞 ·
0 评论 ·
0 收藏

kafka启动异常 A broker is already registered on the path /brokers/ids

java.lang.RuntimeException: A broker is already registered on the path /brokers/ids/102. This probably indicates that you either have configured a brokerid that is already in use, or else you have shu...
转载
发布博客 2019.11.14 ·
2039 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

win10系统更新后vmware无法启动

问题描述系统更新(KB4517389)过后VMWare无法正常启动解决方式一 更新
原创
发布博客 2019.10.10 ·
551 阅读 ·
1 点赞 ·
0 评论 ·
3 收藏

Hadoop伪分布式无法访问HDFS文件系统解决办法50070

修改主机名映射IP地址必须映射主机名vim /etc/host关闭系统防火墙查看防火墙状态service iptables status永久关闭防火墙chkconfig iptables off临时关闭防火墙service iptables stop配置:hadoop-env.sh将JAVA_HOME写成绝对路径export JAVA_HOME=/opt/module/jd...
原创
发布博客 2019.09.29 ·
1520 阅读 ·
0 点赞 ·
0 评论 ·
4 收藏
加载更多