学海无涯2.0
码龄7年
关注
提问 私信
  • 博客:155,685
    155,685
    总访问量
  • 42
    原创
  • 1,667,780
    排名
  • 18
    粉丝
  • 0
    铁粉

个人简介:今天菜不可怕,可怕的是明天和今天一样菜

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:吉林省
  • 加入CSDN时间: 2018-06-17
博客简介:

weixin_42474635的博客

查看详细资料
个人成就
  • 获得38次点赞
  • 内容获得19次评论
  • 获得147次收藏
  • 代码片获得164次分享
创作历程
  • 1篇
    2022年
  • 3篇
    2021年
  • 3篇
    2020年
  • 35篇
    2019年
成就勋章
TA的专栏
  • aiflow调度
    2篇
  • hadoop集群
    1篇
  • hive学习
    20篇
  • 面试心经
    3篇
  • Hive源码
    4篇
  • hadoop
  • hiveSql异常归类
    1篇
  • hive读书笔记
    3篇
  • azkaban
    1篇
  • scala与spark那些年的哪些事
    4篇
  • shell、linux
    3篇
兴趣领域 设置
  • 大数据
    hadoophivesparketl
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

python获取当月最后一个周日的日期,超简单的一段代码,拒绝混乱复杂

思路,得到今天是周几,然后用今天的日期减去几#获得N天前的日期def get_past_days(n,formate=None): if formate is None: _ymd = (datetime.datetime.now() - datetime.timedelta(n)).__format__('%Y-%m-%d') else: _ymd = (datetime.datetime.now() - datetime.timedelta(n)).__
原创
发布博客 2022.02.09 ·
1161 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

hive sum求和时是否考虑正负?是否会正负相抵?

最简单的测试方法select sum(a),sum(b)from( select 1 as a,2 as b union all select 1 as a,-2 as b) t查询结果显示因此,hive sum求和是考虑正负的。
原创
发布博客 2021.10.27 ·
1232 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

hive查询结果缺少数据——某些union all和join情况下会缺少数据

在使用hive sql 进行union all查询结果时,缺少数据在使用hive sql 进行join 关联时,查询结果明显缺少数据,或于presto或其他查询渠道查询结果不一致时原因可能是orc文件在加工过程中造成的部分元数据丢失,关闭元数据优化就可以了set hive.optimize.index.filter=false;...
原创
发布博客 2021.09.01 ·
3745 阅读 ·
2 点赞 ·
0 评论 ·
10 收藏

aiflow灵活控制任务执行时间

大家应该都知道aiflow调度的周期是固定的,例如只能每周执行或者每月执行,但是如果既要周报又要月报呢或者是特殊的执行周期,这时候该怎么办呢?怎么样才能灵活的控制aiflow的调度周期呢?总结,把aiflow设置为每天调起,然后把task写进if语句里,通过if语句对时间的灵活判断来决定任务是否真正执行default_args = { 'owner': '***', 'depends_on_past': False, 'ding_list': [''***.com'],
原创
发布博客 2021.08.09 ·
494 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

hadoop集群搭建详细步骤——集群搭建

集群准备一、虚拟机克隆  1、虚拟机关闭状态下右键点击虚拟机选择克隆  2、选择创建完整克隆,定义虚拟机名称和路径  3、点击完成等待虚拟机克隆                  至少克隆两台虚拟机  二、克隆机网络设置  1、两台克隆机分别重新生成MAC地址          具体步骤可见于上一篇的系统准备 https://blog.csdn.net/weixin_42474635/article/details/106019204  2、两台克隆机分别使用root账户登录并设置静态IP
原创
发布博客 2020.05.11 ·
587 阅读 ·
0 点赞 ·
0 评论 ·
6 收藏

hadoop集群搭建详细步骤——系统准备

所需工具:VMwhere虚拟机、hadoop-2.7.7.tar.gz、jdk-8u201-linux-x64.tar.gz、CentOS-7-x86_64-DVD-1708.iso(具体的版本随意)一、系统准备一、创建虚拟机1、点击文件选择新建虚拟机,选择典型安装2、修改路径选择centos镜像3、定义虚拟机的名称和存储路径4、指定磁盘容量和存储方式(磁盘容易默认就可以,存储方式选择单个存储)5、自定义硬件内存和处理器根据个人电脑选择网络适配器选择NAT模式,并生成MAC地址 重点
原创
发布博客 2020.05.11 ·
758 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

scala做字符串反转

val oldStr = “1234” var newStr = "" for ( i<-0 until oldStr.length) newStr = oldStr.charAt(i) +newStr
原创
发布博客 2020.04.03 ·
1121 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

shell脚本编写循环hive sql

循环里日期判断if [ $# -eq 1 ]; then n_date=`date -d "$1" +"%Y-%m-%d"`else n_date=`date -d " -1 days" +"%Y-%m-%d"`fit_date=`date -d "${n_date} -6 days" +"%Y-%m-%d"`until [ $t_date == $n_date ]...
原创
发布博客 2019.12.12 ·
1698 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

join语句里where条件的编写如何避免笛卡儿积的生成

实验表二十万条数据select date,id,name from ajoin b on a.id=b.idwhere a.date='2019-12-05' and b.date='2019-12-05'select date,id,name from ajoin b on a.id=b.idwhere a.date='2019-12-05'` ---运行速度快``第一...
原创
发布博客 2019.12.11 ·
827 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

HiveSql 日期格式转换

获取当前时间并转换为yyyy-mm-dd的格式select from_unixtime(unix_timestamp(),'yyyy-MM-dd')select from_unixtime(unix_timestamp(),'yyyyMMdd') //这里的MM必须大写yyyymmdd格式转换为yyyy-mm-ddregexp_replace('$n_date','-',"")...
原创
发布博客 2019.12.09 ·
5309 阅读 ·
1 点赞 ·
0 评论 ·
15 收藏

sum() over()求累加数据

使用函数sum() over()函数求累加数据 SELECT dd ,f_capital_no ,sum(t.f_payout_amount) over(partition by f_capital_no order by dd) f_payout_amount ...
原创
发布博客 2019.12.03 ·
2572 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

case when 使用技巧汇总

作为字段单种情况时使用:case when r.f_status='1' then 1 else '0' end as s_f_status作为字段多种情况时使用:case when f_product_code in('5561','5560','5811','5821','5901','5002','5921') then '公积金' when f_prod...
原创
发布博客 2019.11.20 ·
753 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

spark学习笔记

Spark的构成Spark Core(spark核心)Spark Sql(操作结构化数据的组件)支持多数据源Spark Streaming 实时流计算MLlib机器学习GraphC 面向图计算的框架和算法库spark的三种模式standalone apacheMersos hadoopYarnsparkSession 包括 SparkContext sql_ hi...
原创
发布博客 2019.10.14 ·
309 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

那些年我们写过的雷人简历

别说什么行业不景气,工作不好找,真的是你的简历太雷人
原创
发布博客 2019.09.27 ·
316 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

hive配置优化及其详解

hive配置优化及其详解
原创
发布博客 2019.09.26 ·
596 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Hive-sql对IFNULL()函数的替换

mysql里的函数:1.LEFT()函数是一个字符串函数,它返回具有指定长度的字符串的左边部分。LEFT(Str,length); LEFT(“1234”,2)接收两个参数:str:一个字符串;length:想要截取的长度,是一个正整数;2.IFNULL()函数用于判断第一个表达式是否为 NULL,如果为 NULL 则返回第二个参数的值,如果不为 NULL 则返回第一个参数的值。...
原创
发布博客 2019.09.20 ·
14000 阅读 ·
0 点赞 ·
0 评论 ·
10 收藏

hive侧视图lateral view和explode用法-简解(列转行)

explode用法select explode(split("010029,010030,1000001,财富_顶部轮播,财富banner,财富货币资金产品,财富快捷,财富-稳健组合楼层,财富-稳健组合楼层头条,财富-稳健组合推荐产品,财富页三图,财富-专业投资楼层,财富-专业投资推荐产品,首页登录banner,首页登录明星,首页登录头条,首页登录推荐产品,首页-浮层广告,首页快捷,首页明星服务...
原创
发布博客 2019.09.05 ·
778 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

scala学习笔记1

match语句的用法实例def isWeekend(wd:WeekDay.Value):Boolean={ | wd match{ | case WeekDay.Saturday =>true | case WeekDay.Sunday =>true | case _ =>false | } ...
原创
发布博客 2019.08.21 ·
245 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Display all 495 possibilities? (y or n)—— linux环境下脚本执行问题的解决

Display all 495 possibilities? (y or n)今天在把自己写的脚本放到azkaban上遇到了这么一个错误,在hue里执行没有问题,放到azkaban上就这样了,本来以为是linux和windows环境换行符的问题呢,结果把CRLF转换为LF也不行。最后发现原来是tab键的问题,因为存在tab键,linux就会出现这样的问题,所有把tab键去掉就好了那么怎么去掉...
原创
发布博客 2019.08.21 ·
2168 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

row_number() over()、sum() over()——hive窗口函数用法详解

语法格式:row_number() over(partition by 分组列 order by 排序列 desc)row_number() over()分组排序功能:在使用 row_number() over()函数时候,over()里头的分组以及排序的执行晚于 where 、group by、 order by 的执行版权声明:本文为CSDN博主「一彡十」的原创文章,遵循CC 4.0...
原创
发布博客 2019.08.14 ·
2550 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏
加载更多