- 博客(4)
- 收藏
- 关注
原创 hive sql 日期格式转换
遇到一个需求,需要计算hive库中,某资产近一个月的资产值。 比如:今天是2018年2月28日,近一个月若是按照自然月来算,那么是2018年2月1日至2018年2月28日。最终需要的日期格式为:yyyyMMdd。当日时间戳unix_timestamp() 方法可得到当前时间的时间戳。上月今日使用 add_months(日期,N) 函数可将日期往前、往后推N个月。主要有两种格式: ...
2018-02-28 19:56:54 9115 1
原创 找出某目录下前N个最大文件
最近电脑D盘亮“红灯”,可用空间已经不到10个G。想想也没有下载电视剧、电影等,那到底是什么如此占用空间呢?决定写个脚本,查找出TOP N个最大的文件。写脚本的时候,发现找最大的文件,很容易写出来,但是写前N个最大文件的时候,就发现不那么顺畅(也许是没用对方法)。先定义一个文件大小排序函数,rank_list初始是一个空的列表,用来存放前N个最大文件的文件大小值;size 是新获取文件的大...
2018-02-27 20:14:43 1526
原创 如何玩转sorted()函数
python排序中,sorted()方法是比较常用的。此方法有三个参数:iterable,key,reverse。 iterable是一个可迭代数据,常见的有列表,集合,元祖,字典。key表示用哪个值进行排序,reverse表示是升序还是降序,默认情况为升序。列表列表排序是一个最常见不过的了。a_list = [1,22,33,11,21,22,100]print(sorted...
2018-02-26 20:18:54 1470
原创 详述os.walk()方法
os.walk() 函数有四个入参,分别是:top, topdown=True, onerror=None, followlinks=Falsetoptop参数为walk递归的顶层路径,可取绝对路径或者相对路径。topdowntopdown参数默认为True,这是一个很有意思的参数,他的存在应该就是为了运行效率。具体来说就是:topdown=True 可更改dirnames列表...
2018-02-26 19:13:30 4303
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人