文章目录
- pyspark sql functions
-
- current_database
- current_date 获取当前日期
- add_months 月份操作
- date_add 日操作增加
- date_sub 日操作减少与date_add相反
- date_format 时间格式化
- weekofyear 将给定日期的周数提取为整数
- year 提取年份
- month 提取月份
- hour 提取小时
- minute 提取分钟
- seconds 提取秒
- last_day 日期所属月份的最后一天
- localtimestamp 返回时间戳
- next_day 获取下一个日期
- make_date 拼接日期
- to_date 转换日期格式
- trunc 截断重置时间
- weekday 返回日期所在星期几
pyspark sql functions
current_database
返回当前数据库
spark.range(1).select(current_database()).show()
+------------------+
|current_database()|
+------------------+
| default|
------------------+
current_date 获取当前日期
df.withColumn('ldsx',sf.current_date()).show()
+---+----------+
| id| ldsx|
+---+----------+
| 0|2024-10-09|
+---+----------+
add_months 月份操作
df = spark.createDataFrame([('2015-04-08', 2)], ['dt', 'add'])
df.show()
+----------+---+
| dt|add|
+----------+---+
|2015-04-08| 2|
+----------+---+
df.select(sf.add_months(df.dt, 1).alias('next_month')).show()
+----------+
|next_month|
+----------+
|2015-05-08|
+----------+
df.select(sf.add_months('dt', -2).alias('prev_month')).show()
+----------+
|prev_month|
+----------+
|2015-02-08|
+----------+
date_add 日操作增加
df = spark.createDataFrame([('2015-04-08', 2,)], ['dt', 'add'])
# 日期加1
df.select(date_add(df.dt, 1).alias('next_date')).collect()
[Row(next_date=datetime.date(2015, 4, 9))]
# 日期-1
df.select(date_add('dt', -1).alias('prev_date')).collect()
[Row(prev_date=datetime.date(2015, 4, 7))]
date_sub 日操作减少与date_add相反
df.show()
+----------+---+
| dt|sub|
+----------+---+
|2015-04-08| 2|
+----------+---+
df.select(sf.date_sub(df.dt, 1).alias('prev_date')).show()
+----------+
| prev_date|
+-------

最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



