SparkSQL 内置函数

SparkSQL 有很多方便且功能强大的内置函数。本篇文章用来记录我在实际工作中用到的一些函数,并结合自己的使用场景进行分享。我会不断更新本文的内容。

last_day

last_day(date):返回日期参数所属月最后一天的日期。

用例:

1
2
> SELECT last_day('2009-01-12');
2009-01-31

可以用来快速选择月底数据。如数据表(T),包含从 2023-01-01 至 2024-09-18 连续日期的数据。

col1 col2
2023-01-01 1
2024-09-18 18

如果只查询期间每月底的数据,可以用以下 SQL 语句:

1
SELECT * FROM T WHERE col1 = last_day(col1);