Presto适用的SQL函数

序号功能和说明
1abs(x)

返回x的绝对值

2cbrt(x)

返回x的多维数据集根

3ceiling(x)

返回舍入为最接近整数的x

4

ceil(x)

天花板别名(x)

5degrees(x)

返回x的度数值

6e(x)

返回欧拉数的双重值

7

exp(x)

返回欧拉数的指数值

8floor(x)

返回x舍入到最接近的整数

9

from_base(string,radix)

返回解释为基数的字符串的值

10

ln(x)

返回x的自然对

11log2(x)

返回x的基数2的对

12

log10(x)

返回x的基10对

13

log(x,y)

返回x的基y

14mod(n,m)

返回n的模数(余数)除以m

15

pi()

返回pi值。结果将返回为双重值

16power(x,p)

将值'p'的幂返回到x

17

pow(x,p)

权力别名(x,p)

18radians(x)

将角度x以弧度计转换

19

rand()

弧度别名()

20random()

返回伪随机值

21

rand(n)

随机()的别名

22round(x)

返回x的舍入值

23

round(x,d)

'd'小数位四舍五入的x

24

sign(x)

返回x的signum函数,即,

如果参数为0,则为0

1如果参数大于0

-1如果参数小于0

对于双参数,函数还返回 -

NaN如果参数是NaN

1如果参数是+ Infinity

-1如果参数是-Infinity

25sqrt(x)

返回x的平方根

26to_base(x,radix)

返回类型是弓箭手。结果返回为x的基数

27truncate(x)

截断x的值

28width_bucket(x,bound1,bound2,n)

返回x指定的bound1和bound2界限的bin数量以及n个存储桶的数量

29width_bucket(x,bin)

根据数组bin指定的bin返回x的bin数

三角函数

三角函数参数表示为弧度()。下表列出了功能。

序号功能与说明
1ACOS(x)

返回反余弦值(x)

2

ASIN(x)

返回正弦值(x)

3

ATAN(x)

返回反正切值(x)

4ATAN2(Y,X)

返回反正切值(y / x)

5

COS(x)

返回余弦值(x)

6COSH(x)

返回双曲余弦值(x)

7sin(x)

返回正弦值(x)

8

tan(x)

返回正切值(x)

9

tanh(x)

返回双曲正切值(x)

按位功能

下表列出了Bitwise功能。

序号功能与说明
1bit_count(x,bits)

计数位数

2bitwise_and(X,Y)

对于两个位xy执行按位AND运算

3bitwise_or(X,Y)

两位x,y之间的按位或运算

4bitwise_not(x)

按位不对位x执行

5bitwise_xor(X,Y)

x,y的异或运算

字符串函数

下表列出了String函数。

序号功能与说明
1concat(string1,...,stringN)

连接给定的字符串

2length(string)

返回给定字符串的长度

3lower(string)

返回字符串的小写格式

4upper(string)

返回给定字符串的大写格式

5lpad(string,size,padstring)

给定字符串的左填充

6ltrim(string)

从字符串中删除前导空格

7replace(string, search, replace)

替换字符串值

8reverse(string)

反转对字符串执行的操作

9rpad(string,size,padstring)

给定字符串的正确填充

10rtrim(string)

从字符串中删除尾随的空格

11split(string, delimiter)

拆分分隔符上的字符串,并返回最大限制的大小数组

12split_part(string, delimiter, index)

拆分分隔符上的字符串并返回字段索引

13strpos(string,substring)

返回字符串中子字符串的起始位置

14substr(string,start)

返回给定字符串的子字符串

15substr(string,start,length)

返回具有特定长度的给定字符串的子字符串

16trim(string)

从字符串中删除前导和尾随空格

日期和时间功能

下表列出了日期和时间功能。

序号功能与说明
1current_date

返回当前日期

2current_time

返回当前时间

3CURRENT_TIMESTAMP

返回当前时间戳

4CURRENT_TIMEZONE()

返回当前时区

5now()

返回当前日期,时区与时区

6localtime

返回当地时间

7LOCALTIMESTAMP

返回本地时间戳

正则表达式函数

下表列出了正则表达式函数。

序号功能与说明
1regexp_extract_all(string,pattern)

返回与模式的正则表达式匹配的字符串

2regexp_extract_all(string,pattern,group)

返回与模式和组的正则表达式匹配的字符串

3regexp_extract(string,pattern)

返回与模式的正则表达式匹配的第一个子串

4regexp_extract(string,pattern,group)

返回与模式和组的正则表达式匹配的第一个子字符串

5regexp_like(string,pattern)

返回模式的字符串匹配。如果返回字符串,则该值将为true,否则为false

6regexp_replace(string,pattern)

将与表达式匹配的字符串的实例替换为模式

7regexp_replace(string,pattern,replacement)

将表达式匹配的字符串的实例替换为模式和替换

8regexp_split(string,pattern)

拆分给定模式的正则表达式

JSON函数

下表列出了JSON函数。

序号功能与说明
1json_array_contains(json,value)

检查json数组中存在的值。如果值存在,它将返回true,否则返回false

2json_array_get(json_array,index)

获取json数组中索引的元素

3json_array_length(JSON)

返回json数组中的长度

4json_format(JSON)

返回json结构格式

5json_parse(string)

将字符串解析成json

6json_size(json,json_path)

返回值的大小

网址功能

下表列出了URL功能。

序号功能与说明
1url_extract_host(URL)

返回URL的主机

2url_extract_path(URL)

返回URL的路径

3url_extract_port(URL)

返回URL的端口

4url_extract_protocol(URL)

返回URL的协议

5url_extract_query(URL)

返回URL的查询字符串

聚合函数

下表列出了Aggregate的功能。

序号功能与说明
1

avg(x)

返回给定值的平均值

2min(x,n)

从两个值返回最小值

3MAX(X,N)

从两个值返回最大值

4sum(x)

返回值的总和

5count(*)

返回输入行数

6count(x)

返回输入值的计数

7checksum(x)

返回x的校验和

8arbitrary(x)

返回x的任意值

颜色功能

下表列出了颜色功能。

序号功能与说明
1bar(x, width)

使用rgb low_color和high_color呈现单个条

2bar(x,width,low_color,high_color)

为指定的宽度呈现单个条

3color(string)

返回输入字符串的颜色值

4render(x, color)

使用ANSI颜色代码使用特定颜色渲染值x

5render(b)

接受布尔值b,并使用ANSI颜色代码呈现绿色true或红色false

6

rgb(red, green, blue)

返回一个颜色值,捕获以0到255之间的int参数提供的三个颜色值的RGB值

数组函数

下表列出了Array函数。

序号功能与说明
1array_max(x)

查找数组中的最大元素

2array_min(x)

查找数组中的最小元素

3array_sort(x)

对数组中的元素进行排序

4array_remove(x,element)

从数组中删除特定元素

5concat(x,y)

连接两个数组

6contains(x,element)

在数组中找到给定的元素。如果存在,则返回True,否则为false

7array_position(x,element)

在数组中找到给定元素的位置

8array_intersect(X,Y)

执行两个数组之间的交集

9element_at(array,index)

返回数组元素的位置

10slice(x,start,length)

切片具有特定长度的数组元素

Teradata功能

下表列出了Teradata功能。

序号功能与说明
1index(string,substring)

使用给定的子字符串返回字符串的索引

2substring(string,start)

返回给定字符串的子字符串。您可以在此处指定开始索引

3substring(string,start,length)

返回特定起始索引和字符串长度的给定字符串的子字符串

  • 2
    点赞
  • 51
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
Presto是Facebook最新研发的数据查询引擎,可对250PB以上的数据进行快速地交互式分析。据称该引擎的性能是 Hive 的 10 倍以上。 PrestoDB 是 Facebook 推出的一个大数据的分布式 SQL 查询引擎。可对从数 G 到数 P 的大数据进行交互式的查询,查询的速度达到商业数据仓库的级别。 Presto 可以查询包括 Hive、Cassandra 甚至是一些商业的数据存储产品。单个 Presto 查询可合并来自多个数据源的数据进行统一分析。 Presto 的目标是在可期望的响应时间内返回查询结果。Facebook 在内部多个数据存储中使用 Presto 交互式查询,包括 300PB 的数据仓库,超过 1000 个 Facebook 员工每天在使用 Presto 运行超过 3 万个查询,每天扫描超过 1PB 的数据。此外包括 Airbnb 和 Dropbox 也在使用 Presto 产品。 Presto 是一个分布式系统,运行在集群环境中,完整的安装包括一个协调器 (coordinator) 和多个 workers。查询通过例如 Presto CLI 的客户端提交到协调器,协调器负责解析、分析和安排查询到不同的 worker 上执行。 此外,Presto 需要一个数据源来运行查询。当前 Presto 包含一个插件用来查询 Hive 上的数据,要求: Hadoop CDH4 远程 Hive metastore service Presto 不使用 MapReduce ,只需要 HDFS 要求: Mac OS X or Linux Java 7, 64-bit Maven 3 (for building) Python 2.4 (for running with the launcher script) 标签:PrestoDB  查询引擎  大数据

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值