实时数据分析平台、大数据分析、MPP数据仓库 - vertica (三)高级库内分析

        Vertica的提供了一个强大和不断增长的先进的数据库内分析功能,客户可以进行数据紧密的分析计算,并可以从一个地方立即得到答案,而不
需要把信息抽取到一个单独的环境。把数据保持在数据库中是特别关键的,因为数据集的大小从TB到PB级及以后的变化。

        更重要的是,Vertica的原生解析函数和UDF还专门设计可以充分利用我们独特的MPP并行机制,列存储和执行,比其他任何平台上执行得更快。
Vertica的提供完整的ANSI标准SQL的支持,SQL分析功能,规则的文本表达式,原生SQL的扩展和用户定义函数(UDF)框架。UDF正在迅速扩大,超出今天我们提供的SQL宏的UDF。所有这些提供给业务分析师,开发人员和管理员的灵活性和简单性,使他们能够利用大量的信息,在并行处理上而无需博士学位。他们
可以简单地使用他们喜欢的工具提问。

Vertica高级分析特性包括:

  • 原生空白填补
  • 插补
  • 事件窗口功能
  • 图形遍历
  • 序列化

Vertica的简洁SQL语法扩展,使用这些SQL语句的扩展是非常简单的,因此不存在需要学习和使用另一种语言。

        谈NoSQL的有很多,但真正的问题是不是SQL语法。传统的RDBMS性能表现不佳。就拿社会网络端点分析中图的遍历来说,传统的RDBMS会使用连接和痛苦多路自联接得到一个答案,这通常会使系统过载,且无法返回最终结果。另外,可以使用自定义的数据结构和程序语言,但不幸的是,这些往
往不是企业级的,缺乏简单,可扩展性和高效率的并行化。 另一方面,使用我们的MPP操作和有效的列链接,执行排序与标准的SQL语法,Vertica能够提供这些强劲的功能和简单性。最重要的是,Vertica的优化和执行引擎喂你处理所有的规划和并行。

基于事件的窗口

        您还可以使用Vertica基于事件的窗口,把时间序列数据放入运行的窗口中。特别是财务相关的数据分析可能会集中在特定事件触发其他活动。 sessionization,一个特殊的情况下,基于事件的窗口,是一种经常用来分析点击流的功能,如标识在一个特定的时间内从记录的Web点击web浏览的会话。暴力的过程方法,可以实现这一点,但Vertica简单,高效,大规模并行,Web会话以一个即席查询的方式与不同的运行窗口中确定的参数完成。举例来说,30秒可能就不会是一个平均的web访问会话。 Vertica可以自动地分析同一IP地址会话的时间间隔,以确定平均会话时间,然后根据这个参数或会话数据自动地进行标记。

    Vertica投入巨资研发更强大的数据库内分析,使我们的客户能够以执行额外的统计,地理空间,决策树和几个其他先进的分析。 让他们的数据以更多的方式,更快地使用SQL或他们喜欢的程序编程或脚本语言。

进一步阅读

更多Vertica库内分析, 在我们的博客上检查这些链接:

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值