Vertica
hmxz1024
这个作者很懒,什么都没留下…
展开
-
vertica rebalance准备工作
本文翻译整理自:Best Practices for Preparing Your Cluster for Rebalance关于vertica在rebalance过程中的原理及优化,请参考之前的博文。集群rebalance前的操作必须进行的操作清理不必要的数据删除非必要的schema,表和projections,以及大表的一些非必要的分区。...翻译 2020-05-30 11:33:00 · 469 阅读 · 0 评论 -
vertica rebalance优化
本文翻译整理自:优化rebalancingvertica rebalance的介绍内容分为两部分,其中对于rebalance的基础介绍,可参考之前的博文《vertica集群增加节点(扩容)》,该部分内容主要参考rebalance期间做了哪些工作。...翻译 2020-04-25 11:58:47 · 1181 阅读 · 0 评论 -
vertica用户自定义扩展开发
开发用户定义的扩展(UDx)用户自定义的扩展(UDx)是包含在外部共享库中的函数,这些库是使用Vertica SDK 以C ++,Python,Java或R开发的。外部库是使用CREATE LIBRARY语句在Vertica目录中定义的。它们最适合那些难以在SQL中执行的分析操作,或者需要经常执行但速度存在性能瓶颈的的分析操作。UDx的主要优势是:它们可以在可以使用内部功能的任何地方使用。...原创 2020-03-15 11:58:08 · 628 阅读 · 0 评论 -
vertica用户自定义扩展介绍
vertica允许用户使用C++,Python,Java和R编程语言开发自己的分析或数据加载工具,当要使用SQL进行的数据处理类型困难或缓慢时,它们很有用。包括以下UDx类型:用户定义的聚合函数(UDAFs)分析函数(UDAnF)标量函数(UDSF)转换函数(UDTF)用户定义的加载函数(UDL)用户定义的聚合函数(UDAFs)聚合函数对一组值执行一个运算并返回一个值。 Ver...原创 2020-02-25 08:50:26 · 980 阅读 · 0 评论 -
vertica备份与恢复(二)
本博客主要介绍相似的vertica集群间数据的备份与恢复。本博客翻译整理自:Copying Data Between Similar Vertica Clusters您可以使用以下选项在另一个集群上复制Vertica数据库:复制整个数据库复制目录,架构,投影和分区。复制数据库的一部分仅复制特定的表。执行复制时,必须确保源群集和目标群集相似。这两个集群必须具有相同数量的节点,节点...翻译 2020-02-20 20:35:54 · 583 阅读 · 0 评论 -
vertica备份与恢复(一)
关于vertica备份与恢复的一系列文章翻译整理自:Vertica Backup and Restore: What’s Your Use Case?本篇博文主要介绍当备份集群和恢复集群规模相同的使用场景。翻译整理自:Copy and Restore Data from a Vertica Cluster to a Backup文档名词解释源集群:执行备份的数据库集群。目标集群:执行恢复...翻译 2020-02-20 15:56:29 · 874 阅读 · 0 评论 -
vertica数据库权限
创建数据库对象(例如模式,表或视图)时,将为该对象分配所有者(即执行CREATE语句的用户)。默认情况下,数据库管理员(超级用户)及对象所有者是唯一可以对对象执行任何操作的用户。为了允许其他用户使用对象,或取消用户使用对象的权限,授权用户必须授予其他用户对该对象的权限。vertica通过GRANT/REVOKE语句授予(或撤消)权限。Vertica在V_CATALOG.GRANTS系统表中记录...原创 2020-02-05 18:24:34 · 3811 阅读 · 1 评论 -
vertica中SQL的执行过程
本文翻译整理自:SQL执行过程SQL执行过程一个SQL的执行过程中,依赖以下内容:启动节点:客户端在提交查询时连接到的节点优化器:评估运行查询的不同策略并选择最佳策略执行计划:查询将执行的步骤或计划执行节点:参与执行特定SQL语句的任何节点,通常包含启动节点。过程如下查询提交vertica任何一个节点都可以成为启动节点。在此节点可以做的优化是打开负载均衡,vertica支...原创 2020-01-14 21:17:01 · 1089 阅读 · 0 评论 -
vertica中的directed query
更多内容可参考:directed query定向查询(directed query)定向查询封装了优化器可用于创建查询计划的信息。定向查询可以实现以下目标:使用vertica升级前的查询计划。创建可提高优化程序性能的查询计划。有时,您可能希望影响优化器以在执行给定查询时做出更好的选择。例如,您可以选择其他投影,或强制使用不同的加入顺序。在这种情况下,您可以使用直接查询来创建查询计划,该...原创 2020-01-14 21:14:06 · 221 阅读 · 0 评论 -
Vertica中用户登录认证
本文翻译整理自:Authentication Methods for dbadmin在vertica中,当你新建一个数据库后,默认是没有设置认证配置的。在这种情况下,Vertica假定所有用户(包括dbadmin)都具有隐式密码身份验证。用户可以使用此身份验证方法通过网络接口和本地域套接字进行身份验证。示例:默认认证登录方式首先,我们创建一个名为auth_test的新数据库:adminto...翻译 2020-01-12 19:49:54 · 1471 阅读 · 0 评论 -
Vertica资源池
vertica资源管理请参考之前的博文:vertica资源管理vertica任务的执行过程:在初始节点创建全局执行计划,如果资源需求超过可用资源,就拒绝向执行节点分配全局执行计划在执行节点创建本地执行计划,判断需要的资源执行节点判断资源是否足够,然后执行查询或者查询排队(可能会因等待超时被拒绝)执行节点启动执行引擎,管理运行时资源处理结果并发送到初始节点聚合vertica使用资...原创 2019-11-16 21:27:19 · 1060 阅读 · 0 评论 -
vertica中的tuple_mover操作
本博文翻译整理自:https://www.vertica.com/kb/Tuple-Mover-Best-Practices/Content/BestPractices/Tuple-Mover-Best-Practices.htm之前的博客也介绍过,vertica中带有写优化存储WOS和读优化存储ROS,tuple_mover操作就是用于处理这两种优化存储的。函数do_tm_task有两个参数...原创 2019-11-14 14:53:52 · 956 阅读 · 0 评论 -
Understanding Vertica Epochs
本文翻译自:https://www.vertica.com/kb/Understanding-Vertica-Epochs/Content/BestPractices/Understanding-Vertica-Epochs.htm名词解释:Epoch:An epoch is 64-bit number that represents a logical time stamp for the ...翻译 2019-10-14 21:26:58 · 489 阅读 · 0 评论 -
vertica集群增加节点(扩容)
该博客翻译整理自:https://www.vertica.com/blog/expanding-cluster-new-nodes/若想对原有的vertica数据库集群扩容(增加一些节点),可以参考以下步骤:备份现有数据库保险起见,操作前需要对数据进行备份。但是,如果数据库数据量特别巨大呢?删除旧的或未使用的表分区感觉这一步应该放在最前面,以减少备份的数据量。参考命令:SELE...原创 2019-08-28 23:40:26 · 1200 阅读 · 0 评论 -
vertica数据库总结
研究使用vertica有一段时间了,对它也有了一定的了解。总的来说,vertica是一款性能强大,功能全面,很容易使用的MPP数据库,当然,要是这款数据库能够开源就更好了。对于一款数据库,客户选择它的理由不外乎从以下几个方面考虑:性能、成本、可靠性和稳定性、易用性。下面将从这几个方面大概介绍一下vertica的特点,之前已经有博客对vertica的一些功能做描述,这篇博文算是一个总结。性能提升...原创 2019-08-07 22:24:28 · 2670 阅读 · 0 评论 -
Vertica中的企业模式和Eon模式
您可以使用以下两种模式之一创建Vertica数据库:企业模式或Eon模式。选择哪种模式取决于您部署群集的位置。在规划数据库安装时,必须选择其中一种模式。创建数据库后,无法将数据库从一种模式切换到另一种模式。大多数Vertica功能在两种模式下的行为方式相同。企业模式概述Enterprise Mode 是最初的默认Vertica数据库模式(版本9.1发行版之前唯一可用的模式)。在企业模式中,数...原创 2019-05-19 10:50:47 · 1432 阅读 · 0 评论 -
Vertica中聚合projections的使用
projections(投影)Vertica支持创建包含聚合数据的projections,以提高聚合查询的效率。聚合投影Vertica提供了三种类型的投影,用于存储从聚合函数或表达式返回的数据:包含表达式的投影:使用投影中包含从锚表列计算结果的列。实时聚合投影:投影钟包含具有从其锚表中的列的聚合值的列。还可以定义包含用户定义的转换函数的实时聚合投影。Top-K投影:实时聚合投影的类型,...原创 2019-05-21 22:28:11 · 1413 阅读 · 0 评论 -
vertica介绍
简介Vertica是一款基于列存储的MPP(massively parallel processing)架构的数据库。它可以支持存放多至PB(Petabyte)级别的结构化数据。是由关系数据库大师Michael Stonebraker(2014 年图灵奖获得者)所创建,于2011年被惠普收购并成为其核心大数据平台软件。Vertica 采用无共享的MPP 架构,基于工业标准的x86 服务器,拥有...原创 2019-01-05 23:15:17 · 5907 阅读 · 0 评论 -
Vertica中的projections
在之前的博文《vertcia介绍》中有讲到,在vertica中,表只是一个逻辑上的概念,其真实数据其实是存储在一个个的projection中。projections以优化查询执行的格式存储数据。与物化视图类似,projections将结果集存储在磁盘上,而不是在每次查询时计算它们。您可以使用新数据或更新数据刷新projections。projections提供以下好处:1.压缩和编码数据以减少...原创 2019-05-18 12:07:27 · 5835 阅读 · 0 评论 -
flattened table
flattened table(扁平表)高度规范化的数据库设计通常使用星型或雪花型架构模型,包括多个大型事实表和许多较小的维度表。查询通常涉及大事实表和多个维表之间的连接。根据表的数量和加入的数据量,这些查询会产生很大的开销。为避免此问题,某些用户创建了宽表,这些表组合了查询所需的所有事实和维度表列,这些表可以显着加快查询执行速度。但是,维护冗余的规范化和非规范化数据集有其自己的管理成本。非...原创 2019-05-18 18:17:15 · 606 阅读 · 0 评论 -
Vertica, MPP Database and Use Cases
本文转载自:http://wenda.chinahadoop.cn/question/1029是一篇演讲文,而且时间比较早,2015年,当时vertica的最新版本是7.2,现在(2019年)已经出到9.2了。但是,这篇演讲文,对于vertica的介绍还是比较全面的,vertica的前世今生,主要特性。这些很有助于了解vertica,故作此摘录。首先我想给大家介绍一下什么是MPP数据库,然后...转载 2019-06-19 22:21:32 · 1346 阅读 · 0 评论 -
vertica数据库监控
本文档翻译整理自:https://www.vertica.com/kb/Best-Practices-for-Monitoring-Vertica/Content/BestPractices/BestPracticesforMonitoringVertica.htm系统健康监控节点状态监控可通过命令查看系统表nodes,获得各个节点的健康状态。=> SELECT node_name,...原创 2019-07-01 23:05:23 · 2185 阅读 · 0 评论 -
vertica数据加载
WOS与ROS在企业模式下运行时,Vertica将数据存储在两个容器中:写优化存储(WOS) - 将数据存储在内存中,无需压缩或索引。您可以使用INSERT,UPDATE和COPY语句将数据加载到WOS中。读取优化存储(ROS) - 将数据存储在磁盘上。对数据进行分段,排序和压缩以实现高度优化。您可以使用COPY语句将数据直接加载到ROS中。WOS的存在是为了防止许多小数据加载...原创 2019-06-26 22:09:16 · 1038 阅读 · 0 评论 -
vertica资源管理
本篇博客主要翻译整理自vertica官方博客,以对资源管理,特别是资源池的配置做一个总结。资源管理原文可参考:https://www.vertica.com/blog/resource-management/对数据库运行的所有加载和查询都会占用系统资源,例如CPU,内存,磁盘I / O,带宽,文件句柄等,而查询性能取决于分配给它的资源数量。在单用户环境中,系统可以将所有资源专用于单个查询,...原创 2019-06-27 21:05:34 · 1279 阅读 · 0 评论 -
Vertica分区
本文翻译整理自:https://www.vertica.com/kb/Vertica-Partitions-The-FAQs/Content/FAQs/Vertica-Partitions-The-FAQs.htm基础知识vertica的分区方法与目的与其他数据没有区别,都是为了更高效的对数据进行管理。vertica中有一个活动分区的概念,特指最新创建的那个分区。非活动分区包含可能不需要经常...原创 2019-07-12 10:59:40 · 1979 阅读 · 0 评论 -
vertica常用sql语句总结
在使用vertica的过程中,需要使用一些系统表对数据库集群进行监控,现对一些常用的sql语句进行总结。1.查看session信息select * from sessions;2.关闭某个sessionselect CLOSE_SESSION ('sessionid');sessionid由1中的查询获得3.导出表结构select export_objects('','table...原创 2019-07-18 22:47:42 · 6587 阅读 · 0 评论 -
Vertica Database Designer
我们知道,在vertica中,数据是存储在projections中的,针对每个projection,我们可以指定包含那些列,列的编码压缩方式,排序方式,分布方式等。而vertica在执行查询操作时,会根据优化器找到一个或多个针对该查询的最好的projections。综上所述,我们可以通过设计projections来达到优化数据库的查询性能的目的。设计在vertica中被解释为:A design ...原创 2019-05-18 21:48:14 · 651 阅读 · 0 评论