- 博客(9)
- 资源 (2)
- 收藏
- 关注
原创 delete与truncate区别
上午有同事让我帮他删除数据,因为他用DELETE删除时很慢,就把删除语句发给我了:DELETE FROM cjcl.cj_cj_tbjd where bgq = '201309MM'我一看,这条语句所删除的内容正是某个分区的数据: SELECT COUNT(0) FROM cjcl.cj_cj_tbjd where bgq = '201308MM'; --RWI
2017-03-29 10:58:30 524
原创 数据存储
目前大数据存储有两种方案可供选择:行存储和列存储。业界对两种存储方案有很多争持,集中焦点是:谁能够更有效地处理海量数据,且兼顾安全、可靠、完整性。从目前发展情况看,关系数据库已经不适应这种巨大的存储量和计算要求,基本是淘汰出局。在已知的几种大数据处理软件中,Hadoop的HBase采用列存储,MongoDB是文档型的行存储,Lexst是二进制型的行存储。在这里,我不讨论这些软件的技术和优缺点,只围
2017-03-16 16:56:43 371
原创 Greenplum数据库优化器
legacy query optimizer 数据库默认使用此优化器,基于统计信息生成执行计划 pivotal query optimizer Greenplum数据库4.3.5.0开始出现,数据库默认关闭 系统级别: gpconfig -c optimizer -v on (仅设置master主机,修改后生效参数:gpstop -u)
2017-03-09 14:45:33 2560
原创 Greenplum SQL语句开发
Sql开发中最基本的规范要求:1.代码行清晰、整齐、层次分明、结构性强,易于阅读;2.代码中应具备必要的注释以增强代码的可读性和可维护性;3.代码应充分考虑执行效率,保证代码的高效性;2.1查看表字段名或随机少量数据时,不要使用SELECT * FROM TABLENAME在psql命令窗口用\d TABLENAME或SELECT * FROM TABLENAME WHERE
2017-03-09 14:32:40 6682
原创 Greenplum索引使用
合适的索引,能大幅度提升数据库表读的效率,但这里也不并不是说表上的索引越多越好。因此在数据库设计过程中,需要考虑创建索引的代价。在数据库中索引的维护代价约是表的3倍,并且数据表写和读两者不能兼得。如果要提高表写入性能,那么索引在一定程度上会阻碍数据的插入速度,因为数据库需要维护索引和维护数据原子性。 索引的种类有很多,常见的有B-树索引,位图索引,基于函数的索引,分区索引等等,而在现网的系
2017-03-09 14:24:38 9707
原创 Greenplum数据库视图
视图命名规范格式:普通视图V_【具体业务含义名称】,物化视图MV_【具体业务含义名称】。视图类型1.普通视图视图本身只定义sql语句,实际数据存在于sql定义内容的实体表中。视图本身不保存任何数据,不能在视图上创建索引。2.物化视图物化视图实际上是一种特殊的物理表,物化视图通过自动或者手工方式刷新保存基表数据到物化视图中,物化视图实际占用和使用了表空间,可以在其上创建索
2017-03-09 11:48:58 5769
原创 Greenplum数据库开发
Greenplum表创建语句如下:CREATE TABLE alex.tch_gsm_user_mon ( bcyc_id varchar(6) not null, user_id varchar(16) not null, imei varchar(20) ) WITH (APPENDONLY=true, ORIENTATION=column,COMPRESSTYPE
2017-03-09 11:26:31 1556
原创 Greenplum数据库架构及主要的功能和优势
Greenplum数据库架构 Greenplum数据库基本由PostgreSQL核心增强数据库实例组合并衔接成的数据库管理系统,即Greenplum数据在PostgreSQL基础上扩展开发,每个Greenplum数据库由1个master实例和2个或2个以上segment实例组成,客户端使用PostgreSQL规范与Master交互。以上的插图,展
2017-03-09 11:06:09 11868
原创 Greenplum数据库简介
数据存储 Greenplum支持50PB(1PB=1024TB)级海量数据的存储和处理,Greenplum将来自不同源系统的、不同部门、不同平台的数据集成到数据库中集中存放,并且存放详尽历史的数据轨迹,业务用户不用再面对一个又一个信息孤岛,也不再困惑于不同版本数据导致的偏差,同时对于IT人员也降低管理维护工作的复杂度。它是采用MPP架构的数据库系统可以对海量数据进行管理。
2017-03-09 10:51:36 7700
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人