TeraData项目经验总结与回顾

最新推荐文章于 2024-04-06 22:20:19 发布

泰格数据

最新推荐文章于 2024-04-06 22:20:19 发布

阅读量3k

点赞数 2

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiefu5hh/article/details/50853316

版权

本文总结了TeraData项目的重点，包括其体系结构、处理机制、PI分布查询、SPOOL SPACE管理、重分布和全拷贝操作以及各种表连接方式。深入探讨了如何优化SQL查询和资源使用，以提升性能。

摘要由CSDN通过智能技术生成

TeraData项目总结

TeraData体系结构和处理机制

在物理布局上，Teradata系统主要包括三个部分：处理节点（Node）、用于节点间通信的内部高速互联（InterConnection）和数据存储介质（通常是磁盘阵列）。

图1

图2

其中解析引擎PE(Parsing Engine)是一个虚拟处理器，用于进行客户端和存取模块处理器之间的通讯和交互。

主要的功能包括任务控制（Session Control），SQL语句的解析、优化、查询步骤的生成和分发，并行化预处理和返回查询结果，每个PE最多支持120个Session。如图3

图3

一般来说一个节点对应一个IP,一个节点一般有2个PE, 在Host文件中一般时候会把所有的IP都设置上，连接时会默认从设置的第一个IP连接，如果大家在HOST中第一个都设置同一IP,那就会出现第一个连接不足时，使用节点间通信，将请求传给其他节点，以达到平均负载的功能。而传回结果的时候还是要通过连接的IP传回数据，这样就会产出不必要的网络资源的浪费。可以通过调整HOST中设置的IP的顺序得到解决。

比如host中

192.168.0.1 dbcoop1

192.168.0.2 dbcoop2

…

192.168.0.20 dbcoop20

调整为

192.168.0.20 ..dbcoop1

192.168.0.19..dbcoop2

…

192.168.0.1 dbcoop20

查看PI的分布情况

例如：SELECT

HASHAMP(HASHBUCKET(HASHROW(customer_code,report_date))) AS "AMP", COUNT(*)

FROM dwcrssmart.rm_cr_cl_cust_basic_info_t

GROUP BY 1

ORDER BY 1;

查询结果：
AMP Count(*)

0 3,134

1 3,228

2 3,199

3 3,177

4 3,200

....

使用PI字段查询

Ø 避免使用like、substr、index、<>等这类用法，会导致索引失效

Ø 值类型必须与该字段类型相同，否则TERADATA会在内部进行数据转换，将消耗大量的性能。

SPOOL SPACE

最低0.47元/天解锁文章

关注

2
点赞
踩
19

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

泰格数据 CSDN认证博客专家 CSDN认证企业博客

码龄15年

41: 原创

7万+: 周排名

153万+: 总排名

18万+: 访问

: 等级

2017: 积分

48: 粉丝

49: 获赞

24: 评论

143: 收藏

私信

关注

热门文章

分类专栏

模型评估 5篇
机器学习 5篇
kafka 2篇
踩坑 2篇
linux 4篇
java 4篇
hadoop 11篇
hbase 13篇
spark 10篇
zookeeper 1篇
hive 1篇
sql 5篇
算法 11篇
redis 5篇
other 2篇
es 1篇
elasticsearch

最新评论

HBASE我遇坑之client.AsyncProcess: #1, waiting for 5012 actions to finish
JavaDevelopmentDM: 心情不好干脆都别写了,解决方案没写\原理没写
HBASE我遇坑之client.AsyncProcess: #1, waiting for 5012 actions to finish
其实我是真性情: 说了跟没说一样
tez 编译详解
小飞KeepMoving: --allow-root抄别人，但不给真实截图，都不知道想干嘛？
HBase常见性能问题及解决方案
Deep Learning小舟: 谢谢！（￣ˇ￣)
SPARK生产者写入KAFKA消息-代码及踩坑记录
weixin_44358303: [code=java] Caused by: java.lang.NoClassDefFoundError: Could not initialize class com.puhuilink.bigdata.etl.StreamRedisJoinWithJedis$ at com.puhuilink.bigdata.etl.StreamRedisJoinWithJedis$$anonfun$main$2$$anonfun$2.apply(StreamRedisJoinWithJedis.scala:95) at com.puhuilink.bigdata.etl.StreamRedisJoinWithJedis$$anonfun$main$2$$anonfun$2.apply(StreamRedisJoinWithJedis.scala:83) at scala.collection.Iterator$$anon$11.next(Iterator.scala:410) at scala.collection.Iterator$$anon$11.next(Iterator.scala:410) at org.apache.spark.sql.catalyst.expressions.GeneratedClass$GeneratedIteratorForCodegenStage1.processNext(Unknown Source) at org.apache.spark.sql.execution.BufferedRowIterator.hasNext(BufferedRowIterator.java:43) at org.apache.spark.sql.execution.WholeStageCodegenExec$$anonfun$13$$anon$1.hasNext(WholeStageCodegenExec.scala:636) at scala.collection.Iterator$$anon$12.hasNext(Iterator.scala:440) at scala.collection. [/code]

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。