“21天好习惯”第一期-13

Redmonster0923

于 2021-11-04 19:44:03 发布

阅读量137

点赞数

分类专栏：学习笔记文章标签：数据库 database 虚拟机

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_47108321/article/details/121147941

版权

学习笔记专栏收录该内容

24 篇文章 0 订阅

订阅专栏

解决的问题

1.关于其实不用担心，直接手动选择iso文件所在地址就可以点击下一步继续操作了

2.安装虚拟机后一启动就出现蓝屏，显示您的设备遇到问题需要重启，当时我安装的是VMware15.5版本，后来更新到VMware16版本运行虚拟机就不会蓝屏了

官网下载：VMware16

TiDB管理基础

基于分布式数据库的HTAP数据服务
HTAP发展的必然性，InfoQ官网：为什么是HTAP

1、OLAP 和 OLTP 系统间通常会有几分钟甚至几小时的时延，OLAP 数据库和 OLTP 数据库之间的一致性无法保证，难以满足对分析的实时性要求很高的业务场景。

2、企业需要维护不同的数据库以便支持两类不同的任务，管理和维护成本高。

TiDB被“意外”用于数据中台

海量存储允许多数据源汇聚,数据实时同步
支持标准SQL,多表关联快速出结果
透明多业务模块、支持分表聚合后可以任务维度查询
TiDB最大下推机制、以及并行hash join等算子决定的 TiDB,在表关联上的优势

引入spark来缓解数据中台算力问题

Spark只能提供低并发的重量级查询，在从应用场景，很多中小规模的轻量AP查询，也需要高并发、相对低延迟技术能力，在这种场景下，Spark的技术模型重，资源消耗高的缺点就会暴露。

物理隔离是最好的资源隔离

列存天然对OLAP查询类友好,所以我们选择将这个副本放到一个列式引擎上。（越接近物理机的隔离隔离性会越好）（对实时更新不友好，引入了DeltaMerge实现了列存储的实时更新）

行列数据同步，Raft-base最佳方案

TiFlash 以 Raft Learner方式接入Multi-Raft组，使用异步方式传输数据，对TikKV产生非常小的负担。
当数据同步到TiFlash时，会被从行格式拆解为列格式。（保证了写入效率，又避免了极低延时同步）

（一部分通过行存进行了过滤，一部分通过列存实现了列聚合）

分布式里面一个很重要的优化就是最大程度的下推，就是利用分布式节点上进行本地寻址过滤

TiDB关键技术创新

分布式的KV存储系统
分布式SQL计算系统
分布式的HTAP架构系统

1.自动分片技术是更细维度弹性的基础

全局有序的KV map
按照等长大小策略自动分片(96 M)每个分片是连续的KV，通过
Start/End Key来寻址
每个分片seek成本固定
我们称该分片为 Region，它是复制、调度的最小单位

2.弹性的分片构建成了动态的系统

3.Multi-Raft将复制组更离散

Raft、Multi - raft
leader、follower、learner
目前是强主模式、读写在leader 上4.0版本开启follower read

4.基于Multi-Raft实现写入的线性扩展
当我们新增一个物理节点时，也就意味着整个集群的写入容量会进行线性增长。

5.基于Multi-Raft 实现跨IDC单表多节点写入
Region base Multi-Raft的机制，实现了一个表可以同时有多个写入点，TiKV的调度机制，可以识别单个节点的物理信息，比如IDC、REC、Host等(机房、机柜、宿主机等)，并进行约束与绑定。
(最终可以实现一个表可以跨IDC多个写入)

6.去中心化的分布式事务

7.Local Read and Geo-partition(多地多活跨地域事务式分布)

提高场景的数据性能以及降低延迟

多地部署支持,低访问延时
数据安全合规,符合数据不出境场景
支持异地多活容灾
支持冷热数据分离

冷热数据分离，所谓的冷热数据，其实就是根据访问频次来划分的，访问频次较多的数据是热数据，访问频次少的数据是冷数据。冷热数据分离就是把这两类数据分离到不同的表中，从而减少热数据表的大小。其实在很多地方大家都能看到类似的实现，比如去一些网站查询订单或者交易记录，默认只允许查询1到3个月，3个月之前的数据，基本上大家都很少关心，访问频次较少，所以可以把3个月之前的数据保存到冷库中。

8.更大数据容量下的TP与AP融合
TiDB引入了实时更新的列式引擎，即解决了资源隔离，又提升了AP效率。

TiDB引入了实时更新的列式引擎，即解决了资源隔离，又提升了AP效率
在列存上引入 MPP模型，实现了SQLjoin的下推与并行处理
通过Raft-base replication实现了更时效性
融合大数据生态，比如TiSpark

9.数据服务的统一

TiDB的CBO可以采集行列Cost模型进行配置，并同步收集不同引擎的统计信息，统一进行最佳执行路径的选择。

课后问题：TiDB在HTPA服务领域的下一步创新可能是什么？

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Redmonster0923 CSDN认证博客专家 CSDN认证企业博客

码龄4年

25: 原创

52万+: 周排名

108万+: 总排名

1万+: 访问

: 等级

263: 积分

69: 粉丝

8: 获赞

2: 评论

32: 收藏

私信

关注

热门文章

分类专栏

学习笔记 24篇

最新评论

C#笔记分享
CSDN-Ada助手: 非常感谢CSDN博主的分享，C#是一门非常重要的编程语言，对于很多程序员来说都非常有用。我觉得你可以考虑写一篇关于C#多线程编程的博客，介绍C#中多线程的使用方法、注意事项和实现原理，这样的技术文章对其他用户来说一定非常有帮助。下一篇你可以继续就C#多线程编程方面的深入研究继续写，相信会有更多读者受益。为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
“21天好习惯”第一期-20
Wsucefd: 写的真棒👏🏻

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Redmonster0923 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。