2019年12月_TiDB_PingCAP

12月 11月 10月 09月 08月 07月 06月 05月 04月 03月 02月 01月

原创分布式系统 in 2010s ：软件构建方式和演化

作者：黄东旭本文为「分布式系统 in 2010s」系列第二篇，第一篇请见《分布式系统 in 2010s ：存储之数据库篇》。我上大学的时候专业是软件工程，当时的软件工程是 CMM、瀑布模型之类。十几年过去了，看看现在我们的软件开发模式，尤其是在互联网行业，敏捷已经成为主流，很多时候老板说业务下周上线，那基本就是怎么快怎么来，所以现代架构师对于可复用性和弹性会有更多的关注。我所知道业界对 ...

2019-12-31 10:11:51 1088

原创「分布式系统前沿技术」专题 | Pulsar 的设计哲学

分布式技术的发展，深刻地改变了我们编程的模式和思考软件的模式。值 2019 岁末，PingCAP 联合 InfoQ 共同策划出品“分布式系统前沿技术 ”专题，邀请众多技术团队共同参与，一起探索这个古老领域的新生机。本文出自 StreamNative 联合创始人 Sijie Guo。几十年前，消息队列开始兴起，它用于连接大型机和服务器应用程序，并逐渐在企业的服务总线与事件总线设计模式、应用间...

2019-12-27 19:04:32 1739

原创「分布式系统前沿技术」专题 | 微服务架构何去何从？

分布式技术的发展，深刻地改变了我们编程的模式和思考软件的模式。值 2019 岁末，PingCAP 联合 InfoQ 共同策划出品“分布式系统前沿技术 ”专题，邀请众多技术团队共同参与，一起探索这个古老领域的新生机。本文出自转转首席架构师孙玄。微服务架构模式经过 5 年多的发展，在各行各业如火如荼地应用和实践。如何在企业中优雅地设计微服务架构？是企业面对的一个重要问题。本文将讲述微服务架构 ...

2019-12-27 11:46:09 1559

作者：黄东旭经常思考一个问题，为什么我们需要分布式？很大程度或许是不得已而为之。如果摩尔定律不会失效，如果通过低成本的硬件就能解决互联网日益增长的计算存储需求，是不是我们也就不需要分布式了。过去的二三十年，是一场软件工程师们自我拯救的，浩浩荡荡的革命。分布式技术的发展，深刻地改变了我们编程的模式，改变了我们思考软件的模式。通过随处可见的 X86 或者 Arm 机器，构建出一个无限扩展的计算以...

2019-12-26 19:10:30 1133

原创 TiDB Binlog 源码阅读系列文章（七）Drainer server 介绍

作者：黄佳豪前面文章介绍了 Pump server，接下来我们来介绍 Drainer server 的实现，Drainer server 的主要作用是从各个 Pump server 获取 binlog，按 commit timestamp 归并排序后解析 binlog 同步到不同的目标系统，对应的源码主要集中在 TiDB Binlog 仓库的 drainer/ 目录下。启动 Drainer S...

2019-12-25 10:57:22 1240

原创直击备份恢复的痛点：基于 TiDB Binlog 的快速时间点恢复

作者介绍：吕磊，Better 队成员、美团点评高级 DBA，Better 队参加了 TiDB Hackathon 2019，其项目「基于 TiDB Binlog 的 Fast-PITR」获得了最佳贡献奖。维护过数据库的同学应该都能体会，数据备份对于数据库来说可以说至关重要，尤其是关键业务。TiDB 原生的备份恢复方案已经在多家客户得到稳定运行的验证，但是对于业务量巨大的系统存在如下几个痛点...

2019-12-20 10:36:21 1197

原创从大数据到数据库

作者：马晓宇作为一个从大数据转行做数据库的人，我自以为能感受到两个世界的异同。在这里，斗胆聊下这个话题，以及对未来的看法。大数据兴起从 70 年代关系型数据库进入历史舞台，很长一段时间它几乎是包打天下的选择。你很可能可以用一套数据库玩转所有业务，你也不需要一个连的工程师来维护她。哪怕你也许业务复杂，需要不同的数据库，但她们终究是还是数据库，温柔体贴。这个黄金时代整整延续了 20 多年。上...

2019-12-19 10:34:46 1583

原创 TiKV 源码解析系列文章（十六）TiKV Coprocessor Executor 源码解析

作者：邓力铭在前两篇文章 TiKV 源码解析系列文章（十四）Coprocessor 概览、TiKV 源码解析系列文章（十五）表达式计算框架中，讲到了 TiDB 为了最大化利用分布式计算能力，会尽量将 Selection 算子、Aggregation 算子等算子下推到 TiKV 节点上，以及下推的表达式是如何在 TiKV 上做计算的。本文将在前两篇文章的基础上，介绍下推算子的执行流程并分析下推算子...

2019-12-12 11:18:24 1119

原创拥抱 Elasticsearch：给 TiDB 插上全文检索的翅膀

作者介绍：孙晓光，知乎技术平台负责人，与薛宁（@Inke）、黄梦龙（@PingCAP）、冯博（@知乎）组队参加了 TiDB Hackathon 2019，他们的项目 TiSearch 获得了 CTO 特别奖。“搜索”是大家在使用各种 APP 中非常重要的一个行为，对于知乎这样以海量优质内容为特色的产品来说，借助搜索帮助用户准确、快速地触达想要寻找的内容更是至关重要。而“全文检索”则是隐藏在简...

2019-12-10 12:56:44 1612

原创赛程刚过 1/3，什么操作让性能提升 150+ 倍？

作者：Yao Wei11 月初我们开启了一项社区新活动「TiDB 性能挑战赛」(Performance Challenge Program，简称 PCP)，这项积分赛将持续 3 个月，选手将完成一系列难度不同的任务，赢得相应的积分。目前赛程刚刚过去三分之一，已经取得了十分耀眼的阶段性成果：过去一个月共吸引了来自社区的 156 位贡献者，包括：14 支参赛队伍。110 位个人参赛者。...

2019-12-06 13:40:46 946

原创在我们睡觉的时候，程序能不能自动查 bug？

作者介绍：我和我的 SQL 队（成员：杜沁园、韩玉博、黄宝灵、满俊朋），他们的项目「基于路径统计的 sql bug root cause 分析」获得了 TiDB Hackathon 2019 的三等奖。曾在 Hacker News 上看到过一个 Oracle 工程师处理 bug 的日常：先花两周左右时间来理解 20 个参数如何通过神奇的组合引发 bug。改了几行代码，尝试对 bug ...

2019-12-05 13:19:52 17721 26

原创 TiDB Binlog 源码阅读系列文章（六）Pump Storage 介绍（下）

作者：Chunzhu Li在上篇文章中，我们主要介绍了 Pump Storage 是如何对 binlog 进行持久化存储、排序、配对的。在文中我们提到 binlog 的持久化键值存储主要是由 valueLog 组件完成的。同时，大家如果在上文点开 writeToValueLog 代码阅读的话会发现在其中还会使用一个 slowChaser 组件。slowChaser 组件主要用于避免在写 kv...

2019-12-03 18:09:04 1006

原创汽车之家从 SQL Server 到 TiDB 的异构变迁

作者：汽车之家技术学院-技术架构组SQL Server + .Net 是很多早期互联网企业的标配技术栈，虽然 TiDB 是兼容 MySQL 协议和生态的数据库，但是 TiDB 适用的业务场景是通用的。在开源新技术大行其道的今天，如何从 SQL Server 无缝迁移至 TiDB，汽车之家做了一个创新的示范。本文将从业务背景、迁移方案、同步、业务改造、上线效果、周边建设等多个角度，详细介绍了如何...

2019-12-02 14:28:48 1475

原创流量和延迟减半！挑战分布式数据库 TiDB 跨数据中心难题

众所周知，在对可用性要求极高的行业领域（比如金融、通信），分布式数据库需要跨地域的在多个数据中心之间建立容灾以及多活的系统架构，同时需要保持数据完整可用。但这种方式同时也带来了一些问题：跨地域的网络延迟非常高，通常在几十毫秒左右，洲际间更能达到几百毫秒。跨地域的网络专线带宽昂贵、有限，且难于扩展。在今年 TiDB Hackathon 的比赛过程中，我们针对以上问题做了一些有趣的事情，并获...

2019-12-02 10:54:51 1243

原创 TiKV Engine SIG 成立，硬核玩家们看过来！

作者：Yi WuTiKV 是一个开源项目，我们一直都欢迎和感激开源社区对 TiKV 所作出的贡献。但我们之前对开源社区的合作主要是在代码审阅和散落在各种社交媒体的线下讨论，开发者并没有合适的途径去了解和影响 TiKV 的开发计划。怎么才能更好的帮助大家找到组织，更好地参与到 TiKV 的开发中来呢？我们的设想是搭建公开的平台，邀请对 TiKV 中特定领域感兴趣的开发者加入其中，与我们一起探讨和推...

2019-12-02 10:53:40 843

tidb-in-action-20200611.pdf

近年来，随着移动互联网、云计算、大数据和人工智能等技术的飞速发展，给各行业带来了深刻的影响和变革，使得企业的数据量越来越庞大，应用的规模也越来越复杂。在这个背景之下，传统的单机数据库已经在很多场景下表现的力不从心，为了解决海量数据平台的扩展性的问题，TiDB 分布式数据库应运而生。 TiDB 是当今开源 NewSQL 数据库领域的代表产品之一，相比传统的单机数据库，TiDB 有以下的一些优势： 1. 纯分布式架构，拥有良好的扩展性，支持弹性的扩缩容 2. 支持 SQL，对外暴露 MySQL 的网络协议，并兼容大多数 MySQL 的语法，在大多数场景下可以直接替换 MySQL 3. 默认支持高可用，在少数副本失效的情况下，数据库本身能够自动进行数据修复和故障转移，对业务透明 4. 支持 ACID 事务，对于一些有强一致需求的场景友好，例如：银行转账 5. 具有丰富的工具链生态，覆盖数据迁移、同步、备份等多种场景本书会专注于 TiDB 4.0 的实操与最佳实践，详细介绍 TiDB 的使用和一些相关的原理。

2020-06-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

TiDB_PingCAP 的博客