第三方数据延迟取不了突破容量极限：TiDB 的海量数据“无感扩容”秘籍

11 月 26 日，京东智联云与英特尔联合举办了主题为“突破极限，TiDB 在京东智联云的技术架构与实践”的线上直播活动。

对于任何一家业务快速成长的企业来说，应对峰值流量冲击，一直是摆在技术团队面前的一大难题。面对海量数据，数据库及业务团队都希望做到“无感扩容”，但流行的分库、分表方案在扩容速度和一致性上经常不能满足需求。行业期待着性能强大、简单易用的全新数据库方案，从根本上解决企业面对流量高峰时的数据库性能瓶颈。

行业需求是技术创新的最大推动力。近年来，由开发的 TiDB 分布式数据库异军突起，在海量数据处理领域具有很大的优势。在此背景下，2020 年初京东智联云联合，基于 TiDB 打造了云端分布式数据库——Cloud-TiDB。

11 月 26 日，京东智联云与英特尔联合举办了主题为“突破极限，TiDB 在京东智联云的技术架构与实践”的线上直播活动。直播邀请到京东智联云云产品研发部架构师葛集斌老师，和 TiDB 生态技术布道专家戚铮老师分别带来分享，希望借此机会帮助更多企业和开发人员拓展思路，提供一个分库分表途径之外的新选择，并了解如何在生产实践中发挥 TiDB 的价值。

本文总结自本场直播分享，内容有调整。

1 TiDB 在京东智联云的技术架构与实践

直播第一部分，葛老师深入分析了京东智联云为何选择 TiDB 数据库，并介绍了 TiDB 在京东智联云上的技术架构和技术生态细节。

TiDB 数据库希望解决哪些问题

传统单机数据库在当下的大数据时代暴露出了越来越多的局限性，对于一家快速增长的企业来说，由于数据量会随着企业规模有序扩大，单机数据库很快就会遭遇多个瓶颈：

MySQL 为了解决这些瓶颈做了读写分离，在读取端通过数据冗余来提升读取性能，但由此也带来了很多问题：

TiDB 数据库的架构和设计

具体到技术层面，TiDB 数据库有哪些良药来应对上述问题呢？首先要明确的是，TiDB 不同于传统单机架构，而是一个真正意义上的分布式数据库。采用计算、存储分离的架构设计，提供水平线性扩展能力。它还具备强一致性、高可用性，支持自动故障恢复，可以对数据进行实时分析。另外它还高度兼容 MySQL 协议。整体架构来看，TiDB 分为 TiDB 、分布式存储层和 PD 三大部分：

TiDB 兼容 MySQL 协议，可以水平扩展，因此用户可以将 TiDB 当作 MySQL 使用。

TiDB 存储层 TiKV 是分布式 KV 存储，可以线性扩展，并通过多副本和 Raft 协议保证强一致性。TiKV 还分为多个，以为单位进行管理。数据分布在各个 TiKV 节点上，节点可以水平扩展。

PD 负责集群管理，包括调度和负载均衡工作，并负责生成全局的 TSO 时间戳。PD 本身也是无单点故障的集群。

TiDB 的分布式事务支持 MVCC，同时支持乐观 / 悲观事务，具备 SI 隔离级别，并且读数据时不需要加锁。

TiDB 使用列存储引擎来支持实时数据分析。它通过 Raft 进行异步复制，配合 MVCC 提供强一致性读取，还支持计算下推，使得其 AP/TP 功能相互无干扰。使用时 TiDB 优化器会计算查询代价，根据结果自动选择 TiKV 行存或列存。

基于这样的架构设计，TiDB 集群实现了整体的高可用性和数据强一致性，即使少数副本丢失也能自动完成数据修复和故障转移，不会干扰业务层。TiDB 可以实现跨中心的异地多活部署。

云上 TiDB 的实现和功能

近年来，京东智联云的客户对数据处理能力的需求不断提升。针对这样的需求，京东智联云与联合，基于 TiDB 打造了云端分布式数据库——Cloud-TiDB，主要面向高性能、高可靠、高可用场景。

上图为京东智联云 Cloud-TiDB 的整体架构，基于这样的架构，Cloud-TiDB 提供了一些业务价值较高的功能，包括水平弹性扩容、备份和恢复、实时数据分析、数据迁移和同步、云端监控告警等。

TiDB 技术生态

选择一项新技术的同时也是在选择一个生态，生态越完善，开发和运维效率也会越高。TiDB 生态的一大特点就是兼容 MySQL 协议，从而可以受惠于成熟的 MySQL 生态资源。MySQL 的所有数据库驱动、第三方开发 / 管理工具、数据交换 / 迁移工具等，都可以用于 TiDB 数据库。

TiDB 与其他主流数据处理技术也可以方便地互联互通。例如 TiDB 数据可以导入 Kafka，接入 Flink，乃至 Hive、HDFS、 S3、Spark 等。用户无需担心技术锁定风险，这也为 TiDB 的生态繁荣打下了基础。

在分享的最后，葛老师对云端数据库的发展趋势做了展望：

分布式是未来技术发展的重要趋势之一，包括操作系统、应用程序和数据库都在向分布式转变。TiDB 作为分布式数据库，比较符合这一技术发展趋势。与此同时，数据库上云可以带来很多好处，例如弹性调度、与 AI 结合，还能更好地理解用户的业务视角，实现数据处理的智能优化。

长远来看，数据库上云可以在开发、运维和稳定性层面获得很大收益。正因如此，京东智联云选择 TiDB 上云，就是希望能给用户带来更好的使用体验。

2 TiDB 在大数据量和高并发场景下的应用

葛老师的演讲结束后，来自的 TiDB 生态技术布道专家戚铮分享了 TiDB 在大数据量和高并发场景下的应用实践。

TiDB 与在 OLTP 场景下的解决方案对比

当企业遇到海量数据需求时，往往伴随数据量短期内急剧增长的压力。这样的业务需要数据库具备快速扩容能力和高并发能力，在响应延迟和吞吐量指标上都有足够高的水平以应对突发流量。而 OLTP 场景主要涉及线上 2C 交易，对数据库稳定性要求较高，数据库性能波动会直接影响用户体验。

针对这样的需求特点，业内常见的解决方案分为、New SQL 和中间的 DB-Based 几大类型。其中，和 TiDB，就是第一和第三种类型中的两个典型。两者都是当下活跃的开源项目，分别代表了应对海量数据需求的两大思路。所谓就是分库分表，实践中主要分为水平拆分和垂直拆分两大纬度。垂直纬度一般按照业务模块或者数据系列来拆分，水平纬度可以按取模、时间、冷热库等方式拆分。作为分库分表思路的代表，其架构大致如下：

与前文列举的 TiDB 架构相比，架构的数据备份、高可用、监控告警等需求，都需要周边第三方工具来配置解决。而 TiDB 自身就是完整的解决方案，可以一站式满足用户对高性能数据库的各项要求。如今也开始在新版中开始向整体分布式数据库方案转型，从侧面印证了分布式数据库是未来的必然趋势。

TiDB 的海量数据应用案例

TiDB 的初衷就是解决分库分表存在的许多问题，但某些场景并不太适合向 TiDB 迁移。具体来说，这样的场景中业务不会有快速增长，业务请求比较简单，也没有分布式事务需求。除了这样的场景以外，大部分海量数据需求都可以通过向 TiDB 迁移得到较好的解决。戚老师这里列举了几个实践案例。

某社区个性化首页和推送业务。由于海量用户的个性化推送业务特性，数据库每天需要生成 30 亿条数据，历史数据高达万亿量级，业务对吞吐量和延迟也高度敏感。该用户原有的 MySQL 方案基于分库分表，但 MySQL 实例总量达到上百个，风险和延迟都难以满足需求。经过调研，用户认为 TiDB 是唯一能满足他们对高扩展、强一致、高可用需求的解决方案，因此决定全面迁移。在迁移过程中，开发了一个快速导入工具结合 DM 工具来平滑转移数据，迁移完成后又做出了一系列优化，最终很好地满足了需求。尤其令用户满意的是新架构具备很强的扩展能力，迁移后数据量从 1.3 万亿逐渐增长至 1.8 万亿，性能、可用性依旧保持在很高的水平上，成本相比过去也没有明显增加。

某电信个人账单系统。该用户账单总表有 80 亿数据，对性能要求很高，而原有的 MyCAT 方案已接近扩展极限，只能存储不足一年的历史数据。由于 MySQL 分库分表的处理瓶颈，继续分片会出现不少问题，故此用户选择了 TiDB 进行升级换代。向 TiDB 迁移后，单表数据量即可达到 100 亿，数据存储周期由半年延长至 3-5 年，QPS 和延迟都有显著改善。

戚老师还介绍了某 O2O 平台 PMC 订单流水业务、某金融核心账务系统和某互金营销平台向 TiDB 迁移的案例。这些案例的共同点都是用户原有的数据库分库分表遇到了增长瓶颈，对业务造成了越来越多的负面影响，而迁移到 TiDB 后完全解决了原有瓶颈，迁移过程没有遇到严重故障，成本投入也在可控范围内。

TiDB 5.0 亮点解析

分享的最后环节，戚老师介绍了 TiDB 5.0 版本的性能优化亮点和细节，主要包括以下几项特性。

3 突破容量极限，TiDB 打破企业数据库性能瓶颈

相比传统的分库分表，TiDB 是真正一站式的分布式数据库整体解决方案，能够充分满足企业业务快速增长、海量数据高并发、实时数据分析和金融数据高可用等场景的苛刻需求。通过本场直播两位老师的精彩分享，听众对 TiDB 数据库的能力、实现细节和业务落地实践都有了更深入的认知，也了解了 TiDB 数据库服务的各项突出优势。

正如两位老师所言，分布式数据库是业内必然的发展趋势，而 TiDB 顺应了这一潮流，将成为越来越多企业根治数据库性能瓶颈的良方。与此同时，TiDB 在京东智联云的应用，为企业快速采用 TiDB、尽早享受 TiDB 收益和价值开辟了一条便捷通道。

{{userData.name}}

第三方数据延迟取不了突破容量极限：TiDB 的海量数据“无感扩容”秘籍

通道维护不让出款网上平台说“通道维护”不给出款，这是不是被黑了？

黑毛痣能取吗什么原因导致黑毛痣的出现？怎么治疗黑毛痣才是正确的方法呢？

网上提款被黑怎么办 2、提款被黑如何处理解决的经验应该怎么办？

黑平台出不了金怎么追回资金网上平台被黑不给出款如何追回被黑资金好有人成功过-阿莫

被平台黑了不能取款怎么办在网上黑平台出款通道维护不给出咋办

特别提款权不能兑换黄金张庭宾：SDR客观是延续美元货币特权的工具

被黑平台黑了出不了款网络被黑出款通道维护不给提款

微信聊天删除了怎么恢复微信删除的聊天怎么恢复？2招快速解决

被黑平台诈骗怎么处理【普法小课堂】司机数量和跑单量大幅增长，网约车平台却报了警……

网上系统审核不给提款难道又是一场轮回？我所经历的上一轮信贷资源向民营小微企业倾斜的点滴往事！

风控审核视频审核中，内容风控在“控”什么？

网站被黑平台不给提款怎么办? 网上赢钱被黑提款不了怎么办网上平台赢钱被黑提款一直审核失败该怎么办？

平台系统维护提不了款怎么办曝某借贷平台涉高利贷陷阱用户权益难维护

在线ai绘画生成软件 4款国内免费ai绘画软件，无限制无审核，巨好玩！ - 哔哩哔哩

利用chatgpt进行高考志愿填报选择计算机专业，后悔莫及？大学老师：高考志愿填报慎选！

在线ai绘画生成软件 7款免费的ai绘画生成器推荐，ai自动生成绘画 - 哔哩哔哩

互联网流量怎么挣钱流量变现的又一暴利项目，新手可做每天赚500

在线ai绘画生成软件收藏这18款免费ai绘画软件，轻松掌握ai绘画在线生成图片！ - 哔哩哔哩

网上被黑不给提怎么解决在网上的平台说数据延时提现不了

阿里版chatgpt怎么申请中国版ChatGPT会是谁？ChatGPT本尊回应了

网上被黑不给提怎么解决网上提款审核失败，网上被黑提款风控审核失败不给提款怎么解决？可以这样操作

人工智能chatgpt4.0能打游戏吗超星尔雅《人工智能》章节测验答案

被平台黑了不能取款怎么办网上被黑平台不让提现困扰您？正确解决方法来帮您一臂之力

如何让chatgpt写完完整代码用DeepSeek全自动写代码

被平台黑了不能取款怎么办网上遇到被黑了不能提款怎么办(以下几点教你解决)

如何让chatgpt对文档内容进行整理原来 ChatGPT 可以这样用：根据个人需求订做一周健康菜单

如何让chatgpt写完完整代码 ChatGPT史诗级大更新！Canvas来了，可辅助完成编程、写作

赢钱被黑网站一直不给提款怎么解决 “警醒”streamingapp是新型诈骗软件,违规操作错为不给提现怎么办

如何让chatgpt对文档内容进行整理 ChatGPT“成人模式”：AI新世界的潘多拉魔盒？

人民币特别提款权人民币SDR权重上调至12.28%，有什么作用？专家解读

发货软件哪个好发货单软件免费版

{{userData.name}}

相关文章

通道维护不让出款 网上平台说“通道维护”不给出款，这是不是被黑了？

黑毛痣能取吗 什么原因导致黑毛痣的出现？怎么治疗黑毛痣才是正确的方法呢？

网上提款被黑怎么办 2、提款被黑如何处理解决的经验应该怎么办？

黑平台出不了金怎么追回资金 网上平台被黑不给出款如何追回被黑资金好有人成功过-阿莫

被平台黑了不能取款怎么办 在网上黑平台出款通道维护不给出咋办

特别提款权不能兑换黄金 张庭宾：SDR客观是延续美元货币特权的工具

被黑平台黑了出不了款 网络被黑出款通道维护不给提款

微信聊天删除了**怎么恢复 微信删除的聊天**怎么恢复？2招快速解决

被黑平台诈骗怎么处理 【普法小课堂】司机数量和跑单量大幅增长，网约车平台却报了警……

网上系统审核不给提款 难道又是一场轮回？ 我所经历的上一轮信贷资源向民营小微企业倾斜的点滴往事！

风控审核 视频审核中，内容风控在“控”什么？

网站被黑平台不给提款怎么办? 网上赢钱被黑提款不了怎么办 网上平台赢钱被黑提款一直审核失败该怎么办？

平台系统维护提不了款怎么办 曝某借贷平台涉高利贷陷阱用户权益难维护

在线ai绘画生成软件 4款国内免费ai绘画软件，无限制无审核，巨好玩！ - 哔哩哔哩

利用chatgpt进行高考志愿填报 选择计算机专业，后悔莫及？大学老师：高考志愿填报慎选！