github.com/pingcap/br@v5.3.0-alpha.0.20220125034240-ec59c7b6ce30+incompatible/docs/cn/2019-09-17-design-of-reorganize-importSST-to-TiKV.md (about)

     1  Last updated: 2019-11-05
     2  
     3  ## TiKV 整合 import SST 的设计
     4  
     5  ### 目标
     6  
     7  通过该设计将 tikv-importer 的部分功能下推到在 TiKV 中,在 TiKV 运行 IO/CPU 密集型的导入/恢复任务,最大化地利用集群资源。
     8  
     9  ### 背景
    10  
    11  目前导入/恢复任务都有 tikv-importer 的参与。
    12  
    13  针对 BR 来说,存在以下问题:存在多余步骤,增加额外的复杂度部署不方便,增加了额外的运维负担。
    14  
    15  我们经过讨论,决定将 tikv-importer 的部分功能放到 TiKV 中。
    16  
    17  tikv-importer 的部分功能指 key rewrite,在恢复时将备份出来的 sst 的 key 重写一遍。
    18  
    19  ### 具体设计
    20  
    21  目前的想法是尽量复用现有的代码,将 key rewrite 放到 TiKV 的 sst-importer 工作线程中执行。此外我们还会将 tikv-importer 上传 sst 的功能变为 TiKV 主动下载 sst。流程如下:
    22  
    23  ![img](../resources/download-sst-diagram.svg)
    24  
    25  上图,红色部分为 TiKV,蓝色部分为外部客户端,整个恢复流程由客户端驱动。
    26  
    27  大体过程如下:
    28  
    29  1. Process
    30     1. 客户端向 region peers 所处的 TiKV 发起 Process 请求
    31     2. TiKV 中的 importer worker 根据请求下载 SST,并 Rewrite SST。
    32  2. Ingest
    33     1. 当客户端发现所有的 TiKV 准备好后,向 region leader 发起 ingest 请求
    34     2. Leader 通过 Raft 复制给 follower,各个 TiKV 执行 ingest sst,导入结束。
    35  
    36  ### 错误处理
    37  
    38  上述流程和现有的导入流程基本相同,不同的点在于多了 Download SST 和 Rewrite SST。由于这两步不会对集群数据进行修改,所以当它们发生错误时,我们只要让客户端重试即可。
    39  
    40  真正会对集群数据产生修改的地方是 Ingest 部分,目前它的错误处理如下:
    41  
    42  1. 可恢复错误:
    43     1. NotLeader,重试
    44     2. IngestEpochNotMatch,重试
    45     3. Process
    46  2. 不可恢复错误:
    47     1. Ingest 执行失败,Panic
    48  
    49  ### Rewrite SST
    50  
    51  > 以下的部分摘自于一次[讨论](./2019-09-09-BR-key-rewrite-disscussion.md),因此其中的信息仅仅用做理解设计上的参考。
    52  
    53  Key Rewrite 的目的有二:
    54  
    55  1. 为 BR 提供修改 Table ID 的功能,以支持恢复到 Schema Version 不同的集群
    56  2. 为 Lightning 提供添加前缀的功能,省略 Lightning <-> Importer 之间重复的数据传输
    57  
    58  一个 BR 的 SST 可能包含多个 Tables,所以要支持多条 Rewrite Rules 同时生效。SST 可能来自非 TiDB 系统,所以 Importer 不应该有 Key 编码格式的假设(不一定是 t«tid»_ 开头)。
    59  
    60  给 Importer / TiKV 参考的 Key Rewrite 数据结构建议如下:
    61  
    62  ```protobuf
    63  message RewriteRule {
    64  	bytes old_prefix = 1;  // this can be empty for universal prefix insertion!
    65  	bytes new_prefix = 2;  // these are _not_ just an integer!
    66  }
    67  
    68  message RestoreRequest {
    69  	...
    70  	repeated RewriteRule rewrite_rules = N;
    71  	...
    72  }
    73  ```
    74  
    75  正向替代一个 Key:
    76  ```rust
    77  fn rewrite_key(rules: &[RewriteRule], key: &[u8]) -> Cow<[u8]> {
    78      for rule in rules {
    79          if key.starts_with(rule.old_prefix) {
    80              return Cow::Owned(rule.new_prefix + key[rule.old_prefix.len()..])
    81          }
    82      }
    83      Cow::Borrowed(key)
    84  }
    85  ```
    86  
    87  反向还原一个 Key:
    88  ```rust
    89  fn undo_rewrite_key(rules: &[RewriteRule], key: &[u8]) -> Cow<[u8]> {
    90      for rule in rules {
    91          if key.starts_with(rule.new_prefix) {
    92              return Cow::Owned(rule.old_prefix + key[rule.new_prefix.len()..])
    93          }
    94      }
    95      Cow::Borrowed(key)
    96  }
    97  ```
    98  
    99  ### Download SST
   100  TiKV 下载的 SST 来自 ExternalStorage,针对不同的使用场景,会使用不同的 ExternalStorage。
   101  
   102  对于 BR, ExternalStorage 就是 backup 期间使用的那个。
   103  
   104  ### 部署
   105  
   106  该方案对于 BR 来说,组件上省去了 tikv-importer。
   107  
   108  ### 兼容性
   109  
   110  考虑到现在的 lightning + importer 只用在离线导入中,所以风险可控,兼容性问题不大。