第四章：编码与演化

1. 为什么要关注编码与演化

分布式系统中，数据总在跨进程、跨机器、跨时间流动。只要存在版本不一致，就会出现兼容性问题。编码格式与模式演化规则决定了系统能否平滑升级。

如 Java Serializable、Python pickle，开发便利但跨语言差、安全风险高、版本演化能力弱，不适合作为长期公共协议。

JSON、XML、CSV 可读性高、生态成熟，但存在体积大、类型表达不精确、二进制字段处理笨重等问题。

MessagePack、BSON 等在体积与性能上优于纯文本，但若仍携带字段名，压缩收益有限。

两者通过 IDL 定义 schema，运行时以字段编号编码，兼顾紧凑性与可演化性。

Avro 不在数据中写字段编号，依赖写入 schema 与读取 schema 的解析规则完成兼容。

数据库里的数据生命周期往往长于应用代码版本。滚动升级期间，旧代码可能读新数据，新代码也要读旧数据，因此通常要求同时满足前向与后向兼容。

消息代理在发送者和消费者之间提供缓冲与解耦，适合异步架构与削峰填谷。

Broker 通常只处理字节，不理解业务 schema。若无统一协议治理，版本漂移会快速累积为兼容性事故。

分布式 Actor（如 Akka）把并发与消息传递统一，但跨版本部署时同样依赖稳定消息协议。