Tag - "Streaming"

2026

TL;DR

本文基于 Flink 1.20 源码,不再泛泛讨论“什么是流式计算”,而是聚焦两个问题:

  1. 为什么 Flink 会成为主流流式处理引擎?
  2. Flink 到底靠哪些关键机制,把无界数据流变成可按时间计算、可故障恢复、可做到 exactly-once 的系统?

如果把答案压缩成一句话,那就是:

Flink 真正领先的地方,不是单独提出了 window 或 watermark,而是把 事件时间watermarkwindowtriggerstatecheckpoint 这些能力拼成了一套完整且能落地的运行时体系。

本文重点看两条主线:

  • Flink 如何处理时间:event timewatermarkwindowtrigger
  • Flink 如何保证精准一次:statecheckpoint barriersnapshot恢复