Apache Flink®

数据流上的有状态计算

Apache Flink 是一个框架和分布式处理引擎,用于在无边界和有边界数据流上进行有状态的计算。Flink 能在所有常见集群环境中运行,并能以内存速度和任意规模进行计算。

Flink Capabilities

Exactly-once 状态一致性

事件时间处理

成熟的迟到数据处理

SQL on Stream & Batch Data

DataStream API

ProcessFunction (Time & State)

灵活部署

高可用

保存点

水平扩展架构

支持超大状态

增量检查点机制

低延迟

高吞吐

内存计算

所有流式场景

事件驱动型应用是一类具有状态的应用,它从一个或多个事件流提取数据,并根据到来的事件触发计算、状态更新或其他外部动作。

Analytical jobs extract information and insight from raw data. Apache Flink supports traditional batch queries on bounded data sets and real-time, continuous queries from unbounded, live data streams.

提取-转换-加载(ETL)是一种在存储系统之间进行数据转换和迁移的常用方法。

最新博客列表

2025年6月3日 - Gabor Somogyi.

The Apache Flink community is excited to announce the release of Flink Kubernetes Operator 1.12.0! The version brings a number of important fixes and improvements to both core and autoscaler modules. …

Continue reading

2025年5月16日 - Yanquan Lv.

The Apache Flink Community is excited to announce the release of Flink CDC 3.4.0! This release introduces a new pipeline Connector for Apache Iceberg, and provides support for batch execution mode, …

Continue reading

2025年4月30日 - Ferenc Csaky.

We are pleased to announce the revival of a connector that makes it possible for Flink to interact with Apache Kudu. The original connector existed as part of the Apache Bahir project, which was moved …

Continue reading