Konfiguration des Celery Kubernetes Executors für Airflow 2.0

Michal Milosz
Michal Milosz
April 6, 2026
12 min read
Loading the Elevenlabs Text to Speech AudioNative Player...

Einführung

Apache Airflow 2.0 hat eine Vielzahl neuer Funktionen eingeführt, die die Workflow-Orchestrierung auf die nächste Stufe heben. Eine der leistungsstärksten Optionen ist der Celery Kubernetes Executor, der die Skalierbarkeit von Celery mit der Flexibilität von Kubernetes kombiniert. In diesem Artikel zeigen wir Ihnen, wie Sie diesen Executor konfigurieren und optimal nutzen können.

Warum den Celery Kubernetes Executor verwenden?

Der Celery Kubernetes Executor ist ideal für Teams, die Workflows in großem Maßstab ausführen und gleichzeitig die Vorteile von Kubernetes nutzen möchten. Er ermöglicht:

  • Skalierbarkeit: Automatische Skalierung der Worker-Knoten basierend auf der Arbeitslast.
  • Flexibilität: Nutzung von Kubernetes-Pods für die Ausführung von Tasks mit spezifischen Anforderungen.
  • Effizienz: Optimierte Ressourcennutzung durch Kubernetes.

Voraussetzungen

Bevor Sie beginnen, stellen Sie sicher, dass Sie die folgenden Voraussetzungen erfüllen:

  • Ein funktionierendes Kubernetes-Cluster.
  • Apache Airflow 2.0 oder höher.
  • Grundkenntnisse in Kubernetes und Celery.

Schritt-für-Schritt-Anleitung zur Konfiguration

Folgen Sie diesen Schritten, um den Celery Kubernetes Executor einzurichten:

1. Airflow-Konfiguration anpassen

Passen Sie die airflow.cfg-Datei an, um den Executor zu aktivieren:

[core]
executor = CeleryKubernetesExecutor

2. Kubernetes-Cluster vorbereiten

Stellen Sie sicher, dass Ihr Kubernetes-Cluster korrekt eingerichtet ist. Erstellen Sie ein Namespace und konfigurieren Sie die erforderlichen Rollen und Berechtigungen.

3. Celery konfigurieren

Richten Sie Celery so ein, dass es mit Ihrem Message-Broker (z. B. Redis oder RabbitMQ) kommuniziert. Aktualisieren Sie die entsprechenden Einstellungen in Ihrer airflow.cfg-Datei:

[celery]
broker_url = redis://your-redis-url:6379/0
result_backend = db+postgresql://your-db-url

4. KubernetesExecutor-Einstellungen festlegen

Fügen Sie die Kubernetes-spezifischen Einstellungen hinzu, um sicherzustellen, dass Pods korrekt erstellt werden:

[kubernetes]
namespace = airflow
worker_container_repository = your-docker-repo
worker_container_tag = latest

Best Practices

Um das Beste aus dem Celery Kubernetes Executor herauszuholen, beachten Sie die folgenden Best Practices:

  • Verwenden Sie Ressourcenlimits, um sicherzustellen, dass Pods nicht mehr Ressourcen als nötig verbrauchen.
  • Überwachen Sie Ihre Workflows mit Tools wie Prometheus und Grafana.
  • Nutzen Sie data pipelines, um komplexe Workflows zu organisieren und zu automatisieren.

Fazit

Der Celery Kubernetes Executor in Airflow 2.0 bietet eine leistungsstarke Möglichkeit, Workflows in Kubernetes-Clustern zu orchestrieren. Mit der richtigen Konfiguration und den oben genannten Best Practices können Sie die Effizienz und Skalierbarkeit Ihrer Workflows erheblich steigern.

Share this post
Data Engineering
Michal Milosz
MORE POSTS BY THIS AUTHOR
Michal Milosz

Curious how we can support your business?

TALK TO US