LI

LiveEO

(Senior) Data Engineer (f/m/x) - Remote Sensing & AI Pipelines

Remote
Gestern
Berlin
Stellenbeschreibung

LiveEO: Werde Teil des Marktführers für Satellitenanalytik!

Wir suchen einen (Senior) Data Engineer (w/m/d), der das leistungsstarke Daten-Backbone für unsere multimodalen Erdbeobachtungsmodelle entwickelt. Während sich unsere ML Engineers auf die Modellarchitektur konzentrieren, bist du für die Infrastruktur, Ingestion und Verfeinerungspipelines verantwortlich, die hochauflösende optische und Synthetic Aperture Radar (SAR)-Daten zu produktionsreifen Datensätzen kombinieren.

Dies ist eine Rolle mit hoher Wirkung an der Schnittstelle von Big Data und KI. Du stellst sicher, dass unsere "Daten-Engine" skalierbar, deterministisch und in der Lage ist, Petabytes an Geodaten zu verarbeiten, um semantisches Verständnis über Sensoren und Zeit hinweg zu ermöglichen.

LiveEO ist ein junges, dynamisches Team, das sich großen Herausforderungen und schnellen Lernzyklen stellt – wir bewegen uns schnell, bleiben neugierig und genießen es, gemeinsam zu bauen. Unsere Mission ist es, den "Fluch der Erdbeobachtung" zu brechen: unglaubliche Satellitendaten in zuverlässige, umsetzbare Entscheidungen zu verwandeln, denen Menschen vertrauen und die sie in realen Einsätzen nutzen können. In dieser Rolle arbeitest du in einem unterhaltsamen Umfeld mit hoher Eigenverantwortung, in dem anspruchsvolle technische Probleme (multimodale SAR/Optical Foundation Models) auf reale Auswirkungen treffen – und deine Ideen in engen, kollaborativen Iterationen vom Whiteboard zur Produktion gelangen können.

Du wirst Teil des KI-Teams von LiveEO sein und eng mit nachgelagerten Produktteams zusammenarbeiten, um Modellfähigkeiten in messbaren Geschäftswert und produktionsreife Workflows zu übersetzen. Außerdem wirst du eng mit unserem engagierten Datensammlungsteam zusammenarbeiten, um Kennzeichnungrichtlinien zu definieren, Feedbackschleifen zur Datenqualität zu steuern und sicherzustellen, dass Trainings- und Evaluationsdatensätze reale Edge Cases widerspiegeln.

Tech Stack & Tools:

  • Ray (verteilte Berechnungen)
  • Prefect (Workflow-Orchestrierung)
  • AWS (Cloud-Infrastruktur)
  • Datenspeicher: PostgreSQL (Metadaten / operative Daten)
  • Python (Kernentwicklung)
  • PyTorch / PyTorch Lightning (Modelltraining, Experimente)
  • Databricks MLflow (Experiment-Tracking, Model Registry)
  • Geospatial Stack: GDAL, Rasterio, GeoPandas, STAC (EO-Datenverarbeitung und -standardisierung)

Deine Herausforderung

  • Skalierbare Datenpipelines erstellen: Entwerfe und pflege robuste ETL/ELT-Workflows mit Prefect und Ray, um massive Mengen an Satellitenbildern zu ingestieren, zu verarbeiten und zu standardisieren.
  • EO-Datenmanagement: Übernimm die Standardisierung von hochauflösenden SAR- und optischen Bildern mit Schwerpunkt auf Normalisierung, Kachelung/Zuschneidung und Kohärenzprüfungen zur Sicherstellung der Datenintegrität.
  • Infrastruktur & Tooling: Optimiere unseren Cloud-nativen Stack auf AWS und nutze Databricks und PostgreSQL zur Verwaltung von Metadaten und operativen Datenspeichern.
  • Kollaborative KI-Unterstützung: Arbeite eng mit ML Engineers zusammen, um produktionsreife Datenkomponenten und Inferenzschnittstellen bereitzustellen, auf die nachgelagerte Teams sich verlassen können.
  • Datenqualität & Diagnostik: Arbeite eng mit dem Datensammlungsteam zusammen, um Feedbackschleifen zur Datenqualität zu automatisieren und sicherzustellen, dass Datensätze reale Edge Cases widerspiegeln.
  • Systemzuverlässigkeit: Implementiere Monitoring-Signale und deterministische Evaluationsframeworks, um die Reproduzierbarkeit von Pipelines über verschiedene geografische Regionen und Aufnahmebedingungen hinweg sicherzustellen.

Dein Profil

  • Starke Softwareentwicklung: Beherrschung von Python mit Fokus auf sauberen, wartbaren und testbaren Code.
  • Datenorchestrierung & Compute: Fundierte Kenntnisse in Prefect (oder Airflow) und verteilten Computing-Frameworks wie Ray oder Anyscale.
  • Cloud & Big Data: Tiefgreifende Expertise in AWS-Infrastruktur und Databricks für die Datenverarbeitung im großen Maßstab.
  • Datenbankmanagement: Starke Kenntnisse in PostgreSQL und Verwaltung komplexer Metadaten im großen Maßstab.
  • Pragmatische Lieferung: Eine Denkweise, die den Aufbau robuster, langfristiger Infrastruktur mit der Notwendigkeit einer praktischen, iterativen Lieferung in Einklang bringt.
  • Geospatial Stack: Erfahrung mit GDAL, Rasterio, GeoPandas und STAC zur Verarbeitung von Erdbeobachtungsdaten ist ein Plus.
  • ML-Integration: Vertrautheit mit PyTorch Lightning und MLflow zur besseren Unterstützung des ML-F&E-Lebenszyklus ist ein Plus.
  • SAR-Erfahrung: Grundlegende Kenntnisse von SAR-Vorverarbeitungsbibliotheken und Datenformaten sind ein Plus.

Deine Benefits

  • Die Möglichkeit, ein Produkt zu schaffen, das Geschäftsprozesse und Leben weltweit verbessern kann.
  • Flexible Arbeitszeiten und hybrides Arbeitsmodell – wir vertrauen darauf, dass unsere Mitarbeiter ihre Arbeit erledigen und gleichzeitig eine gesunde Work-Life-Balance wahren.
  • Wir befähigen Mitarbeiter, ihre eigene Karriereentwicklung voranzutreiben, Initiative zu ergreifen und die Freiheit zu haben, kreativ und mutig zu sein.
  • Keine Überstundenkultur – wir achten darauf, dass Überstunden nur im Notfall anfallen und immer durch Freizeit und Erholung ausgeglichen werden.
  • Eine kollaborative und lernfördernde Umgebung – regelmäßige interne Workshops, Wissensaustausch-Sitzungen, Journal Clubs und Hackathons.
  • Büro im Zentrum von Berlin Kreuzberg mit kostenlosem Obst, Nüssen und Getränken.
  • Möglichkeit zur Teilnahme am Mitarbeiter-Aktienoptionsprogramm.
  • Urban Sports-Mitgliedschaft und BVG-Zuschuss, betriebliche Altersvorsorge.
  • Eine vielfältige und lebendige internationale Umgebung mit 30 verschiedenen Nationalitäten.

Über uns

LiveEO ist ein gut finanziertes Startup, gegründet 2018 in Berlin. Unser Hauptdienst ist die Modellierung von Risiken für die Vermögenswerte und Infrastrukturen unserer Kunden durch Vegetation, Bodenverformung und Veränderungserkennung. Wir beschäftigen derzeit rund 160 Mitarbeiter aus aller Welt mit unterschiedlichstem Hintergrund.