Cloud Systems Architect (Remote)

Eckdaten

Deutschland
Site Reliability Engineering (SRE)

Arbeitsmodell

Vollständig remote
Weltweit
vor 3 Tagen
Stellenbeschreibung

Cloud Systems Architect (Remote)

  • Standort: Remote (Arbeiten von überall)
  • Vergütung: Wettbewerbsfähig

Rollenübersicht

Wir suchen für einen unserer Kunden einen Site Reliability Engineer (LInE) auf Vertragsbasis. Als Site Reliability Engineer setzen Sie Ihre Expertise ein, um KI-Systeme der nächsten Generation zu trainieren und deren Lern- und Leistungsfähigkeit durch hochwertige, praxisnahe Eingaben zu formen. Diese Rolle bietet eine einzigartige Gelegenheit, an der Entwicklung von Frontier-KI-Modellen mitzuwirken und Innovationen in der KI-Branche voranzutreiben.

Hauptaufgaben

  • Design, Implementierung und Wartung skalierbarer Infrastrukturen unter Verwendung von Linux, Kubernetes und Prometheus, um nahtlose Bereitstellungen und hohe Systemverfügbarkeit zu gewährleisten.
  • Überwachung des Systemzustands, Analyse von Leistungsmetriken und proaktive Behebung von Engpässen oder potenziellen Ausfällen, um manuelle Eingriffe zu minimieren und die Systemzuverlässigkeit zu erhöhen.
  • Automatisierung betrieblicher Prozesse zur Reduzierung manueller Eingriffe sowie schnelle Reaktion auf Vorfälle, Durchführung von Ursachenanalysen und kontinuierliche Verbesserung der Incident-Response-Verfahren.
  • Enge Zusammenarbeit mit Entwicklungs- und Betriebsteams zur Sicherstellung nahtloser Deployments und hoher Systemverfügbarkeit sowie Erstellung umfassender Dokumentationen und klarer Runbooks für operative Exzellenz.

Erforderliche Fähigkeiten & Qualifikationen

  • Nachgewiesene Erfahrung im Design, der Implementierung und Wartung skalierbarer Infrastrukturen mit Linux, Kubernetes und Prometheus sowie fundiertes Verständnis von Monitoring und Performance-Analyse.
  • Starkes Verständnis von Automatisierungstools und -technologien zur Steigerung der Systemzuverlässigkeit.
  • Ausgezeichnete Problemlösungsfähigkeiten bei der Analyse komplexer Systemprobleme und Entwicklung effektiver Lösungen.
  • Starke Kommunikations- und Kooperationsfähigkeiten für die Arbeit in interdisziplinären Teams.
  • Erfahrung in der Erstellung präziser Dokumentationen und Runbooks mit hoher Detailgenauigkeit.

Über die Chance

Diese Position bietet die einzigartige Möglichkeit, mit einem weltweit führenden Unternehmen der KI-Branche zusammenzuarbeiten, Ihr Fachwissen einzubringen und die Entwicklung modernster KI-Modelle maßgeblich mitzugestalten.

Chancengleichheit

Wir stellen basierend auf Fähigkeiten und Expertise ein. Alle qualifizierten Kandidaten sind unabhängig von Hintergrund, Erfahrung oder bisheriger Beschäftigung willkommen. Bewerbungen werden ausschließlich nach technischer Eignung und Qualifikation bewertet.

Jetzt bewerben!