HCI Senior Compute Engineer (m/w/d)

Remote
EUR 35.000+
vor 3 Tagen
Rathausplatz 2, 79098 Essen
Stellenbeschreibung

Requirements

Must have:

  • Mehrjährige, praktische Erfahrung in der Administration und im Betrieb von Red Hat OpenShift
  • Sehr gute Linux-Kenntnisse (vorzugsweise RHEL), insbesondere im Troubleshooting von OS, Netzwerk und Storage
  • Fundiertes Wissen zu Kubernetes (Pods, Deployments, Services, Ingress, RBAC, Operatoren)
  • Erfahrung im Troubleshooting von Infrastrukturthemen (Compute, Netzwerk, Storage, Plattformdienste)
  • Erfahrung im produktiven Betrieb mit hohen Verfügbarkeits- und SLA-Anforderungen
  • Erfahrung als L3-Support, inklusive strukturierter Fehleranalyse und nachhaltiger Problemlösung
  • Kommunikationsstärke gegenüber Kunden und internen Teams (technisch und nicht-technisch)
  • Ausgeprägte Dokumentationsfähigkeit und prozessorientiertes Arbeiten
  • Fließende Deutsch- und Englischkenntnisse

Wünschenswert:

  • Erfahrung mit OpenShift Virtualization (KubeVirt) und VMware-Umgebungen
  • Kenntnisse in Automatisierung (Ansible, GitOps, IaC)
  • Erfahrung mit Enterprise Storage, CSI-Integrationen und Netzwerkinfrastruktur
  • Zertifizierungen wie Red Hat Certified Specialist in OpenShift Administration, RHCE, CKA/CKAD
  • Erfahrung mit Public Cloud OpenShift Deployments (ROSA, ARO, OCP auf AWS/Azure/GCP)

Responsibilities:

  • Übernahme der L3-Eskalation für komplexe technische Probleme rund um Red Hat OpenShift (Control Plane, Worker Nodes, Netzwerk, Storage, Authentifizierung)
  • Betreuung von OpenShift Virtualization (KubeVirt) und VM-basierten Workloads
  • Fehleranalyse und schnelle Wiederherstellung bei Major Incidents (P1/P2) sowie nachhaltige Problemlösung durch Root Cause Analysis
  • Durchführung von tiefgehenden Troubleshooting-Aktivitäten (Cluster-Degradierung, Node-Ausfälle, API-Instabilität, Netzwerk- und Storage-Probleme, Workload-Fehler)
  • Planung und Durchführung von Lifecycle-Aktivitäten wie Upgrades, Patching, Security Hardening und Zertifikatsmanagement
  • Sicherstellung von Hochverfügbarkeit und Resilienz (Backup/Restore, Disaster Recovery, Runbooks)
  • Unterstützung bei der Migration von VMware zu OpenShift Virtualization (Strategie, technische Umsetzung, Stabilisierung, Performance-Tuning)
  • Entwicklung und Pflege von Betriebsdokumentationen, SOPs, Troubleshooting-Guides und Referenzarchitekturen
  • Unterstützung von Automatisierungsinitiativen (z.B. Ansible, GitOps, Bash/Python-Skripting)
  • Verbesserung der Monitoring- und Observability-Lösungen (Prometheus, Grafana, EFK/Loki)
  • Unterstützung bei Security- und Compliance-Themen (RBAC, Integration von Identity Providern, Cluster-Hardening, Audits)

Company:

Wir sind ein brasilianisches Unternehmen mit über 30 Jahren Erfahrung in der weltweiten Bereitstellung von IT-Services, vom Outsourcing der IT-Infrastruktur bis hin zur Entwicklung von Softwareanwendungen. Wir sind in 41 Ländern präsent und haben Kunden aus verschiedenen Branchen. Unsere groß genug und dennoch klein genug Vorgehensweise macht uns offen, flexibel, reaktionsschnell und agil. Unsere Mitarbeiter stehen im Mittelpunkt unserer Kultur, was zu einer positiven und produktiven Arbeitsumgebung führt. Diese Position ist zu 100% remote und bietet eine attraktive Vergütung und viele Vorteile, einschließlich 30 Tage Jahresurlaub und Weiterbildungsmöglichkeiten.