- Startseite
- Remote Jobs
- AI Research Engineer (Multi-Modal Reinforcement Learning)
Bereits vergeben
Lass dir die nächste nicht entgehen. Erhalte passende Stellen direkt per Mail.
AI Research Engineer (Multi-Modal Reinforcement Learning)
Eckdaten
Arbeitsmodell
Über die Position
Diese Stelle wird von Jobgether im Auftrag eines Partnerunternehmens ausgeschrieben. Wir suchen derzeit einen AI Research Engineer (Multi-Modal Reinforcement Learning) in Deutschland.
Diese Rolle befindet sich an der Schnittstelle zwischen modernster KI-Forschung und groß angelegter Systementwicklung. Der Fokus liegt auf der Weiterentwicklung von Multi-Modal Reinforcement Learning (RL) über Text, Bild, Audio und komplexe simulierte Umgebungen hinweg. Sie tragen zur Gestaltung intelligenter Systeme der nächsten Generation bei, die zu adaptivem Entscheidungsverhalten in realen Szenarien fähig sind.
In einem forschungsorientierten, global verteilten Umfeld helfen Sie beim Aufbau und der Skalierung von RL-Frameworks, die fortschrittliche multimodale Modelle antreiben. Ihre Arbeit beeinflusst direkt die Modellleistung, die Trainingsstabilität und Strategien zur Belohnungsoptimierung in großem Maßstab.
Verantwortlichkeiten
In dieser Rolle leiten Sie Forschungs- und Entwicklungsbemühungen für multimodale RL-Systeme und tragen zu skalierbarer KI-Infrastruktur bei:
- Durchführung von Forschung zu RL-Methoden für multimodale Systeme, einschließlich diffusionsbasierter und autoregressiver Ansätze.
- Design und Aufbau skalierbarer RL-Infrastruktur zur Unterstützung von verteiltem Training und Evaluierung.
- Entwicklung von Reward-Modeling-Strategien zur Verbesserung der Ausrichtung (Alignment) und Trainingsstabilität.
- Erstellung und Kuratierung von Simulationsumgebungen und Datensätzen für Training und Benchmarking.
- Design und Durchführung von Evaluierungsprotokollen zur Messung von Leistungssteigerungen.
- Analyse des Modellverhaltens über Modalitäten hinweg zur Identifizierung von Engpässen.
- Erforschung neuer RL-Paradigmen zur Verbesserung der Leistung auf dem aktuellen Stand der Technik (SOTA).
- Publikation von Forschungsergebnissen auf führenden KI-Konferenzen (z. B. NeurIPS, ICML, ICLR, CVPR).
Anforderungen
Der ideale Kandidat verfügt über einen starken akademischen und praktischen Hintergrund in Machine Learning, Reinforcement Learning und multimodalen KI-Systemen.
- Master-Abschluss in Informatik oder einem verwandten Bereich erforderlich; PhD in ML, CV, NLP oder KI-nahen Disziplinen bevorzugt.
- Starke Publikationsliste auf Top-KI-Konferenzen (NeurIPS, ICML, ICLR, CVPR, ICCV, ECCV).
- Nachgewiesene Erfahrung in groß angelegten RL-Experimenten, insbesondere in multimodalen oder vision-zentrierten Systemen.
- Tiefes Verständnis der RL-Theorie, Optimierung und Policy-Learning in hochdimensionalen Umgebungen.
- Fundierte praktische Erfahrung mit PyTorch und Deep-Learning-Frameworks.
- Erfahrung im Aufbau von End-to-End-RL-Pipelines (Simulation, Training, Evaluierung, Deployment).
- Fähigkeit, Kernherausforderungen wie Sample-Effizienz und Exploration-Exploitation-Trade-offs zu adressieren.
Vorteile
- Wettbewerbsfähiges Vergütungspaket.
- Vollständig remote, global-first Arbeitsumfeld.
- Möglichkeit, an wegweisenden KI-Forschungsproblemen in großem Maßstab zu arbeiten.
- Zusammenarbeit mit führenden Forschern und Ingenieuren.
- Zugang zu groß angelegter Experimentierinfrastruktur und Forschungsressourcen.
- Kultur der Innovation, Autonomie und Unterstützung bei Publikationen.
Über den Bewerbungsprozess
Wir nutzen einen KI-gestützten Matching-Prozess, um sicherzustellen, dass Ihre Bewerbung schnell, objektiv und fair geprüft wird. Unser System identifiziert die am besten geeigneten Kandidaten, die dann direkt an das einstellende Unternehmen weitergeleitet werden.