AI-Engineer

Eckdaten

Rosenheim
DevOps

Arbeitsmodell

Hybrid
vor 4 Tagen
Stellenbeschreibung

AI & Full-Stack Engineer (m/w/d)

Remote / Homeoffice möglich · Flexible Arbeitszeiten · Vollzeit

Deine Aufgaben

  • AI Deployment & Self-Hosting: Du bist verantwortlich für die Evaluierung, das effiziente Hosting (z.B. via vLLM oder Ollama) und den stabilen Betrieb von Open-Source KI-Modellen auf unserer eigenen Hardware. Model-Training steht hier nicht im Fokus, sondern das performante Ausrollen in die Produktion.
  • Infrastruktur & Skalierung: Du paketierst Anwendungen und Modelle und verwaltest unsere Infrastruktur mittels Docker und Kubernetes.
  • Backend & RAG-Pipelines: Du baust performante APIs und Microservices mit Python und NestJS, um Modelle anzubinden und intelligente RAG-Systeme mit Vektordatenbanken aufzubauen.
  • Frontend-Entwicklung: Du entwickelst reaktionsschnelle, moderne Benutzeroberflächen mit React und Next.js.
  • Performance & Monitoring: Überwachung der Systemstabilität, Latenzoptimierung von KI-Abfragen und kontinuierliche Verbesserung der Architektur.

Dein Profil

  • Infrastruktur & MLOps: Fundierte praktische Erfahrung mit Kubernetes (K8s) und Docker. Du weißt, wie man komplexe Services --- und KI-Modelle --- skalierbar und ausfallsicher betreibt.
  • Applied AI & LLMs: Praktische Erfahrung mit RAG-Pipelines, Vektordatenbanken (z.B. pgvector) und dem effizienten Self-Hosting von Open-Source LLMs. Sehr gutes technisches Verständnis für Prompt Engineering und die Steuerung von Model-Outputs.
  • Programmiersprachen: Hervorragende Kenntnisse in Python sowie JavaScript/TypeScript.
  • Web-Frameworks: Praxiserfahrung mit React, Next.js und NestJS.
  • Arbeitsweise: Lösungsorientiertes Denken, hoher Anspruch an Code-Qualität, eigenverantwortliches Arbeiten in einem agilen Umfeld.
  • Sprachen: Gute Deutsch- und Englischkenntnisse.

Was wir dir bieten

  • Eigene Cloud & Hardware: Arbeite mit den Technologien, die den Markt aktuell prägen -- und das direkt auf unserer eigenen Hardware und Cloud-Infrastruktur im eigenen Datacenter.
  • Echter Impact: Deine Arbeit geht direkt in Produktion. Du sorgst dafür, dass unsere Systeme und Lösungen performant, sicher und nutzbar beim Anwender ankommen.
  • Flexibilität: Flexible Arbeitszeiten und die Möglichkeit auf Homeoffice / Remote-Arbeit.
  • EGYM Wellpass: Wir bieten unseren Mitarbeitern Zugriff auf einen vom Arbeitgeber bezuschussten EGYM Wellpass.
  • Kultur: Offenes Arbeitsumfeld mit flachen Hierarchien, kurzen Entscheidungswegen und starkem Teamgeist.
  • Teamevents & Mario Kart: Bei uns kommt auch der Spaß nicht zu kurz: Legendäre Mario Kart Runden in der Mittagspause oder nach Feierabend und coole Teamevents gehören einfach dazu.

Klingt gut? Wir freuen uns auf deine Bewerbung auf team@artcodix.com!