- Startseite
- Alle Remote Jobs
- (Senior) Data Scientist (m/w/d) in Full-Remote Deutschlandweit
Bereits vergeben
Lass dir die nächste nicht entgehen — erhalte passende Stellen direkt per Mail.
(Senior) Data Scientist (m/w/d) in Full-Remote Deutschlandweit
Firmenprofil
Unser Kunde ist ein international tätiges Digitalunternehmen im Bildungsumfeld, das datengetriebene Produkte für anspruchsvolle Lern- und Trainingsszenarien entwickelt.
Im Fokus der Rolle stehen moderne KI-Verfahren, skalierbare Plattformtechnologien und die strukturierte Aufbereitung großer Informationsmengen, um personalisierte Lernerfahrungen zu ermöglichen. Das Unternehmen arbeitet remote-first innerhalb Europas und verbindet technologische Exzellenz mit hoher Produktorientierung und interdisziplinärer Zusammenarbeit.
Aufgaben
- Entwicklung von Verfahren zur automatisierten Strukturierung großer Mengen unstrukturierter Inhalte mittels Large Language Models und datenwissenschaftlicher Methoden
- Konzeption, Test und kontinuierliche Optimierung von Prompt- und Extraktionsstrategien zur zuverlässigen Erkennung definierter Entitäten und Beziehungen
- Aufbau und Pflege eines semantischen Datenmodells sowie Implementierung einer Graph- oder relationalen Wissensstruktur für produktive Anwendungen
- Entwicklung automatisierter Validierungs- und Qualitätsprüfungen, einschließlich regelbasierter Checks und KI-gestützter Review-Schleifen
- Definition und Umsetzung von Evaluationsframeworks zur Messung von Qualität, Robustheit, Sicherheit und Effizienz KI-basierter Features
- Enge Zusammenarbeit mit Fachexpertinnen und Fachexperten zur fachlichen Plausibilisierung sowie mit Engineering-Teams zur Integration in Produkt-APIs
- Dokumentation, Monitoring und iterative Verbesserung der Datenpipelines mit Blick auf Skalierbarkeit und Wartbarkeit
Anforderungen
- Sehr gute Python-Kenntnisse und Erfahrung in der Entwicklung modularer, produktionsnaher Softwarekomponenten
- Praxis im Umgang mit LLMs, insbesondere API-basierter Nutzung sowie Verständnis für typische Failure-Modes und Guardrails
- Ausgeprägtes Verständnis für Datenmodellierung und strukturierte Repräsentationen als Grundlage für maschinelle Verarbeitung
- Erfahrung mit oder hohe Lernbereitschaft für Graphdatenbanken (Neo4j), Ontologien oder wissensbasierte Systeme und deren Abfragesprachen
- Grundkenntnisse in Cloud- und MLOps-Praktiken, z.B. CI/CD, Containerisierung, Deployment und Monitoring
- Abgeschlossenes Studium in Informatik, Mathematik, Statistik, Data Science oder einer vergleichbaren Fachrichtung
Benefits
- Remote-first Arbeitsmodell innerhalb Deutschlands mit flexiblen Arbeitszeiten
- Langfristige Perspektive in einem wachstumsorientierten Tech-Umfeld
- Strukturiertes Onboarding mit klaren Ansprechpartnern, Feedbackschleifen und bereichsübergreifendem Kennenlernen
- Arbeit in einem engagierten, professionellen Team mit kurzen Entscheidungswegen und hoher Produktnähe
- Großer Gestaltungsspielraum, um Prozesse, Datenprodukte und KI-Features aktiv mitzuprägen
- Umfangreiche Möglichkeiten zur fachlichen und persönlichen Weiterbildung über interne Lernangebote
- Zugang zu Coaching- und Unterstützungsangeboten rund um mentale Gesundheit und Wellbeing
Connected verpflichtet sich zu Chancengleichheit, als Arbeitgeber ebenso wie als Dienstleistungsunternehmen. Wir treffen Rekrutierungsentscheidungen ausschließlich basierend auf Erfahrungen und Fähigkeiten der Bewerberinnen und Bewerber.
Wir freuen uns auf Ihre Bewerbung! Bei Fragen oder für ein erstes Gespräch zur Position steht Ihnen Friedrich Starck unter 030 206 2559 10 jederzeit gerne zur Verfügung.