Open position

AI Platform Engineer (m/w/d)

Vollzeit · 40hStuttgartAb sofortEinstiegsgehalt + Wachstumsbeteiligung

Du denkst in Systemen, nicht in Tickets. Montag debuggst du NVIDIA-Treiber, Dienstag baust du ein Feature in der App, Mittwoch automatisierst du ein Deployment — und nutzt dabei AI-Tools als Multiplikator. Kein reiner Admin, kein reiner Dev: Die Mischung. Wir bauen Brane AIF — eine On-Premises KI-Plattform für den deutschen Mittelstand. Unternehmen die ihre Daten nicht in die Cloud geben können oder wollen, bekommen von uns eine eigene KI-Lösung: NVIDIA-Hardware, eigene Modelle, volle Kontrolle. Wir brauchen jemanden, der das Produkt end-to-end ownen kann.

Wir sind ein frühes Startup. Das Gehalt startet solide, aber nicht auf Konzernniveau. Dafür wächst es mit uns: Nach Investment-Runde und Umsatzmeilensteinen steigt dein Gehalt — plus Share Options. Wer früh kommt, profitiert am meisten.

Wie du arbeitest:

Full-Stack + Infra: Server aufsetzen UND am nächsten Tag ein Feature in der App bauen
AI-Native: Claude Code, Cursor, Copilot sind deine Teammitglieder — nicht deine Spielzeuge
Deep Linux + Docker: Compose, Networking, GPU-Treiber, Secure Boot
System-Denken: Frontend, Backend, Inference, Security — du siehst das Gesamtbild

Your tasks

Brane AIF weiterentwickeln — Features, Infrastruktur, Deployment, alles aus einer Hand
Brane AIF Instanzen provisionieren und beim Kunden live bringen
Docker-Stack und Inference-Engine warten, optimieren, absichern
NVIDIA GPU-Stack debuggen und Inference-Performance tunen
Netzwerk + Security: Tunnel, SSL, Firewalls, SSO, PII-Filterung
Monitoring, Alerting und Update-Pipelines aufbauen
AI-gestützte Workflows: Architektur definieren, AI-Agents orchestrieren, Output qualitätssichern
Technische Entscheidungen treffen — nicht nur umsetzen

Du baust das Produkt und sorgst dafür, dass es beim Kunden läuft.

What you bring

3–5 Jahre Erfahrung mit Linux + Docker in Production
Full-Stack-fähig: Next.js/TypeScript + Infrastruktur — du kannst beides
Erfahrung mit GPU/CUDA oder AI/ML Inference (vLLM, TensorRT, Ollama o.ä.)
Du nutzt AI-Tools produktiv (Claude Code, Cursor, Copilot) — zum Shippen, nicht zum Rumspielen
Security-Mindset: Verschlüsselung, SSO, Firewalls sind keine Fremdwörter
Pragmatisch und selbstständig: Du siehst was fehlt und baust es
Deutsch fließend — unsere Kunden sind DACH, unser Code ist Englisch
Bonus: On-Premise Deployments, Supabase/PostgreSQL, regulierte Branchen (Finance, Healthcare, Manufacturing)

What we offer

Gehalt wächst mit dem Unternehmen — transparentes Stufenmodell nach Investment und Umsatz
Beteiligung am Unternehmenserfolg — wer früh kommt, profitiert am meisten
Zugang zu NVIDIA DGX Hardware und Cutting-Edge AI-Stack
Direkter Einfluss auf das Produkt — keine Bürokratie, keine Legacy-Altlasten
Kleines Team, maximale Ownership, echte technische Entscheidungen
AI-Budget: Die besten Tools, keine Diskussion

Apply now

Apply for this role.

Send us your CV (PDF/DOC, max. 10 MB) and we'll respond within 48 hours.