Zum Hauptinhalt springen
All positions

Open position

AI Platform Engineer (m/w/d)

Vollzeit · 40hStuttgartAb sofortEinstiegsgehalt + Wachstumsbeteiligung

Du denkst in Systemen, nicht in Tickets. Montag debuggst du NVIDIA-Treiber, Dienstag baust du ein Feature in der App, Mittwoch automatisierst du ein Deployment — und nutzt dabei AI-Tools als Multiplikator. Kein reiner Admin, kein reiner Dev: Die Mischung. Wir bauen Brane AIF — eine On-Premises KI-Plattform für den deutschen Mittelstand. Unternehmen die ihre Daten nicht in die Cloud geben können oder wollen, bekommen von uns eine eigene KI-Lösung: NVIDIA-Hardware, eigene Modelle, volle Kontrolle. Wir brauchen jemanden, der das Produkt end-to-end ownen kann.

Wir sind ein frühes Startup. Das Gehalt startet solide, aber nicht auf Konzernniveau. Dafür wächst es mit uns: Nach Investment-Runde und Umsatzmeilensteinen steigt dein Gehalt — plus Share Options. Wer früh kommt, profitiert am meisten.

Wie du arbeitest:

  • Full-Stack + Infra: Server aufsetzen UND am nächsten Tag ein Feature in der App bauen
  • AI-Native: Claude Code, Cursor, Copilot sind deine Teammitglieder — nicht deine Spielzeuge
  • Deep Linux + Docker: Compose, Networking, GPU-Treiber, Secure Boot
  • System-Denken: Frontend, Backend, Inference, Security — du siehst das Gesamtbild

Your tasks

  • Brane AIF weiterentwickeln — Features, Infrastruktur, Deployment, alles aus einer Hand
  • Brane AIF Instanzen provisionieren und beim Kunden live bringen
  • Docker-Stack und Inference-Engine warten, optimieren, absichern
  • NVIDIA GPU-Stack debuggen und Inference-Performance tunen
  • Netzwerk + Security: Tunnel, SSL, Firewalls, SSO, PII-Filterung
  • Monitoring, Alerting und Update-Pipelines aufbauen
  • AI-gestützte Workflows: Architektur definieren, AI-Agents orchestrieren, Output qualitätssichern
  • Technische Entscheidungen treffen — nicht nur umsetzen

Du baust das Produkt und sorgst dafür, dass es beim Kunden läuft.

What you bring

  • 3–5 Jahre Erfahrung mit Linux + Docker in Production
  • Full-Stack-fähig: Next.js/TypeScript + Infrastruktur — du kannst beides
  • Erfahrung mit GPU/CUDA oder AI/ML Inference (vLLM, TensorRT, Ollama o.ä.)
  • Du nutzt AI-Tools produktiv (Claude Code, Cursor, Copilot) — zum Shippen, nicht zum Rumspielen
  • Security-Mindset: Verschlüsselung, SSO, Firewalls sind keine Fremdwörter
  • Pragmatisch und selbstständig: Du siehst was fehlt und baust es
  • Deutsch fließend — unsere Kunden sind DACH, unser Code ist Englisch
  • Bonus: On-Premise Deployments, Supabase/PostgreSQL, regulierte Branchen (Finance, Healthcare, Manufacturing)

What we offer

  • Gehalt wächst mit dem Unternehmen — transparentes Stufenmodell nach Investment und Umsatz
  • Beteiligung am Unternehmenserfolg — wer früh kommt, profitiert am meisten
  • Zugang zu NVIDIA DGX Hardware und Cutting-Edge AI-Stack
  • Direkter Einfluss auf das Produkt — keine Bürokratie, keine Legacy-Altlasten
  • Kleines Team, maximale Ownership, echte technische Entscheidungen
  • AI-Budget: Die besten Tools, keine Diskussion

Apply now

Apply for this role.

Send us your CV (PDF/DOC, max. 10 MB) and we'll respond within 48 hours.