Zum Inhalt springen

Blog

Agentic Setup: Claude Code auf VPS und vom Vibe Coder zum Agentic Engineer

Claude Code auf dem Laptop reicht für den Einstieg. Sobald Agent-Läufe länger dauern, parallel laufen oder von unterwegs gesteuert werden sollen, wird die Infrastruktur zum Engpass. Zwei aktuelle Referenztexte zeigen beide Seiten: Claude Code auf einem VPS als reproduzierbare Umgebung (Andrey Markin) und INNOQs Weg vom Vibe Coder zum Agentic Engineer als Rollen- und Qualitätsmodell (INNOQ). Wer beides zusammendenkt, baut kein Spielzeug-Setup, sondern eine Basis für Teams.

Agentic Engineering einführen

Playbooks, VPS-Hardening und Team-Enablement für produktionsreife Agent-Workflows. Beratung & Workshops.

Claude Code auf VPS: warum überhaupt?

Ein Entwickler-Laptop ist offline, schläft ein oder blockiert den Bildschirm, während ein Agent noch Commits schreibt. Auf einem VPS läuft die Session weiter. Markin beschreibt genau diesen Use Case: Code von überall, auch vom Handy, ohne dass der lokale Rechner der Single Point of Failure ist.

Für Unternehmen kommen weitere Gründe hinzu: isolierte Sandbox pro Kunde oder Projekt, feste Toolchains (Node, Python, Docker), und Netz-Policies, die der Laptop nicht durchsetzt. Ein VPS ersetzt keine Produktion, aber er ist ein kontrollierter Ort für Agent-Arbeit, bevor Code in CI und Review geht.

Spare täglich Stunden durch KI-Automationen, die Deine Zeitfresser eliminieren

VPS-Setup in der Praxis

Markins Stack ist schlank und nachbaubar: Ubuntu auf einem günstigen Cloud-Server (z. B. Hetzner CX22 mit 2 vCPU und 4 GB RAM), ein dedizierter Nicht-Root-User, weil Claude Code mit --dangerously-skip-permissions nicht als root laufen soll, und Tailscale als Mesh-VPN für SSH. SSH nur über das Tailscale-Interface, Firewall (ufw) schließt alles andere. So bleibt der Server nicht als offener SSH-Port im Internet.

Tmux ist der zweite Pfeiler: Sessions überleben getrennte SSH-Verbindungen. Ein Projekt pro Session, optional Git-Worktrees für parallele Feature-Branches. Claude Code kann Dev-Server in separaten Tmux-Fenstern starten; du attachst später wieder und siehst den Fortschritt.

Für Browser-Preview von unterwegs setzt Markin optional Caddy als Reverse Proxy mit automatischem HTTPS ein: localhost:3000 wird unter einer Subdomain erreichbar. Wer das nicht braucht, greift über Tailscale direkt auf den lokalen Port zu.

Global und pro Repo gehört eine CLAUDE.md dazu: Tmux-Konventionen, erlaubte Tools, Plan-Mode-Regeln. Das ist kein Nice-to-have, sondern Teil des Agent Harness, den INNOQ beschreibt.

Vom Vibe Coder zum Agentic Engineer

INNOQ trennt klar: Vibe Coder generieren Code auf Zuruf, ohne systematische Kontrolle. Das fühlt sich schnell an, erzeugt aber in Rekordzeit technische Schulden. Der Agentic Engineer nutzt dieselbe Geschwindigkeit, investiert aber in Constraints, Feedback-Schleifen und deterministische Checks.

Die Analogie zu Brownfield-Projekten trifft den Kern: Niemand liest 200.000 Zeilen vor dem ersten PR. Ownership entsteht durch Tests, Linter, CI und klare Modulgrenzen. KI-Code ist Code eines sehr schnellen Kollegen, der nicht mehr im Raum sitzt. Was Brownfield möglich macht, gilt auch für Agenten: lose Kopplung, hohe Kohäsion, wiederkehrendes Review-Feedback wird zu Tooling (Boris Chernys Spreadsheet-zu-Lint-Rule-Prinzip).

INNOQ strukturiert das in zwei Pyramiden: die Tooling Pyramid (Agent Hooks, Git Hooks, CI/CD, von schnell nach langsam) und die Prompt Pyramid (globale Rules, Conditional Rules, Skills, on-demand Docs). Regel: „If you can tool it, tool it. If you can't, prompt it.“ Das deckt sich mit unserem Modell der Autonomiestufen und Guardrails für produktionsreife Software.

Der Harness wächst mit jedem Review: Problem entdeckt, Check automatisieren, Agent bekommt Feedback vor dem Menschen. Was der Mensch weiter ownen muss: Fachlogik. Tests können grün sein und trotzdem falsche Annahmen verfestigen.

Mindest-Setup für Teams

Einzelkämpfer können improvisieren. Teams brauchen ein Mindest-Setup, sonst skaliert Chaos:

  • Versionierte Rules und Skills im Repo, nicht nur Chat-Historie. CLAUDE.md, Cursor Rules oder Skills-Ordner mit Review-Prozess.
  • CI mit Lint, Tests und Secret-Scan; kein Merge ohne menschlichen Review bei produktionsnahen Repos.
  • Observability für Agent-Läufe: Traces, Kosten, Fehlerraten. Siehe Langfuse und LLM Observability für Agentic Coding.
  • Gateway oder Policies, wenn Code Kundendaten oder externe APIs berührt. CC Gateway und Privacy zeigen, wie man Datenflüsse begrenzt.
  • Klare Owner pro Repo, definierte Freigabe-Stufen für autonome Agent-Modi.
  • Getrennte Umgebungen: Dev-VPS ohne Produktions-Credentials; Secrets in Vault oder CI, nie im Repo.

Ohne diese Punkte ist „wir nutzen Claude Code“ keine Strategie, sondern ein Label für ungeprüftes Vibe Coding.

Individuelle Datenaufbereitung & Scraping as a Service

Sicherheit ohne Theater

Markins Sicherheits-Checkliste ist pragmatisch: SSH nie auf öffentlicher IP, System aktuell halten, Tailscale-ACLs bei geteilten Tailnets. Für autonome Modi empfiehlt er Hooks, die gefährliche Muster blockieren (z. B. rm -rf /, Force-Push auf main).

Der VPS ist eine Wegwerf-Sandbox: Wenn etwas schiefgeht, sind nur Git-gesicherte Dateien und Dev-Env-Vars betroffen. Produktions-Keys, Kundendatenbanken und persönliche Dateien gehören dort nicht hin. Das ist keine Schwäche, sondern bewusste Trennung.

Für Teams mit Compliance-Anforderungen reicht „wir vertrauen dem Modell“ nicht. Audit-Logs, Zugriffskontrolle pro Entwickler-Account und dokumentierte Freigabe-Prozesse sind Pflicht, sobald Agent-Output Richtung Staging oder Produktion wandert.

Alternativen zum eigenen VPS

Nicht jedes Team will Server betreiben. Die Trade-offs:

  • GitHub Codespaces / Dev Containers: Weniger Ops, integrierte Git- und Secret-Verwaltung, aber Vendor-Lock-in und Kosten bei Dauerbetrieb. Gut für sporadische Agent-Sessions.
  • Kubernetes Jobs oder Ephemeral Pods: Skalierbar für viele parallele Agent-Runs, höherer Setup-Aufwand. Sinnvoll, wenn ihr ohnehin K8s betreibt und Policies zentral durchsetzt.
  • Rein lokal: Einfachster Einstieg, schwer skalierbar, Laptop als Bottleneck. Für Einzelpersonen ok, für Teams mit parallelen Projekten oft zu eng.

Die Wahl hängt von Ops-Reife, Budget und Compliance ab. Der Agent Harness (Rules, CI, Observability) ist unabhängig vom Hosting ortsgebunden.

Fazit

Agentic Setup ist Infrastruktur plus Disziplin. Markins VPS-Guide liefert die reproduzierbare Umgebung: Tailscale, Tmux, optional Caddy, klare CLAUDE.md. INNOQ liefert das Rollenmodell: vom Vibe Coder zum Agentic Engineer mit wachsendem Harness statt Hoffnung.

Wer beides verbindet, kann Agenten schnell nutzen und trotzdem Ownership behalten. Der nächste Schritt ist nicht mehr Tools, sondern Playbooks, die eure Autonomiestufen, Reviews und Observability abbilden. Dafür lohnt ein strukturierter Einstieg über Beratung & Workshops.

Projektanfrage im Chat