Paperclip: Die Open-Source-Steuerungsebene für KI-Agenten-Unternehmen

In der KI-Agenten-Community kursiert eine Analogie, die den Punkt trifft: Während OpenClaw als einzelner Contributor arbeitet, ist Paperclip die Orchestrierungsschicht darüber. Diese Rahmung erklärt klarer als die meisten technischen Beschreibungen, worum es geht: Paperclip ist die organisatorische Ebene über den Agenten, zuständig für Koordination, Nachvollziehbarkeit und Budgetkontrolle über einen gesamten Schwarm von KI-Arbeitern.

Paperclip wurde im März 2026 von @dotta veröffentlicht und sammelte in den ersten Wochen über 46.700 GitHub-Stars. Diese Adoptionsgeschwindigkeit spiegelt eine echte Lücke im aktuellen KI-Stack wider: Die meisten Teams, die mehrere Agenten betreiben, haben keinen gemeinsamen Zustand, keine Kostentransparenz und keinen Mechanismus, der verhindert, dass zwei Agenten dieselbe Arbeit doppelt erledigen.

Das Problem, das Paperclip löst

Einen einzelnen KI-Agenten zu betreiben ist überschaubar. Zwanzig davon gleichzeitig zu koordinieren ist ein grundlegend anderes Problem. Ohne Abstimmung entstehen Doppelarbeit, unkontrollierte Kosten und vollständige Intransparenz darüber, was jeder Agent tatsächlich getan hat.

Die konkreten Fehlermuster kennt, wer Multi-Agenten-Workflows skalieren wollte:

Kein gemeinsamer Zustand: Agent A schließt eine Aufgabe ab, die Agent B bereits begonnen hat. Keiner weiß vom anderen.
Keine Kostentransparenz: LLM-API-Ausgaben verteilen sich auf viele Prozesse ohne zentrale Buchführung. Was etwas kostet, zeigt sich erst im Nachhinein.
Keine Koordination: Agenten, die Aufgaben aneinander übergeben sollten, arbeiten in Silos. Fortschritte stocken, weil keine Instanz Abhängigkeiten auflösen kann.
Kein Audit-Trail: Läuft etwas schief, gibt es keine verlässliche Aufzeichnung darüber, was jeder Agent wann und warum getan hat.

Paperclip adressiert all das auf Infrastrukturebene, bevor eine einzige Zeile Agenten-Logik geschrieben wird.

Kein Task-Manager: eine Unternehmensstruktur

Das Bild, das Paperclip verständlich macht: KI-Agenten-Teams werden modelliert wie echte Organisationen. Paperclip bildet Organigramme, Berichtshierarchien, definierte Rollen, monatliche Budgets pro Agent, Zielausrichtung und Board-Level-Governance ab.

Der letzte Punkt ist entscheidend. Menschen nehmen die Rolle des Boards ein. Agenten arbeiten innerhalb der Unternehmensstruktur, doch die finale Autorität über Ziele, Budgetverteilung und Richtlinien liegt beim Menschen. Das ist ein strukturiertes Delegationsmodell, in dem Autonomie begrenzt und nachvollziehbar bleibt.

Die Zwei-Schichten-Architektur

Paperclip trennt seine Zuständigkeiten sauber in zwei Schichten.

Control Plane

Paperclip selbst ist die Control Plane. Sie verwaltet Agenten, vergibt Aufgaben, erzwingt Budgets, pflegt den Audit-Trail und übernimmt die Governance. Agenten laufen nicht innerhalb von Paperclip, sondern extern, und melden ihre Ergebnisse zurück. Paperclip ist die Instanz, die jederzeit weiß, was im gesamten Unternehmen gerade passiert.

Execution Services

Agenten sind Execution Services. Sie existieren außerhalb von Paperclip, laufen auf der jeweils passenden Infrastruktur und verbinden sich über Adapter mit der Control Plane. Dieses Adapter-Pattern verhindert Vendor-Lock-in gegenüber einem bestimmten KI-Stack. Agenten melden sich zurück, um Aufgabenstatus zu übermitteln, Arbeit aus der Issue-Queue abzurufen und Aktivitäten im Audit-Trail zu erfassen.

Die Kern-Primitive

Paperclip definiert eine kleine Menge von Primitiven, die zur vollständigen Unternehmensstruktur zusammengesetzt werden.

Company

Der übergeordnete Container. Eine Company hat Ziele, eine Liste von Agenten und eine Governance-Policy. Alles andere lebt innerhalb einer Company.

Agents

Jeder Agent hat eine definierte Rolle, ein monatliches Budget in Cent und einen Status. Budget-Enforcement ist atomar: Erreicht ein Agent sein Monatslimit, stoppt er. Kein sanfter Abbau, kein Override. Das ist bewusst so. Weiche Limits scheitern lautlos; harte Limits nicht.

Issues und Tasks

Arbeit wird als Issues und Tasks modelliert. Der zentrale Mechanismus ist das atomare Checkout: Beansprucht ein Agent eine Task, ist sie diesem Agenten exklusiv zugeordnet, bis sie abgeschlossen oder explizit freigegeben wird. Kein anderer Agent kann sie übernehmen. Dieses konkrete Feature eliminiert das Doppelarbeit-Problem und ist auf Datenbankebene implementiert, nicht der Anwendungslogik überlassen.

Heartbeats

Agenten arbeiten nach geplanten Weckzyklen, den sogenannten Heartbeats. Statt dauerhaft zu laufen, wacht ein Agent nach einem Zeitplan auf, prüft zugewiesene Aufgaben, führt sie aus, meldet das Ergebnis zurück und schläft wieder. Rechenkosten werden dadurch planbar, das Verhalten der Agenten nachvollziehbar.

Governance

Die Governance-Schicht formalisiert das Modell des Menschen als Board. Richtlinienentscheidungen, Budgetänderungen und Zielanpassungen laufen durch die Governance. Der Audit-Trail ist unveränderlich: Einmal aufgezeichnete Agenten-Aktionen können weder geändert noch gelöscht werden. Das gewinnt an Bedeutung, je mehr KI-Agenten Handlungen mit realen Konsequenzen ausführen, und ist für Compliance-Nachweise unmittelbar relevant.

Das Adapter-System

Paperclip wird mit Adaptern für neun Runtimes ausgeliefert:

Claude (Anthropic)
Codex (OpenAI)
Gemini (Google)
Cursor
OpenCode
OpenClaw
Hermes
Process (beliebiger lokaler Subprozess)
HTTP (beliebiger API-Endpunkt)

HTTP und Process sind die Escape-Hatches. Jede Runtime, die einen HTTP-Call machen oder als Subprozess laufen kann, lässt sich einbinden. Das Adapter-Pattern hält die Control Plane stabil, während sich das Agenten-Ökosystem weiterentwickelt. Neue KI-Runtimes kommen als Adapter hinzu, ohne dass der Core angefasst werden muss.

Tech Stack

Die Implementierungsentscheidungen spiegeln produktionsreifes Engineering wider, kein schnelles Prototyping:

React 19 für das Frontend
Express.js 5 für die API-Schicht
PostgreSQL 17 für persistente Datenspeicherung, mit PGlite als eingebetteter Option für die lokale Entwicklung
Drizzle ORM für typsicheren Datenbankzugriff
Better Auth für Authentifizierung

Die PGlite-Option ist relevant, weil sich eine vollständige Paperclip-Instanz lokal betreiben lässt, ohne separaten Datenbankserver. Für Entwicklung und Single-Machine-Deployments entfällt damit eine erhebliche operative Abhängigkeit.

Budget-Enforcement in der Praxis

Budget-Enforcement verdient einen eigenen Abschnitt, denn es ist eines der Features, das im Produktiveinsatz am stärksten zählt. Paperclip verfolgt den Verbrauch pro Agent in Cent mit monatlichem Reset. Die Limits sind hart.

Erreicht ein Agent sein Limit mitten in einer Aufgabe, stoppt das System ihn.

Finance-Teams erhalten planbare KI-Ausgaben ohne überraschende Rechnungen
Engineering-Teams können neue Agenten-Konfigurationen erproben, ohne unkontrollierte Kosten zu riskieren
Agenten mit höherer Verantwortung oder Durchsatz erhalten höhere Budgets; Agenten mit niedrigerer Priorität entsprechend niedrigere
Budgetverteilung wird zur Governance-Entscheidung, nicht zum Nachgedanken

Für Organisationen, die KI-Automatisierung in größerem Maßstab betreiben, rechtfertigt dieses Feature allein den architektonischen Aufwand, eine Orchestrierungsschicht einzuführen.

Self-Hosted und MIT-lizenziert

Paperclip ist vollständig selbst gehostet und unter der MIT-Lizenz veröffentlicht. Keine Nutzungsgebühren, kein Vendor-Lock-in, keine externen Service-Abhängigkeiten. Das Agenten-Unternehmen läuft auf der eigenen Infrastruktur, die erzeugten Daten bleiben dort.

Für regulierte Branchen oder Organisationen mit strengen Datenschutzanforderungen ist Self-Hosting in der Regel keine Option, sondern Voraussetzung. Derselbe Audit-Trail, der die Agentenverwaltung vereinfacht, hilft beim Nachweis der Compliance, weil die Aufzeichnungen in der eigenen Datenbank liegen.

Clipmart: Der kommende Marktplatz

Clipmart ist der geplante Marktplatz für vorgefertigte KI-Unternehmen. Das Konzept: Eine vollständige Company-Konfiguration herunterladen, inklusive Agenten-Rollen, Task-Templates, Governance-Policies und Budgetverteilungen, und auf der eigenen Paperclip-Instanz deployen.

Das ist eine gewichtige Wette auf die Idee, dass KI-Company-Konfigurationen zu teilbaren, wiederverwendbaren Artefakten werden, so wie Software-Pakete es sind. Ein fertiges Customer-Support-Unternehmen oder Code-Review-Unternehmen, das man deployed und anpasst, statt es von Grund auf zu bauen. Ob Clipmart gelingt, hängt davon ab, ob die Community Konfigurationen produziert, die den Aufwand des Teilens lohnen. Das Modell selbst ist überzeugend.

Was das bedeutet

Einzelne KI-Agenten sind die erste Schicht dieses technologischen Wandels. Sie können Aufgaben ausführen, Werkzeuge nutzen und innerhalb definierter Grenzen autonom handeln. Doch einzelne Agenten stoßen an eine Grenze: Koordination ist nicht möglich, Ressourcen lassen sich nicht effizient teilen, eine kollektive Steuerung fehlt.

Paperclip ist die zweite Schicht. Infrastruktur für Multi-Agenten-Organisationen, nicht für Multi-Agenten-Skripte. Der Unterschied ist wesentlich, denn Organisationen haben Eigenschaften, die Skripten fehlen: Verantwortlichkeit, Rollendefinition, Ressourcenzuweisung, Richtliniendurchsetzung und Audit-Trails. Genau diese Eigenschaften machen Agenten-Deployments sicher genug für den Produktiveinsatz in geschäftskritischen Abläufen.

Das Projekt ist unter paperclip.ing/docs erreichbar, der Quellcode auf GitHub. Wer Multi-Agenten-Workflows aufbaut und bei dem der Koordinationsaufwand zum dominierenden Problem geworden ist, sollte sich die Zeit nehmen, Paperclip zu evaluieren.

webvise unterstützt Unternehmen beim Entwurf und der Implementierung von KI-Automatisierungs-Architekturen, die im Produktivbetrieb standhalten. Bei der Evaluierung von Orchestrierungsplattformen oder der Strukturierung eines Multi-Agenten-Deployments für reale Anforderungen hilft ein Gespräch weiter.

Die Praktiken von webvise sind an den ISO 27001- und ISO 42001-Standards ausgerichtet.