Spectre, Agenten und Verantwortung: Was Harvey’s neues World Model für die Rechtswelt bedeutet

Anfang April hat Harvey einen ungewöhnlich offenen Blick hinter die eigene Kulisse gewährt. In einem Blogpost beschreibt Co-Founder Gabe Pereyra, wie ein interner KI-Agent namens Spectre das Unternehmen bereits von innen verändert — und was das für die gesamte Rechtsbranche bedeuten könnte. Der Begriff, den er dafür prägt: Law Firm World Model.

Von Prompt zu autonomem Agent — ein Spektrum

Um zu verstehen, was Harvey hier beschreibt, lohnt ein kurzer Schritt zurück. Legal AI ist kein monolithisches Konzept — je nach Kontext, Aufgabe und Organisation bewegt man sich aktuell auf einem Spektrum verschiedener Stufen, die ich hier kurz vorstellen möchte.

Am einfachsten Punkt steht der Chat: ein einmaliger Prompt, welcher weder Kontext noch Struktur noch Erinnerungsvermögen zwingend erfordert. Einen Schritt weiter kommt der Assistant — vorkonfiguriert für wiederkehrende Aufgaben, mit hinterlegtem Kontext und definierter Rolle, aber immer noch ein Schritt pro Interaktion. Der Workflow geht weiter: Mehrere Schritte werden vordefiniert hintereinandergeschaltet und laufen automatisch bis zum Ziel-Output durch — konsistent, aber mit festem Pfad. Und hinzu kommt der zunehmend im Mittelpunkt stehende, echte Agent: Er bekommt ein Ziel und entscheidet selbst über den Weg, iteriert und korrigiert eigenständig. Auf der Harvey-Plattform wurden bereits über 25.000 solcher Workflows gebaut. Und Harvey nutzt Agenten intern bereits sehr aktiv — wofür genau, darauf gehe ich im Folgenden näher ein.

Quer zu dieser Linie liegen spezialisierte Arbeitsumgebungen — für Massenverarbeitung, Dokumentenanalyse, Discovery oder kollaborative Reviews. Sie sind keine eigene Automatisierungsstufe, sondern eine zweite Dimension. Die Richtung, in die sich das entwickelt, ist dabei besonders spannend: Automatisierungsgrad und Arbeitsumgebung frei kombinierbar — je nachdem, was die konkrete Aufgabe erfordert. Welche Kombination für welchen Kontext die sinnvollste ist, wird eine der zentralen Gestaltungsfragen für Kanzleien in den nächsten Jahren sein.

Spectre: Was das System konkret tut

Spectre wird nicht mehr primär durch einen menschlichen Prompt ausgelöst. Stattdessen überwacht das System kontinuierlich das Unternehmen selbst: Incidents, Bug Reports, Kundenfeedback, Slack-Nachrichten — und trifft darauf basierend eigenständig Entscheidungen darüber, was als nächstes getan werden muss.

Technisch läuft das über eine cloud-basierte Agentenplattform: Ein Request — aus Slack, einer Web-App oder einer automatisierten Routine — wird in einen persistenten Run umgewandelt, isoliert ausgeführt, mit explizit definierten Zugriffsrechten auf externe Systeme, und erzeugt am Ende überprüfbare Artefakte: Zusammenfassungen, Diffs, Pull Requests. Kein Schatten-Automatismus — vollständige Auditierbarkeit.

Die Analogien zur juristischen Arbeit sind dabei direkt: Code-Repositories werden zu Mandatsakten, Pull Requests zu Review-Workflows, Sandbox-Grenzen zu Ethical Walls und Client Isolation. Harvey macht kein Geheimnis daraus, dass Spectre als Blaupause für das Kundenprodukt dient — die Infrastruktur, die intern funktioniert, soll in adaptierter Form in Kanzleien laufen.

Das Bottleneck verschiebt sich

Pereyra illustriert den Fähigkeitssprung mit einer persönlichen Anekdote. Seine Eltern — beide promovierte Informatiker, seine Mutter 30 Jahre bei Apple, sein Vater Stanford-Professor — wurden trotz ihrer Hintergründe von den heutigen Coding-Agenten völlig überrascht. Das System analysierte vergleichbare Open-Source-Projekte, schrieb einen Implementierungsplan, schrieb Tests, kompilierte das Projekt, debuggte Fehler und iterierte weiter, bis alles über C++, MATLAB und Julia funktionierte. Ihre Einschätzung: Die erste Aufgabe hätte sie mindestens einen Monat gekostet.

Innerhalb von Harvey selbst hat das bereits zu einer strukturellen Verschiebung geführt. Pereyra beschreibt dies so: Our engineers are now so productive that they are harder to coordinate. The bottlenecks are shifting away from implementation and toward review, prioritization, coordination, and operating design.

Die alten Koordinationsstrukturen — gemeint sind die klassischen Hierarchien aus Zuständigkeiten, Freigabeprozessen und Reviewschleifen, die darauf ausgelegt waren, menschliche Produktionsgeschwindigkeit zu koordinieren – können also mit dem Output nicht mehr Schritt halten. Statt bei der Implementierung liegt das Bottleneck nun beim Review, Priorisierung und und der Frage, wie man eine Organisation um diese neue Realität herum aufbaut.

Was Pereyra hier für Harvey beschreibt, lässt sich auf die Rechtswelt übertragen — und wer ehrlich ist, erkennt die Konturen bereits heute. Die Beobachtung, die wir zunehmend machen: Juniore Anwälte werden mit KI-Unterstützung mehr Output liefern als ihre Vorgesetzten sinnvoll reviewen können. Die Knappheit verschiebt sich. Nicht mehr Arbeitszeit ist die limitierende Ressource, sondern Urteilsvermögen. Oder in Pereyras eigenen Worten: a surplus of intelligence, bottlenecked by judgment.

Was ist ein „Law Firm World Model”?

Der Begriff stammt aus der KI-Forschung. Was Pereyra hier mit „World Model” meint, ist kein Werkzeug, das auf Anfragen reagiert — es ist ein System, das ein kontinuierliches Bild seiner Umgebung unterhält. Als Analogie für die Kanzlei formuliert er es so: Jedes Mandat mit seinen zugehörigen Dokumenten, Nachrichten, Recherchen und Workflows kann als eigenständige Welt betrachtet werden, innerhalb derer Teams von KI-Agenten operieren. Was das konkret bedeuten könnte — welche Frist an welchem Dokument hängt, welche Klausel in Vertrag A die Verhandlungsposition in Vertrag B beeinflusst — das bleibt vorerst Vision. Aber eine, die die Richtung klar benennt.

Was bedeutet das für die Kanzleistruktur?

Kanzleien sind tief hierarchisch strukturiert und nutzen Berichtsketten zwischen Associates und Partnern, um die knappe Ressource juristischer Expertise über komplexe Mandate zu verteilen. Die unteren Stufen dieser Hierarchie sind auf Durchsatz ausgerichtet. Wenn diese Aufgaben zunehmend an Agenten delegiert werden, ersetzt Intelligenz Hierarchie: Jeder Anwalt wird für sein Urteilsvermögen geschätzt, nicht für seinen Output — was Kanzleien dazu zwingt, Staffing, Ausbildung, Pricing und Mandatsstruktur neu zu denken.

Das klingt nach Silicon-Valley-Rhetorik. Aber der strukturelle Kern stimmt: Wer Arbeit nach Stunden abrechnet und Hierarchie nach Output-Stufen organisiert, bekommt ein fundamentales Pricing- und Governance-Problem, sobald Agenten Durchsatz von Kopfzahl entkoppeln. Erste Beispiele sind bereits sichtbar: Ashurst spart mit agentic Workflows Stunden bei der Erstellung von Lease Summaries, GSK Stockmann hat eigene Workflows gebaut, um Due-Diligence-Reviews zu beschleunigen. Wenn das zum Standard wird, ist Stundensatz-Billing kein stabiles Modell mehr.

Was bedeutet das für Legal Engineers?

Wer Legal-AI-Systeme baut oder betreut, bewegt sich gerade an einem Übergang: von Prompt Design zu Agent Design. Der Unterschied ist erheblich. Ein Prompt steuert eine einzelne Anfrage. Ein Agent operiert über Zeit, über mehrere Schritte, mit Zugriff auf externe Systeme — und mit einem gewissen Grad an Handlungsautonomie. Das stellt völlig andere Anforderungen: Wie begrenzt man Zugriff sauber? Wie macht man Entscheidungen auditierbar? Wo zieht man die Grenze zwischen autonomem Handeln und menschlicher Kontrolle? Wie verbindet man ihn mit bestehenden Systemen wie iManage oder DMS-Strukturen?

Pereyra benennt eine Dimension, die dabei oft unterschätzt wird: In-House-Teams werden nicht nur ihre eigene Arbeit transformieren müssen, sondern zunehmend als Governance-Instanz für den gesamten unternehmensweiten Einsatz von Agenten fungieren. Die Zunahme von KI-gestützter Produktivität führt direkt zu mehr Policy-Fragen, IP-Reviews und potenziellen Incidents.

Die evolvierende Rolle des Legal Engineers

Genau in diesem Spannungsfeld liegt die Rolle des Legal Engineers — und sie wird mit zunehmender Automatisierung wichtiger. Nicht als Konkurrenz zum AI Engineer oder Software Developer, sondern als Übersetzerin zwischen zwei Welten, die einander brauchen, aber selten dieselbe Sprache sprechen. Der Legal Engineer versteht, was Anwälte wirklich brauchen — und kann es so formulieren, dass Systeme es umsetzen können. Er erkennt, was Agenten im juristischen Kontext leisten dürfen und was nicht. Er gibt dem Techniker den juristischen Kontext — und dem Anwalt so viel technisches Verständnis, wie er braucht, um kluge Entscheidungen zu treffen. Je autonomer Systeme werden, desto strategisch wichtiger sind Menschen, die auf beiden Seiten gehört werden.

Einordnung

Harvey hat im März 2026 eine Bewertung von 11 Milliarden Dollar erreicht. Bei solchen Summen ist die Versuchung groß, transformative Narrative zu pflegen — und Spectre ist vorerst ein internes Tool, kein ausgerolltes Kanzleiprodukt. Gesunde Skepsis ist berechtigt.

Aber die strukturelle Logik dahinter ist unabhängig von Harvey valide. Pereyra bringt es auf den Punkt: Legal wird zu den am stärksten durch Agenten transformierten Branchen gehören — aber auch zu einer der Branchen, die den Maßstab setzen wird, dafür wie eine Gesellschaft mit autonomen Systemen umgeht, die zunehmend in sensible Entscheidungsprozesse eingreifen. Es geht nicht mehr nur darum, was KI leisten kann. Sondern darum, wer Verantwortung trägt, wie Vertrauen entsteht, und wie wir sicherstellen, dass das, was Agenten entscheiden, auch verantwortet werden kann — von Menschen, vor Institutionen, im Rechtsstaat.