Wie du ein CEO-Office aus KI-Agenten aufbaust

Intro

KI-Agenten sind das dominierende Thema 2026 — aber wie bringt man sie wirklich in Produktion? Jonas Dietzuhn, Gründer und CEO von BEAM, einer KI-Agenten-Plattform für selbstlernende Unternehmensprozesse, teilt in dieser Episode radikale Einblicke aus drei Jahren an der Front der Agent-Revolution. Von seinem digitalen CEO-Office mit 60 bis 80 virtuellen Beratern über Context Engineering als neue Kernkompetenz bis zur Überzeugung, dass BEAM „die letzte Firma ist, die wir bauen müssen" — ein Deep Dive in die Gegenwart und Zukunft autonomer Arbeit mit messbarem Business Impact.

Inhaltsübersicht

Die Gründungsstory von BEAM: Warum 2022 der richtige Zeitpunkt war, auf Agents zu setzen
Wo stehen AI Agents heute: Fähigkeiten, Grenzen und der Sprung zur Produktionsreife
Selbstlernende Systeme: Wie Agents durch Feedback-Loops kontinuierlich besser werden
Jonas' CEO-Office: Ein praktisches Beispiel für orchestrierte Agent-Systeme im Alltag
Context Engineering statt Prompt Engineering: Die neue Kernkompetenz für Agent-Systeme
Was erfolgreiche Agent-Implementierungen von gescheiterten Pilotprojekten unterscheidet
Wie BEAM intern arbeitet: Agents in jedem Workflow vom Meeting bis zum Marketing
Die neue Organisationsstruktur: System-Architekten statt Executors
Ausblick 2026: Von Demos zu messbarem Business Impact

Über den Gast

Jonas Dietzuhn ist Gründer und CEO von BEAM, einer Enterprise-Plattform für selbstlernende KI-Agenten. Bereits 2015/16 sammelte er bei Konux erste Erfahrungen mit Neural Networks und Predictive Analytics. 2022 gründete er BEAM mit der visionären These, dass KI-Agenten „die letzte Firma sind, die man bauen muss" — weil sie wiederum alles andere bauen können. Heute nutzt Jonas persönlich ein ausgeklügeltes CEO-Office-System mit 60 bis 80 virtuellen Persona-Agenten, die ihn bei allem von Meeting-Follow-ups über Präsentationserstellung bis zu strategischem Feedback unterstützen. BEAM arbeitet mit Enterprise-Kunden an hochkomplexen, regulierten Prozessen mit bis zu 60 Schritten und erreicht dabei eine Genauigkeit von 99,5 Prozent.

Detaillierte Zusammenfassung

Die Gründungsthese: „Die letzte Firma, die wir bauen"

Jonas und sein Team gründeten BEAM 2022 mit einer radikalen Überzeugung: Wenn sich KI exponentiell entwickelt und irgendwann alles kann, was Menschen können, dann ist eine Agent-Plattform das ultimative Meta-Produkt. „Mit dem, was man dann darauf aufbauen kann, kann man wiederum alles andere bauen", erklärt Jonas seine damalige Hypothese.

Die frühen Experimente mit GPT-3 waren vielversprechend, aber nicht produktionsreif. Investoren im Silicon Valley rieten zu Geduld: Das dauere noch zwei bis fünf Jahre. Der Durchbruch kam schneller als erwartet. Heute ist Jonas noch überzeugter von der These: Er nutzt KI nicht nur, um sich selbst zu replizieren, sondern um eine verbesserte Version von sich zu bauen — inklusive virtueller Beiräte wie Frank Slootman, die ihm nach jedem Podcast-Interview schonungsloses Feedback geben.

Das Team hat sich systematisch weiterentwickelt: Vom ersten Experimentieren mit Sprachmodellen über die Entwicklung einer eigenen Plattform bis hin zu Enterprise-Kunden mit hochkomplexen Prozessen. BEAM setzt dabei auf einen Ansatz, der Agents nicht als isolierte Chatbots betrachtet, sondern als orchestrierte Systeme, die wie echte Organisationen funktionieren.

Der aktuelle State of AI Agents: Technisch keine Grenzen mehr

Jonas ist direkt: „Technisch gibt es keine Grenzen mehr." Mit dem richtigen Setup — saubere Daten, Systemzugriff, dokumentierte Prozesse — können Agents in vier Stunden produktionsreif gebaut werden. BEAM hat Use Cases mit 60 Schritten in Produktion, die LLM-Calls mit Code Execution kombinieren und komplexe, regulierte Prozesse zu 99,5 Prozent korrekt ausführen.

Die wahren Bottlenecks liegen woanders. Erstens: Systeme und Datenzugriff — fehlende APIs, unstrukturierte Daten, fragmentierte Informationssilos. Zweitens: Prozesswissen — Unternehmen sind nicht „AI-ready", kritisches Wissen steckt in Köpfen oder ist nicht dokumentiert. Drittens: Organisatorische Trägheit — fehlender Drive, mangelndes Change Management, unrealistische Erwartungen an Perfektion.

Der Anspruch an AI-Agents ist deutlich höher als bei Menschen. Wir hatten Cases, wo uns gesagt wurde, der Agent macht die Aufgabe nicht so gut — und dann stellten wir fest, dass die Menschen einfach noch viel schlechter waren.

Kunden beschweren sich über Agent-Fehler, während sie nie die Fehlerquote ihrer menschlichen Mitarbeiter messen. In mehreren Cases stellte BEAM fest, dass ihre Agents besser performten als die Menschen, die sie ersetzten. Das Bottleneck ist nicht die Technologie, sondern das Prozesswissen, die Menschen, die sich nicht ändern wollen, und Systeme, zu denen der Zugang fehlt.

Selbstlernende Systeme: Die nächste Evolution

Ein Schlüsselthema der Episode ist die Frage, wie Agents kontinuierlich dazulernen. Jonas beschreibt mehrere Feedback-Mechanismen: Bei der Selbst-Evaluation führt eine AI eine Aufgabe aus, während eine zweite den Output bewertet — laut einem OpenAI-Paper können so 80 Prozent der Fehler korrigiert werden. Beim Multi-Persona-Feedback geben verschiedene virtuelle Experten unterschiedliche Perspektiven. Bei der externen Validierung fließen Differenzen zwischen Agent-Output und menschlichen Korrekturen, etwa in ERP-Systemen, zurück ins System. Und bei der Graph-Optimierung kann das System bei 50 von 1.000 Cases, die nicht passen, selbst vorschlagen, neue Routen oder Systemzugriffe zu ergänzen.

Jonas' zentrale Erkenntnis: „Das ist ein Produktthema, kein KI-Thema. Die Modelle müssen nicht besser werden — wir brauchen Produkte um die Modelle herum, die diesen Feedback-Loop möglich machen." Die Intelligenz liegt nicht im einzelnen Modell, sondern im System, das drumherum gebaut wird.

Das CEO-Office: 60 bis 80 virtuelle Berater im Einsatz

Jonas hat sich ein beeindruckendes persönliches Agent-System gebaut. Die Architektur besteht aus einem Orchestrator als zentrale Intelligenz mit Zugriff auf alle Tools — Gmail, Notion, Präsentationen und mehr. Darunter arbeiten 60 bis 80 Sub-Agents für spezialisierte Aufgaben wie Meeting-Follow-ups, Social-Media-Content und Präsentationserstellung. Zusätzlich nutzt er virtuelle Personas — darunter Frank Slootman, Keith Rabois, Investoren und sogar einen Hyrox-Coach Hunter McIntyre — für Feedback und iterative Verbesserung.

Ein konkreter Workflow: Nach einem Meeting wird das Transkript an den Orchestrator übergeben. Der Agent entscheidet, für welche Projekte das Gespräch relevant ist. Dann erfolgt die automatische Verteilung an Projektdateien, die LinkedIn-Content-Pipeline und das Follow-up-System. Im Anschluss bewerten virtuelle Beiräte die Performance — bis hin zu schonungslosem Feedback wie „Jonas, das war ein langweiliges Interview."

Das Besondere: Jonas baut nicht nur nach, was er tut, sondern eine bessere Version von sich selbst. „Ich nutze AI, um mich zu enhancen — und das macht mich selber wieder besser." Gebaut wurde das System fast vollständig mit Cursor und Claude Code — Jonas schätzt, dass er von 10.000 Zeilen Code vielleicht drei selbst geschrieben hat.

Context Engineering: Die neue Kernkompetenz

Ein zentraler Paradigmenwechsel: „Wir sind von Prompt Engineering zu Context Engineering gekommen." In Multi-Step-Agent-Prozessen ist es entscheidend, dass jeder Schritt die richtigen Informationen hat — nicht zu wenig, aber auch nicht zu viel, sonst explodieren die Kosten.

Ein konkretes Beispiel verdeutlicht das: Bei einem Kunden hätte ein naiver Ansatz — ein 30-seitiges PDF plus Jira-Ticket plus weitere Daten in jedem Schritt — zu Kosten von 23 Euro pro Execution geführt. Durch intelligentes Context Management sanken die Kosten auf zwei bis drei Euro. BEAMs Agent-Plattform managed den Context-Flow automatisch: welche Informationen wann aus SharePoint, ERP oder Jira gezogen werden, wie sie zwischen Schritten übergeben werden und wann validiert wird.

Was erfolgreiche Kunden anders machen

Jonas beschreibt klare Muster bei erfolgreichen Agent-Implementierungen: klar definierte, gut dokumentierte Prozesse — oft outgesourcte BPO-Arbeit mit 600 und mehr Mitarbeitern. Messbarer Business Value in Euro-Einsparung oder konkreten Verbesserungen wie 60 Prozent kürzere Time-to-Hire. Dazu echtes Commitment und Drive im Unternehmen sowie die Bereitschaft, Prozesswissen zu teilen und Edge Cases zu dokumentieren.

Gescheiterte Piloten dagegen zeichnen sich durch ambivalente Use Cases ohne klaren Value aus. „Wäre cool, einen Agent namens Karl zu haben" — aber kein echter Business Impact dahinter. Unrealistische Erwartungen an Perfektion und fehlender organisatorischer Drive führen dazu, dass Projekte in Gremien sterben. Wenn drei Stunden Einsparung niemanden interessieren, hat das Projekt keine Zukunft.

Ich nutze AI, um mich zu enhancen — und das macht mich selber wieder besser.

Die Time-to-Value hat sich dramatisch verbessert: von sechs Monaten für den ersten Agent auf zwei Wochen für komplexe Cases oder zwei Tage für einfache Cases. Ziel für 2026: noch schneller.

Wie BEAM intern arbeitet und die neue Organisationsstruktur

Bei BEAM ist KI in jeden Workflow integriert. Meeting-Transkripte werden zu automatischen Action Items, die als Linear-Tickets priorisiert nach kritischem Pfad landen. Kundenanforderungen aus Calls werden zu Feature-Flags, SLA-Tracking und automatischem Reporting im nächsten Meeting. Marketing und Produkt haben eigene Operating Systems mit Sub-Agents für Content Creation, Review und Distribution.

Jonas' Reaktion, wenn etwas manuell gemacht wird: „Allergisch. Alles kann transkribiert werden, alles kann Teil eines Projektes sein, alles kann in Markdown-Files fließen."

Die neue Organisationsstruktur spiegelt diesen Wandel wider: BEAM stellt Sales-Mitarbeiter ein, die weiterhin Menschen sind — technisch versiert und value-driven. Solution Engineers haben sich von Prompt Engineering und Coding zu Prozessdenkern und Beratern entwickelt. Auch im HR- und Marketing-Team werden System-Architekten gesucht statt reiner Executors. „Eigentlich baust du am Ende Organisationen nach, wie Organisationen aufgebaut sind: verschiedene Leute, die einen Teamleiter haben, die wieder einen Gruppenleiter haben. Nur dass es Agents sind."

Die Vision: Mit 25 bis 50 Mitarbeitern auf 100 Millionen ARR — Jonas hält das für realistisch.

Kernaussagen

Die letzte Firma, die wir bauen — „Das ist eigentlich die letzte Firma, die wir bauen. Vielleicht machen wir danach nochmal irgendwas anderes, aber zumindest können wir das, was wir jetzt bauen, dann auch nutzen, um alles, was wir in Zukunft bauen wollen, zu bauen." Meta-Produkt, Agent-Plattform
Nicht die Tech ist das Bottleneck — „Das Bottleneck ist nicht die Tech, sondern das Bottleneck ist Prozesswissen. Das sind die Leute, die sich nicht ändern wollen. Das sind Systeme und Informationen, die man nicht hat." Prozesswissen, Change Management
Höherer Anspruch an Agents als an Menschen — „Der Anspruch an AI-Agents ist deutlich höher als bei Menschen. Wir hatten Cases, wo uns gesagt wurde, der Agent macht die Aufgabe nicht so gut — und dann stellten wir fest, dass die Menschen einfach noch viel schlechter waren." Benchmark, Fehlerquote
Von Prompt Engineering zu Context Engineering — „Wir sind von Prompt Engineering zu Context Engineering gekommen. Das Wichtigste ist, dass ich in meiner Chain die richtigen Informationen zum richtigen Zeitpunkt habe — und auch nicht zu viele." Context Management, Kostenoptimierung
AI als Enhancement, nicht nur Replikation — „Ich baue nicht nur das nach, was ich mache, sondern ich nutze AI sehr viel, um mich zu enhancen und eine bessere Version von mir selbst zu bauen. Das macht mich selber wieder besser." CEO-Office, virtuelle Personas

Fazit und Takeaways

Für Unternehmen, die Agents einsetzen wollen

Mit klarem Business Value starten: Definiere messbare Outcomes — Euro-Einsparung, Zeitersparnis, Qualitätsverbesserung. Ambivalente Use Cases ohne klaren Impact scheitern.
AI-Readiness prüfen: Sind Prozesse dokumentiert? Sind Daten zugänglich? Gibt es APIs zu relevanten Systemen? Ohne diese Grundlagen bleibt jeder Agent ein Pilotprojekt.
Erwartungen kalibrieren: Agents müssen nicht perfekter sein als Menschen — nur besser als der Status quo. Die Fehlerquote der menschlichen Mitarbeiter als Benchmark nehmen.
In Systemen denken: Nicht einzelne Agents bauen, sondern orchestrierte Systeme mit Feedback-Loops, die sich selbst verbessern.
Einfach anfangen: Die wertvollsten Use Cases sind oft nicht die aufregendsten — gut dokumentierte, repetitive Prozesse funktionieren am besten.

Für Führungskräfte und Teams

Persönliches Agent-System aufbauen: Mit dem eigenen CEO-Office beginnen — Meeting-Follow-ups, Feedback-Loops und Content-Erstellung automatisieren, um den Mehrwert selbst zu erleben.
Neue Skills entwickeln: System-Architektur und Orchestrierung werden wichtiger als reine Execution. Die Rolle verschiebt sich vom Macher zum Architekten.
Coding-Agents nutzen: Mit Cursor und Claude Code kann heute jeder komplexe Systeme bauen — auch ohne tiefe Programmierkenntnisse.
Feedback-Kultur etablieren: Virtuelle Personas können ehrlicheres Feedback geben als ein auf Zustimmung getrimmter Chatbot.

Strategische Einsichten für 2026

Impact statt Demos: Die Experimentierphase ist vorbei. 2026 zählt nur noch: Wie hat das die Bottomline verändert? Wie hat das die Kundenzufriedenheit verbessert?
Context Engineering als Differenzierungsfaktor: Wie Informationen durch Agent-Systeme fließen, ist wichtiger als das perfekte Prompt. Intelligentes Context Management kann Kosten um den Faktor zehn senken.
Plattformen schlagen Punktlösungen: Die Komplexität von Context Management, Feedback-Loops und Multi-Agent-Orchestrierung erfordert robuste Infrastruktur.
Kleinere, effizientere Teams: Die Vision von 25 bis 50 Personen für 100 Millionen ARR ist realistisch — wenn das Team in Systemen statt in Tasks denkt.

Die zentrale Botschaft dieser Episode: AI Agents sind produktionsreif. Der Erfolg hängt nicht von besseren Modellen ab, sondern von besseren Produkten, dokumentierten Prozessen und organisatorischem Commitment. 2026 wird zeigen, wer den Sprung von Piloten zu echtem Business Impact schafft.