Q: Was ist ein Production-AI-Agent?

Ein Production-AI-Agent erfüllt vier Schwellen: Er bedient echte Nutzer mit einem messbaren SLO, hat ein Cost-Limit mit klarem Owner, hat einen definierten Blast-Radius für Fehler und liefert ausreichend Telemetrie, um einen Ausfall um 3 Uhr nachts zu bemerken. Die meisten Demos erfüllen keine dieser vier.

Question 1

Was ist ein Production-AI-Agent?

Accepted Answer

Ein Production-AI-Agent erf&uuml;llt vier Schwellen: Er bedient echte Nutzer mit einem messbaren SLO, hat ein Cost-Limit mit klarem Owner, hat einen definierten Blast-Radius f&uuml;r Fehler und liefert ausreichend Telemetrie, um einen Ausfall um 3 Uhr nachts zu bemerken. Die meisten Demos erf&uuml;llen keine dieser vier.

Question 2

Was ist das Router-Planner-Executor-Muster?

Accepted Answer

Das Muster verteilt Agent-Arbeit auf drei Modell-Klassen: ein schneller Router (Haiku) klassifiziert die Anfrage, ein Planner (Sonnet) zerlegt sie in Schritte, und ein Executor f&uuml;hrt den Tool-Use-Loop aus. Vorteile: Kostenkontrolle (Routing auf Sonnet ist Geldverschwendung), Reliability (Fehlermodi sind isoliert), Observability (drei Grenzen zum Asserten).

Question 3

Was ist der Unterschied zwischen Human-in-the-Loop und Human-on-the-Loop?

Accepted Answer

Human-in-the-Loop (HITL): ein Mensch gibt vor jeder Agent-Aktion synchron frei. Geeignet f&uuml;r irreversible, regulierte oder volumenarme Workloads. Human-on-the-Loop (HOTL): der Agent handelt autonom, ein Mensch &uuml;berwacht asynchron via Dashboards und Stichproben. Geeignet f&uuml;r reversible, latenzkritische, volumenstarke Workloads. Production-Agenten migrieren typischerweise Aktion-f&uuml;r-Aktion von HITL zu HOTL.

Question 4

Sollte man einen AI-Agenten intern bauen oder einen Freelancer beauftragen?

Accepted Answer

Intern bauen, wenn ein gut umrissener Workflow vorliegt und zwei Engineers 6-10 Wochen Lernzeit haben. Freelancer f&uuml;r den ersten Agenten, wenn das Team keine LLM-Engineering-Erfahrung hat oder ein PoC in zwei Wochen ben&ouml;tigt wird. Bei compliance-lastigen Workflows (Finanzen, Healthcare, DSGVO) jemanden hiren, der bereits einen compliant Agenten produktiv ausgeliefert hat.

Question 5

Wie testet man einen AI-Agenten vor Production?

Accepted Answer

Vier Eval-Schichten: Golden Tasks (10-50 realistische Inputs mit erwartetem Verhalten), Snapshot-Assertions auf Output-Struktur und Tool-Call-Form, Cost-Budget-Assertions pro Task (f&auml;ngt stille Prompt-Drift), und Offline-Replay mit gemockten Tools. Zus&auml;tzlich w&ouml;chentliches Shadow-Review: ein Engineer pr&uuml;ft 20 zuf&auml;llige Production-Runs, um neue Muster zu finden.

Production-AI-Agent-Architektur-Playbook Production AI Agent Architecture Playbook

Playbook herunterladen Download the playbook

Ihr Playbook ist bereit Your playbook is ready

Was drin ist What's inside

Was "Production-Agent" wirklich bedeutet What "production agent" actually means

Router-Planner-Executor-MusterRouter-Planner-Executor pattern

State- und Memory-RegelnState and memory rules

Tool-Design, das Traffic überlebtTool design that survives traffic

Tests vor ProductionTesting before production

Monitoring und Cost-ControlMonitoring and cost control

Human-in-the-Loop vs. Human-on-the-LoopHuman-in-the-loop vs human-on-the-loop

Build vs. Hire EntscheidungsmatrixBuild vs hire decision matrix