RAG-System-Anforderungstemplate RAG System Requirements Template

Fünf Pflichtfelder, alles andere mit produktionsreifen Defaults. Füllen Sie nur das aus, wozu Sie eine klare Meinung haben — und exportieren Sie eine Markdown-Spec, die als Brief an Engineering oder einen Freelancer geht. Keine E-Mail, keine Anmeldung. Five required fields, everything else has production-ready defaults. Fill in only what you have a strong opinion on — and export a markdown spec that hands off to engineering or a freelancer. No email, no signup.

Begleitender Build-Guide: RAG-Pipeline-Tutorial mit Qdrant und Claude (Englisch) Companion build guide: RAG Pipeline Tutorial with Qdrant and Claude

Most RAG projects fail not because vector search is hard but because nobody wrote down what “good retrieval” means for this specific corpus, this specific user, this specific question. This template walks you through the seven decisions that actually matter, and exports a markdown spec you can hand to a team or use as the brief for a freelancer.

Companion content: RAG Pipeline Tutorial with Qdrant and Claude, Qdrant vs Pinecone vs Weaviate, Production AI Agent Architecture.

ErforderlichRequiredDie 5 PflichtfelderThe 5 required fields

Pre-Filter bei Vektorsuche ist Default. Post-Filter leakt Chunk-Existenz via Timing.Default enforcement is pre-filter at vector search. Post-filter leaks chunk existence via timing.
Treibt Chunk-Strategie, Vector-DB-Wahl und Retrieval-Defaults unten.Drives chunking, vector DB choice, and retrieval defaults below.
Optional: AdvancedOptional: Advanced — Alle Felder unten haben produktionsreife Defaults. Nur anpassen, wenn Sie eine klare Meinung haben. — All fields below have production-ready defaults. Adjust only if you have a strong opinion.

Quellen-DetailsSource details

ACL-DurchsetzungACL enforcement

Pre-Filter ist am sichersten. Post-Filter leakt Chunk-Existenz via Timing. Prompt-Vertrauen setzt nie etwas durch.Pre-filter is safest. Post-filter leaks chunk existence via timing. Prompt-trust never enforces anything.

Chunking

Embedding & IndexEmbedding & index

Retrieval & RerankingRetrieval & reranking

Citation-FormatCitation format

Wird mit der gewählten Citation-Anforderung kombiniert.Combined with the citation requirement chosen above.

Fallback-VerhaltenFallback behavior

Evaluation & SLOsEvaluation & SLOs

Top-k enthält den richtigen Chunk.Top-k contains the right chunk.
Antworten in Chunks verankert.Answers grounded in retrieved chunks.

Monitoring & OpsMonitoring & ops

Generierte SpecGenerated spec

RAG-Implementierung in 3 WochenRAG implementation in 3 weeks

Sie haben die Spec. Wenn Sie wollen, dass ich sie baue — Qdrant, Hybrid-Retrieval, Reranker, Citations, Evals, Monitoring — ich scope in 24 Stunden und liefere in 3 Wochen. You have the spec. If you want me to build it — Qdrant, hybrid retrieval, reranker, citations, evals, monitoring — I scope it in 24 hours and ship in 3 weeks.

Mein Konzept anfragen Request my scope

Wie dieses Template zu nutzen istHow to use this template

Jeden Abschnitt öffnen. Was bekannt ist, ausfüllen. Was nicht bekannt ist, weglassen — der Export behält Platzhalter-Text, sodass es ein Arbeitsentwurf bleibt. Einmal ausgefüllt, ist das Markdown ein Briefing, das an Engineering, an einen Freelancer oder an das bauende Team geht. Open each section. Fill what you know. Skip what you do not — the export keeps placeholder text so it stays a working draft. Once it is filled in, the markdown is a working brief you can hand to engineering, to a freelancer, or to the team that is about to build this.

  • Die sieben Entscheidungen, die das Ergebnis entscheiden: Quellen, ACL, Chunking, Retrieval, Citations, Fallback, Evals. Eine davon zu überspringen ist der häufigste Grund, warum RAG-Projekte ausgeliefert werden und dann still scheitern.The seven decisions that decide outcome: sources, ACL, chunking, retrieval, citations, fallback, evals. Skipping any one of these is the most common reason RAG projects ship and then quietly fail.
  • ACL ist der stille Killer. Der billigste Fehler ist "wir filtern Ergebnisse nach dem Retrieval". Das leakt Chunk-Existenz über Timing und über Reranker-Scores. Pre-Filter bei Vektorsuche oder per-Tenant-Indizes.ACL is the silent killer. The cheapest mistake is "we will filter results after retrieval." That leaks chunk existence through timing and through reranker scores. Pre-filter at vector search, or run per-tenant indexes.
  • Evals sind nicht optional. 20-50 reale Nutzerfragen, separat bewertet für Retrieval-Recall und Antwort-Treue. Releases an Zahlen messen, nicht am Bauchgefühl.Evals are not optional. 20-50 real-user questions, scored on retrieval recall and answer faithfulness separately. Gate releases on the numbers, not on developer judgment.
  • Fallback ist Teil der Spec. Wenn "ich weiß es nicht" keine geschriebene Antwort ist, füllt das LLM die Lücke mit selbstbewusster Erfindung.Fallback is part of the spec. If "I do not know" is not a written response, the LLM will fill the gap with confident invention.
In Zwischenablage kopiertCopied to clipboard