Lab

Veröffentlichungen und Projekte online

Artikel, Repositories und Arbeitsnotizen, frei zugänglich.

InferenzkostenVeröffentlicht - 9. April 2026

Batch Inference

Warum Batch Inference die Kosten bei KI-Workloads ohne Echtzeitbedarf deutlich senken kann.

Der Hebel liegt oft zuerst in einer besseren Kostenarchitektur, nicht in einem größeren Modell.

Agentische WorkflowsVeröffentlicht - 27. Januar 2026

Claude-Book

Die aktuelle öffentliche Version von Claude-Book zeigt, wie ich mehrere Agenten, Zustände und mehrere Arbeitsdurchläufe um ein Schreibsystem herum orchestriere.

Wie man agentische Workflows entwirft, die über einen Wrapper oder einen linearen Chatbot hinausgehen.

RAG-VereinfachungVeröffentlicht - 29. März 2026

retrieval-arena

Ein Repository, um Retrieval-Ansätze zu vergleichen und zu zeigen, wann Embeddings wirklich Mehrwert bringen.

Weniger Komplexität im RAG-Stack verbessert oft Liefergeschwindigkeit, Wartbarkeit und Gesamtkosten.