Lab

Veröffentlichungen und Projekte online

Artikel, Repositories und Arbeitsnotizen, frei zugänglich.

InferenzkostenVeröffentlicht - 9. April 2026

Batch Inference

Warum Batch Inference die Kosten bei KI-Workloads ohne Echtzeitbedarf deutlich senken kann.

Der Hebel liegt oft zuerst in einer besseren Kostenarchitektur, nicht in einem größeren Modell.

Artikel lesen Unternehmen

Agentische WorkflowsVeröffentlicht - 27. Januar 2026

Claude-Book

Die aktuelle öffentliche Version von Claude-Book zeigt, wie ich mehrere Agenten, Zustände und mehrere Arbeitsdurchläufe um ein Schreibsystem herum orchestriere.

Wie man agentische Workflows entwirft, die über einen Wrapper oder einen linearen Chatbot hinausgehen.

Artikel lesen Repo ansehen Unternehmen

RAG-VereinfachungVeröffentlicht - 29. März 2026

retrieval-arena

Ein Repository, um Retrieval-Ansätze zu vergleichen und zu zeigen, wann Embeddings wirklich Mehrwert bringen.

Weniger Komplexität im RAG-Stack verbessert oft Liefergeschwindigkeit, Wartbarkeit und Gesamtkosten.

Artikel lesen Repo ansehen Unternehmen