KI wird zur Infrastruktur, genau wie ElektrizitätIch programmiere KI-Tools, die Ihnen Zeit sparen

Thomas — Banker building AI products

CodeCrafter Logo

Einige meiner Veröffentlichungen online

Lab ansehen

Inferenzkosten

Batch Inference

Warum Batch Inference die Kosten bei KI-Workloads ohne Echtzeitbedarf deutlich senken kann.

Der Hebel liegt oft zuerst in einer besseren Kostenarchitektur, nicht in einem größeren Modell.

Agentische Workflows

Claude-Book

Die aktuelle öffentliche Version von Claude-Book zeigt, wie ich mehrere Agenten, Zustände und mehrere Arbeitsdurchläufe um ein Schreibsystem herum orchestriere.

Wie man agentische Workflows entwirft, die über einen Wrapper oder einen linearen Chatbot hinausgehen.