Lab

Publicaciones y proyectos en línea

Artículos, repositorios y notas de trabajo, de acceso abierto.

Coste de inferenciaPublicado - 9 de abril de 2026

Batch Inference

Por qué el batch inference puede reducir de forma notable los costes de las cargas de IA que no necesitan tiempo real.

A menudo el valor viene antes de una mejor arquitectura de costes que de un modelo más grande.

Workflows con agentesPublicado - 27 de enero de 2026

Claude-Book

La versión pública actual de Claude-Book muestra cómo orquesto varios agentes, estados y varias pasadas de trabajo alrededor de un sistema de escritura.

Cómo diseñar workflows con agentes más ricos que un wrapper o un chatbot lineal.

Simplificación de RAGPublicado - 29 de marzo de 2026

retrieval-arena

Un repositorio para comparar enfoques de retrieval y ver cuándo los embeddings aportan valor de verdad.

Reducir la complejidad de un stack RAG suele mejorar el plazo de entrega, el mantenimiento y el coste total.