Lab

Pubblicazioni e progetti online

Articoli, repository e note di lavoro, in accesso libero.

Costo d'inferenzaPubblicato - 9 aprile 2026

Batch Inference

Perché il batch inference può ridurre nettamente i costi dei carichi IA che non richiedono tempo reale.

Spesso il valore arriva prima da una buona architettura dei costi che da un modello più grande.

Workflow agenticiPubblicato - 27 gennaio 2026

Claude-Book

La versione pubblica attuale di Claude-Book mostra come vengono orchestrati più agenti, stati e più passaggi di lavoro attorno a un sistema di scrittura.

Come progettare workflow agentici più ricchi di un wrapper o di un chatbot lineare.

Semplificazione RAGPubblicato - 29 marzo 2026

retrieval-arena

Un repository per confrontare approcci di retrieval e capire quando gli embeddings aggiungono davvero valore.

Ridurre la complessità di uno stack RAG migliora spesso tempi di consegna, manutenzione e costo totale.