// TRAGUARDI.LOG / 17 MAGGIO 2026
◈ TECNICO

Infrastruttura Fondante

Stack cloud + on-prem completo costruito da zero in un solo sprint.

In un singolo sprint abbiamo provisionato lo stack produttivo completo di Intellixer: infrastruttura Google Cloud via Terraform (GCE VM, Cloud SQL Postgres, Secret Manager, backup GCS, cifratura KMS), un gateway API LiteLLM con tracciamento utilizzo su Postgres, pipeline di anonimizzazione PII con Presidio, e il nodo di inferenza on-prem Mac Mini M4 con MLX tramite uno shim FastAPI personalizzato dietro Caddy TLS.

Architettura

Client → api.intellixer.farm (GCE, LiteLLM) → dc1.webhop.me (Caddy/Mac M4) → mlx_lm

Hardware

Mac Mini M4 (16 GB Unified Memory) esegue modelli quantizzati da 3 miliardi di parametri a oltre 30 token al secondo sull'Apple Neural Engine — a una frazione del costo del cloud GPU.