MyDigitalMagazineMyDigitalMagazine
CERCA
Modelli open weight in azienda: quando il fine-tuning batte le API0%
RUBRICHE / AI

Modelli open weight in azienda: quando il fine-tuning batte le API

I pesi aperti hanno chiuso il divario sui benchmark che contano. Per molte aziende italiane la domanda non è più «quale API», ma se convenga portarsi il modello in casa. I conti, voce per voce.

FIRMAMarco FerraraLETTURA8 minPAROLE333PUBBLICATO11 GIU 2026AGGIORNATO12 GIU 2026

Per due anni la scelta è stata semplice: si paga l’API del fornitore più bravo e non si pensa all’infrastruttura. Poi i modelli a pesi aperti hanno chiuso il divario sui benchmark che contano davvero — ragionamento, codice, lingue diverse dall’inglese — e la domanda è tornata sul tavolo dei CTO: conviene ancora pagare a consumo, o è il momento di portarsi il modello in casa?

§ 01Il costo per token non è tutto

Il confronto ingenuo guarda solo il prezzo per milione di token. Quello onesto mette in conto le GPU (comprate o noleggiate), l’energia, le persone che tengono in piedi l’inferenza e, dall’altra parte, gli sconti volume che i fornitori di API concedono a chi firma contratti annuali. Sotto una certa soglia di traffico l’API vince sempre; sopra, la curva si inverte prima di quanto si creda.

C’è poi la voce che nei fogli di calcolo non compare: i dati. Per una banca o una ASL, la differenza tra inviare documenti a un endpoint esterno e tenerli su macchine proprie non è un costo, è un vincolo normativo. In questi casi il fine-tuning di un modello aperto non è l’alternativa economica: è l’unica strada percorribile.

§ 02Cosa serve davvero per partire

L’errore più comune è dimensionare il progetto sul modello più grande disponibile. Nella pratica, un modello medio raffinato sui propri dati batte quasi sempre un gigante generalista sul compito specifico — e gira su hardware che un’azienda media può permettersi. La ricetta che vediamo funzionare: partire da un task chiuso e misurabile, costruire il dataset di valutazione prima del fine-tuning, e confrontare contro l’API migliore, non contro il proprio entusiasmo.

Il rischio vero non è tecnico ma organizzativo: il modello in casa invecchia, e senza un piano di aggiornamento ci si ritrova in dodici mesi con un sistema peggiore dell’API che si era abbandonato. Chi parte oggi deve mettere a budget la seconda iterazione, non solo la prima.

MF

Marco Ferrara

AI · 1 DOSSIER

Segue modelli, agenti e l’industria dell’intelligenza artificiale, coi piedi nei datacenter. (Firma di prova — eliminare prima del lancio.)

Commenti

0 — i migliori in evidenza

I commenti sono riservati ai lettori registrati. La discussione è moderata dalla redazione.

Nella stessa rubrica

AI