Moonshot AI ha rilasciato Kimi K2.6, aggiornamento del suo modello open source con architettura MoE (Mixture of Experts): mille miliardi di parametri totali, 32 miliardi attivi per token. I pesi sono disponibili su Hugging Face sotto licenza MIT modificata.
Il principale obiettivo dichiarato di questo rilascio è la tenuta su compiti di coding prolungati, quelli in cui il modello deve mantenere coerenza su sessioni di ore, con centinaia di chiamate agli strumenti e numerose iterazioni. Moonshot AI documenta due casi interni: l’ottimizzazione dell’inferenza di un modello Qwen su Mac in Zig, un linguaggio di programmazione di nicchia, e il refactoring di un motore finanziario open source da otto anni su oltre 4.000 righe di codice. In entrambi i casi, secondo lo sviluppatore, i risultati sono stati raggiunti senza intervento umano in sessioni di oltre 12 ore.
// affiliato ▸ Steady · La tua newsletter, indipendente ed europea · Inizia gratis →
Benchmark e confronti
I risultati pubblicati da Moonshot AI mostrano K2.6 in linea con i modelli closed source di punta su diverse misure di coding agentivo: su SWE-Bench Verified raggiunge prestazioni paragonabili a Claude Opus 4.6, mentre su HLE con strumenti risulta al primo posto tra i modelli nel confronto interno. I benchmark sono in buona parte condotti o commissionati da Moonshot AI stessa, il che vale la solita riserva.
Agenti e novità sperimentali
Rispetto al predecessore K2.5, K2.6 amplia la capacità di coordinamento agentivo: da 100 a 300 agenti specializzati in parallelo, e da 1.500 a 4.000 passi coordinati. In anteprima di ricerca è presente “Claw Groups”, che permette di integrare agenti eterogenei, su dispositivi e modelli diversi, in un flusso coordinato da K2.6.
Il modello è accessibile su Kimi.com, tramite API su platform.kimi.ai e via Ollama per uso locale.


Mastodon
Telegram
Bluesky
Lascia un commento