Benchmark pensati per durare anni vengono saturati nell’arco di mesi. Quattro top model dentro 25 punti Elo, gap USA-Cina al 2,7%. In parallelo, tassi di errore fino al 42% e capacità frastagliate rimettono in discussione cosa significa oggi valutare un’AI

L’articolo I modelli di frontiera migliorano più in fretta dei benchmark che li misurano proviene da AI4Business.

Powered by WPeMatico

Di admin