Project digits
Estaba viendo la presentación de Jensen Huang en el CES de Las Vegas. Anuncia una variedad de productos interesantes, entre ellos, las tarjetas gráficas nuevas, y una tecnología para agentes de IA que no parecía mal. Lo que me ha parecido más interesante, es que han anunciado un ordenador de IA de sobremesa que tiene el tamaño de un Mac mini más o menos. Sale en mayo por $3.000.
Lo llaman project Digits, y es una caja con un chip de IA de Nvidia de la arquitectura Blackwell, y 128 GB de memoria unificada como en los Macs modernos. Está unido a una CPU con arquitectura ARM, y corre Linux. Se puede usar directamente como estación de trabajo, con una distro de Linux de Nvidia. En Reddit hay un rumor de que es su fork de Ubuntu. En una entrevista para Bloomberg, decía Huang que se puede usar directamente, o desde otro ordenador, como si fuera un servidor de IA en la nube, por ejemplo conectado de forma inalámbrica.
La info de este aparato en la web de Nvidia, dice que puede correr modelos de 200b parámetros (supongo que será q4) y si se unen dos, pues de 405b, que es justo el tamaño del modelo grande de Llama 3.1. Me pregunto si este nuevo ordenador se comerá parte del mercado de estaciones de trabajo más asequibles de IA, como por ejemplo las de Tinybox, que usa su propio stack de software de IA y usa GPUS tanto de Nvidia como de AMD. (precios desde $15.000 a $40.000) Las estaciones de trabajo de Tinygrad, dan de 738teraflops a 1,36 petaflops fp16, mientras que el ordenador de project digits da 1 petaflot, pero es de fp4.
Serie GTX 5000
Las tarjetas nuevas de gráficos tienen una VRAM máxima de 32 Gb (la 5090), y están basadas en la arquitectura Blackwell. Dicen que son mucho más rápidas que las de arquitectura Ada.
Desde el punto de vista de IA local, no me ha impresionado, porque no tiene mucha memoria para correr modelos locales. Se ve que usan IA para el pixel shader, con lo cual la IA decide qué pixels mostrar, y eso lleva a un ahorro de energía. Me ha llamado la atención esto, porque en algún otro vídeo Huang decía que optimizaban para costo, incluido el energético, en cada parte del proceso. Las alternativas de AMD actuales se ve que usan mucha energía para la potencia que dan. Por cierto, la CEO de AMD es la prima de Huang. (!)
Tienen más sentido para videojuegos que para IA local. Supongo que el mercado de IA local será muy limitado, y por eso han preferido sacar el Project Digits que tarjetas con mucha VRAM que compitan con las que sacan para servidores.
Nvidia project Digits
Tinybox ordenadores para IA