Y ojo con el deep research de Gemini con el 2.5, me ha hecho un informe de 25 páginas con 90 referencias.
Están cerca de sacar el 5? Menuda competencia hay, pero es verdad que como google tome la delantera tiene capacidad para comerse un buen trozo del pastel.
No he visto ningún rumor de que Anthropic vaya a sacar modelos nuevos. El Sonnet 3.7 es reciente. Han hecho cosas como los servidores MCP que permiten usar programas externos como herramientas, por ejemplo desde su app en Windows o Mac, el razonamiento dentro de los modelos que tienen, y han sacado un research preview de una cosa que ayuda a programar, donde se ve que uno puede definir sus propios comandos. Creo que va a través de la API. Tienen también a través de pago por uso una de estas cosas de agentes y que la IA pueda operar por su cuenta como la que tiene OpenAI, pero no está en la suscripción.
Anthropic es una compañía que se preocupa mucho de las seguridad y de que sus modelos no digan nada que sea poco ético. Eso les ayuda a conseguir contratos como el del gobierno de Inglaterra para los funcionarios. Por otra parte, me pregunto si estarán pasando tiempo en optimizar para gasto de energía, y si los precios tan altos que tienen por token serán causados por esto.
Una de las gracias de los modelos de Deepseek, era que decían que usaban menos energía para inferencia y para entrenamiento que otros modelos. También creo que el Deepseek v3 corre sobre sobre hardware de Nvidia, pero se ve que tienen una versión que corre en hardware de Huawei (!). Huawei tiene sus propias tarjetas de aceleración de IA, y su stack de software distinto del de Nvidia. Dadas las restricciones a la importación de productos de IA a China, esto me parece que va a ser una ventaja competitiva de Deepseek.
Vi una entrevista de Huang de Nvidia, donde decía que pasaban mucho tiempo optimizando el uso de energía de su hardware. De hecho tienen tarjetas de estación de trabajo como las A4000 que sólo usa 70 vatios (!), comparado con unos 350 de una RTX 3090. Por una parte esto está bien, porque la implicación es que los clientes corporativos de Nvidia se beneficiarían de este ahorro, pero por otra parte, si ellos no optimizan, el mercado chino más competitivo, la ayuda de su gobierno y su propio hardware, podrían hacer que compañías como Anthropic que no tienen su propio hardware se encuentren en desventaja. Por otra parte, esto pondría a Google en una situación muy ventajosa.
Desde un punto de vista práctico, ahora Sonnet a través de la API es muy caro, comparado con cualquier forma de Deepseek, que funciona realmente bien. Aunque vaya un poco peor, la gente no lo va a usar pagando por token, si pueden usar los modelos de Deepseek o de Google, que está bien de precio también.
En Venice mismo ahora puedes usar casi todo el r1 completo que quieras desde el interfaz de la web con suscripción, y si tienes tokens staked en cantidad, tienes inferencia buena casi ilimitada sin pagar, lo cual es felizmente mi caso. Está la depreciación brutal del token, pero uno vive en la esperanza y eso.