Inteligencia Artificial Hermes Agent

ottiatio

Shurmano Logia
Nº Ranking
76
Shurmano Nº
7056
Desde
22 Feb 2024
Mensajes
6,887
Reacciones
136,631
1773113122981.webp


Si os gusta la tecnología, quizás hayáis seguido la historia de OpenClaw. OpenClaw es un agente con IA que hace cosas de forma independiente para ti. Hay muchas variantes del mismo tema, y hay muchos otros "claws", que son programas similares. El que os traigo hoy, es el de Nous Research, un grupo indie de inteligencia artificial, y los que hicieron los modelos que llevan su nombre, y pueden usar herramientas.

El instalarlo, cuesta muy poco, sólo es un comando, y ya está instalado. Funciona dentro del terminal, y tiene un tema muy agradable. Puede usar vuestra propia IA local, corriendo por ejemplo en ollama, si tenéis una GPU presentable, y también corre en IAs de otra gente, como las de OpenRouter. Yo la he configurado para que use la suscripción de z.ai, para no tener que preocuparme del gasto.

Para haceros una idea de lo que es, os cuento lo que le he pedido que haga. El agente se puede comunicar con el usuario, por ejemplo por Telegram. Pues bueno, le he pedido que me mande unos días específicos de la semana a las 8 de la mañana, el estado de las carreteras para ver si hay hielo o nieve, a telegram. También le he pedido que me recuerde unas cosillas que tengo que hacer cada mañana. Luego, le he explicado los objetivos que tengo en diversos campos, y tras un rato largo de hablar sobre ello, el agente me ha construido un sistema que me recomienda cosas a hacer para conseguir mis objetivos cada día, y luego tiene un sistema de seguir lo que he hecho para cada objetivo, y si lo he cumplido. También me ha hecho un sistema que me da sugerencias para mis objetivos hoy.

Si le hubiera dado acceso al calendario, correos, ficheros y otras cosas, me podría haber hecho algunas de estas tareas él sólo. De momento estoy corriendo este agente en la nube. Corre en Linux, Mac y WSL Ubuntu en Windows. No le he dado acceso a ningún fichero de mi PC, ni a nada, que no haya tecleado yo.

El agente tiene unas cuantas herramientas hechas ya para hacer una variedad de tareas. Dado que la gente que lo ha hecho se dedica a la IA, tienen muchas herramientas para este espacio, o incluso para informática. Por ejemplo, puede darte información de un dominio de internet, y hace unas horas acaban de añadir una herramienta para desalinear modelos de IA. (Para que el modelo no te diga que hay algo que no puede hacer)

Una de las gracias de Hermes Agent, es que una vez que ha hecho algo que quieres que recuerde, lo puede guardar como una habilidad (skill) de forma que la siguiente vez, ya sabe cómo hacerlo. Con lo cual, el agente con el tiempo mejora. También tiene un sistema de memoria optimizado para no ocupar mucho y no retrasar las cosas y usar un montón de tokens.

Es un juguete. Dado que lo acaban de sacar, hay un par de cosillas que no me han funcionado, por ejemplo lo de los mensajes a través de Telegram, me daba un error. Se lo he dicho al agente, y me lo ha arreglado él sólo. (También me ha configurado hermes para que funcione como un servicio con systemd y si se cae, lo resucita) El programa éste me ocupa sólo unos 400mb de RAM, lo que no es mucho. Para usarlo e instalarlo al principio, la gente que os dedicáis a la informática lo tendréis más fácil. Recomiendo leer el manual que tienen en su github en vez de simplemente instalarlo y empezar a jugar como he hecho yo. 😉

 
Última edición:
IA le pego luego un vistazo pero por el momento te lo poleo.
 
Os leí el otro día y me quedé con ganas de leer más. Tú lo has llegado a poder comparar con OpenClaw? Da la sensación que es algo más seguro, aunque por contra tiene menos comunidad y menos skills, pero quizás da más confianza. Dicen que se puede auditar mejor su memoria
 
Os leí el otro día y me quedé con ganas de leer más. Tú lo has llegado a poder comparar con OpenClaw? Da la sensación que es algo más seguro, aunque por contra tiene menos comunidad y menos skills, pero quizás da más confianza. Dicen que se puede auditar mejor su memoria
No he usado openclaw, porque cuando empecé a instalarlo me pedía mucha información que no estaba dispuesto a darle. El sistema de memoria va en unos ficheros en markdown, que puedes leer y modificar, y creo que lo que hacen es podarlos de vez en cuando para que no se coman miles de tokens sin razón.

El caso es que puedes importar las skills de openclaw y usar MCPs también. Tiene un sistema de skills que te muestra una lista y le dices lo que quieres importar. La lista incluye las skills de openclaw. Tiene un montón de skills ya para IA, porque la gente de Nous Research lo usaban para ellos mismos y decidieron soltarlo para todos públicos. Tienen un discord muy animado y un Hackathon ahora.

La otra cosa que tiene es lo que en humanos se llama memoria procedural. Cuando haces algo unas cuantas veces, el agente se crea una skill por su cuenta. Con lo cual, cuanto más lo usas, más espabilado es.

También se puede autoreparar (!) Si algo no va, le dices que le eche un vistazo y si lo puede reparar.

La otra cosa que tiene, es que han programado el uso de herramientas (tools) para cada família de modelos, con lo cual las llamadas a herramientas funcionan bien. Nous había hecho ya eso con los finetunings de algunos modelos de Meta ya antes, lo de las herramientas.

En uno de los últimos releases han puesto una utilidad para desalinear un modelo con un solo prompt, siempre que tengas potencia computacional. Estas son las skills que puedes ver desde dentro de hermes. Puedes instalar cualquier cosa claro o incluso crear tus propias skills. Creo que el formato es el mismo que el de Claude. En la lista ésta, ponen el repositorio de Claude marketplace también. 😉

1773626744269.webp


También puedes usar MCPs. Lo estoy usando con suscripción de código de z.ai, y tiene unos cuantos MCPs para usar sus herramientas en vez de dar acceso directo al modelo. Bueno, pues fui a la página de z.ai donde explicaba esto, le mostré la página de los MCPs a mi agente, y luego le pedi que los instalase uno a uno y los probase. Funcionó estupendamente. De hecho la prueba de visión me hizo OCR creo que en japonés. (!)

Creo que ahora tienen una función tb para importar la configuración de openclaw.

1773626829742.webp
 
Última edición:
Llegué a probar OpenClaw, pero con mi plan pro de Anthropic no me daba para mucho. Aprovechando que lo tengo instalado lo probaré con ¿GLM 5 os he leído por el chat que usáis? Ojalá tuviera tiempo para seguiros el ritmo. Es la hostia todo lo que está pasando...
 
Llegué a probar OpenClaw, pero con mi plan pro de Anthropic no me daba para mucho. Aprovechando que lo tengo instalado lo probaré con ¿GLM 5 os he leído por el chat que usáis? Ojalá tuviera tiempo para seguiros el ritmo. Es la hostia todo lo que está pasando...
Estamos usando GLM 5 con la suscripción de coding de z.ai. He mandado un pdf con un mini tutorial. Si no quieres hacer gasto, una opción a tiempo limitado es probar alguno de los modelos nuevos en OpenRouter que son gratis. Ahora hay uno que se rumorea es el siguiente Deepseek. De hecho, hay un tipo que está usando una tarjeta con 12 Gb de VRAM para usar hermes con qwen 3.5 9b si tienes GPU. Alibaba cloud tiene una oferta de $10 USD de los mejores modelos chinos tb, pero para que te la den, tienes que esperar a ver si la tienen. Las ofertas salen a las 9.30am hora de Pekin. 😉

Hoy estaba mirando un tipo que ha hecho una memoria que llama holográfica para agentes, y le estaba preguntando a mi agente si le podía echar un vistazo al repo. El chisme le ha echado un vistazo, y me ha explicado cómo va. Es un sistema de acceso a memoria novedoso e interesante, que además tiene degradación suave si hay problemas, o si hay mucha información. Le pregunto que si podría usar ese tipo de memoria, y el agente me ha explicado que sí, y como funcionaría dado que hermes va en python, y esta memoria en typescript. Me decía que si quería probar a cambiar su propio sistema de memoria... Es surreal.
 
Última edición:
Hoy estaba mirando un tipo que ha hecho una memoria que llama holográfica para agentes, y le estaba preguntando a mi agente si le podía echar un vistazo al repo. El chisme le ha echado un vistazo, y me ha explicado cómo va. Es un sistema de acceso a memoria novedoso e interesante, que además tiene degradación suave si hay problemas, o si hay mucha información. Le pregunto que si podría usar ese tipo de memoria, y el agente me ha explicado que sí, y como funcionaría dado que hermes va en python, y esta memoria en typescript. Me decía que si quería probar a cambiar su propio sistema de memoria... Es surreal.
Os leí y a ver si este fin de semana me pongo al día de tanta cosa. Sois mis influencers de IA
 
Os leí y a ver si este fin de semana me pongo al día de tanta cosa. Sois mis influencers de IA
Hablando de influencers, hace tiempo que escucho este podcast de IA que es interesante. El otro día iba escuchándolo en el coche, es la historia de una mujer que usa OpenClaw para la educación de sus hijos, esas cosas que hacen los americanos de educar en casa. Suelen entrevistar a gente de compañías de IA, o gente que hace IA dentro de compañías que no son de por sí de IA. No hace mucho entrevistaron a los de Stripe, los del sistema de pagos.

 
Desde que escribí el post original, Hermes ha mejorado mucho. Acaban de sacar versión nativa para Windows. La versión original que sacaron, iba con WSL. Es una early beta, y como pone en la documentación, el agente tiene acceso a todo lo que tenga acceso tu cuenta de usuario, así que a ir con cuidado. Lo estuve probando ayer, y va muy bien. Lo he puesto con GLM-5.1. Si tenéis una tarjeta de vídeo presentable, los qwen3.6 o gemma4 se ve que van bien. Si tenéis una tarjeta RTX los modelos densos van mejor. Si tenéis algo basado en GB-10 o Strix Halo, los MoE van más rápido. (50t/s con GB-10 con qwen3.6 q4 en local)

Ahora tiene muchas más cosas que inicialmente. Una de ellas es el sistema de memoria. Se puede elegir con la configuración el poner memoria holográfica, o una versión local de honcho, que es una memoria que antes de guardar en la base de datos lo que sea, lo interpreta y hace infererencias sobre lo que ve. He puesto la holográfica, que es gratis y hace que el agente sea mucho más útil. También se pueden usar sistemas de memoria comerciales. La versión de ahora también permite controlar tu cuenta de Spotify para que tu agente toque música y eso. 😉

 
Última edición:
Volver
Arriba