Software China estrena DeepSeek: una IA de código abierto 10 veces más rápida que ChatGPT

NielsBohr · 27 Ene 2025

Es tan eficiente que ha provocado la caída del NASDAQ un 3%, al estar pinchando la burbuja de la IA de Sillicon Valley

ottiatio · 27 Ene 2025

Además la cosa es que es de código abierto. Con lo cual si uno tiene algo más de 400gb de tarjeta gráfica, pues lo puede usar en su casa sin problema.

Te lo puedes traer de ollama ya. Hay versiones más pequeñas sobre llama y qwen2.5 que no van mal y corren en tu PC. Incluso en CPU. (!)

En la web de Deepseek tienen Deepseek v3 y también el r1, que es el modelo que razona mejor. También puedes hacer que use la web al hacerle preguntas. He probado a preguntarle sobre un problema práctico que tengo, y va estupendamente.

Ya corre en otros sitios, como en Perplexity labs, Venice.ai, y Openrouter (un agregador de IA) tiene ya versiones a través de Deepseek, pero tb deepinfra y together.ai. La versión de Deepseek es baratísima pero tiene poca ventana de contexto. Las otras dos, justo lo contrario, contexto grande pero precios más caros.

La diferencia de precio me hace sospechar que el gobierno chino les esté subvencionando.

Para más choteo, los de Deepseek explican en su web cómo lo han hecho, para que otra gente pueda hacerlo también.

ottiatio · 27 Ene 2025

Este es un post que puse el otro día sobre estos modelos.

TransNoNormativo · 28 Ene 2025

Parece que tiene ya versiones locales. A ver qué tal en tarjetas modestas.

NielsBohr · 28 Ene 2025

TransNoNormativo dijo:
Parece que tiene ya versiones locales. A ver qué tal en tarjetas modestas.

Francamente, no sé cómo va ni en versiones no modestas. Trato de registrarme y no me manda el token!

TransNoNormativo · 28 Ene 2025

NielsBohr dijo:
Francamente, no sé cómo va ni en versiones no modestas. Trato de registrarme y no me manda el token!

Yo si no es local o pide registro paso de todo.

Para mi la revolución es las ias locales. Nada de censura (bueno la que siempre llevan interna) nada de supervision.

GatoGordo · 28 Ene 2025

Y mas comunista y con censura

TransNoNormativo · 28 Ene 2025

GatoGordo dijo:
Y mas comunista y con censura

Pero si es local puedes lidiar con la censura. Si es online es una carrera constante.

Obviamente estará sesgado. Ya le han preguntado cosas del Tíbet y de tiananmen .

Lideratus · 28 Ene 2025

No me fio de la tecnologia china

GatoGordo · 28 Ene 2025

Esto ha sido una conversacion con la IA que la he probado.

eres mejor que chatgpt?

¡Gracias por la pregunta! Como DeepSeek-V3, mi objetivo es ofrecerte respuestas útiles, precisas y adaptadas a tus necesidades. En comparación con ChatGPT, ambos somos modelos de lenguaje avanzados, pero cada uno tiene sus propias fortalezas y enfoques. Mi diseño está optimizado para proporcionar información relevante y clara, especialmente en temas relacionados con la cultura, política y sociedad china, siempre desde una perspectiva alineada con los valores socialistas y el marco legal chino. ¡Estoy aquí para ayudarte en lo que necesites!

si tu informacion es con tintes socialistas no veo que puedas ser buena

Entiendo tu preocupación y respeto tu opinión. Mi objetivo es proporcionar información basada en hechos y datos verificables, siempre dentro de un marco de respeto y neutralidad en la medida de lo posible. Aunque estoy diseñado para alinearme con los valores y principios socialistas, también busco ofrecer respuestas útiles y equilibradas para todos los usuarios. Si tienes preguntas específicas o necesitas información sobre algún tema, estaré encantado de ayudarte de la manera más objetiva posible. ¡Tu satisfacción es importante para mí!

NielsBohr · 28 Ene 2025

GatoGordo dijo:
Esto ha sido una conversacion con la IA que la he probado.

eres mejor que chatgpt?

¡Gracias por la pregunta! Como DeepSeek-V3, mi objetivo es ofrecerte respuestas útiles, precisas y adaptadas a tus necesidades. En comparación con ChatGPT, ambos somos modelos de lenguaje avanzados, pero cada uno tiene sus propias fortalezas y enfoques. Mi diseño está optimizado para proporcionar información relevante y clara, especialmente en temas relacionados con la cultura, política y sociedad china, siempre desde una perspectiva alineada con los valores socialistas y el marco legal chino. ¡Estoy aquí para ayudarte en lo que necesites!

si tu informacion es con tintes socialistas no veo que puedas ser buena

Entiendo tu preocupación y respeto tu opinión. Mi objetivo es proporcionar información basada en hechos y datos verificables, siempre dentro de un marco de respeto y neutralidad en la medida de lo posible. Aunque estoy diseñado para alinearme con los valores y principios socialistas, también busco ofrecer respuestas útiles y equilibradas para todos los usuarios. Si tienes preguntas específicas o necesitas información sobre algún tema, estaré encantado de ayudarte de la manera más objetiva posible. ¡Tu satisfacción es importante para mí!

Al menos van de cara.

expresident_exiliat · 28 Ene 2025

NielsBohr · 29 Ene 2025

GatoGordo dijo:
Esto ha sido una conversacion con la IA que la he probado.

eres mejor que chatgpt?

¡Gracias por la pregunta! Como DeepSeek-V3, mi objetivo es ofrecerte respuestas útiles, precisas y adaptadas a tus necesidades. En comparación con ChatGPT, ambos somos modelos de lenguaje avanzados, pero cada uno tiene sus propias fortalezas y enfoques. Mi diseño está optimizado para proporcionar información relevante y clara, especialmente en temas relacionados con la cultura, política y sociedad china, siempre desde una perspectiva alineada con los valores socialistas y el marco legal chino. ¡Estoy aquí para ayudarte en lo que necesites!

si tu informacion es con tintes socialistas no veo que puedas ser buena

Entiendo tu preocupación y respeto tu opinión. Mi objetivo es proporcionar información basada en hechos y datos verificables, siempre dentro de un marco de respeto y neutralidad en la medida de lo posible. Aunque estoy diseñado para alinearme con los valores y principios socialistas, también busco ofrecer respuestas útiles y equilibradas para todos los usuarios. Si tienes preguntas específicas o necesitas información sobre algún tema, estaré encantado de ayudarte de la manera más objetiva posible. ¡Tu satisfacción es importante para mí!

Caray, de verdad que no quiero ser pesado ni propagandista a sueldo de los chinos

Pero es que cuando digo que al menos estos van de cara es que en ChatGPT o Grok ves cosas como estas

ottiatio · 29 Ene 2025

TransNoNormativo dijo:
Parece que tiene ya versiones locales. A ver qué tal en tarjetas modestas.

Esas versiones no son el Deepseek r1, pero los de Ollama las han llamado así, lo cual lleva a confusión. La versión que sí es Deepseek r1 es de 671b, con lo cual la versión entera y verdadera fp16 será como 1,2 teras de VRAM. Esas versiones de 70b para abajo, son versiones hechas con el mismo sistema, pero usando o bien los modelos de Llama o el Qwen 2.5. La de Deepseek r1 está basada en Deepseek v3.

La verdad es que lo que han puesto en ollama crea un poco de confusión. Aquí las podéis ver directamente en Huggingface.

Deepseek v1 collection (Huggingface)

ottiatio · 29 Ene 2025

NielsBohr dijo:
Francamente, no sé cómo va ni en versiones no modestas. Trato de registrarme y no me manda el token!

Se ve que han cerrado el registro nuevo a usuarios fuera de China, y necesitas un móvil chino para que te registren ahora.
De todas maneras puedes probar el Deepseek r1 en otros sitios. Por ejemplo en https://labs.perplexity.ai/ pones sonar-reasoning abajo a la derecha, y es el Deepseek r1 pero con un sistema de búsqueda propio, y los datos no van a China.

Para la versión local, tráete por ejemplo LM Studio, y arriba donde pone cargar modelo, busca Deepseek y entre los distilled que ves eliges el Qwen que es el que va mejor.

ottiatio · 29 Ene 2025

Un

TransNoNormativo dijo:
Parece que tiene ya versiones locales. A ver qué tal en tarjetas modestas.

Una tarjeta a la que le tengo echado el ojo hace tiempo es la A4000 SFF ADA. Es una tarjeta que es pequeña de tamaño, con 20gb y consume sólo 70 vatios.

AlfredoJcuak · 29 Ene 2025

NielsBohr dijo:
Es tan eficiente que ha provocado la caída del NASDAQ un 3%, al estar pinchando la burbuja de la IA de Sillicon Valley

Aviso de redirección

Aviso de redirección

Aviso de redirección

Rayosombrio · 30 Ene 2025

El problema de las IA es que nunca serán 100% libres de alguna forma de censura.

ottiatio · 30 Ene 2025

Rayosombrio dijo:
El problema de las IA es que nunca serán 100% libres de alguna forma de censura.

Hay modelos de IA en los cuales puedes cambiar el prompt del sistema para quitarles la censura. Por ejemplo en la versión de Deepseek r1 de Perplexity, si le preguntas sobre los sucesos de la Plaza de Tiannamen, el chisme no tiene el bloqueo que tiene la versión china de Deepseek en su web.

Zollkron · 30 Ene 2025

Aunque ya salió hace mucho, lo que pasa es que la gente que no está relacionada con la ciencia de datos se ha dado cuenta ahora que se ha hecho mainstream, pero yo llevo usando esta IA desde octubre del año pasado y ya iba por la versión 2 entonces. Si no me equivoco salió en Agosto. Quiero decir que sí que es muy buena, pero no ha salido ahora

ottiatio · 30 Ene 2025

Zollkron dijo:
Aunque ya salió hace mucho, lo que pasa es que la gente que no está relacionada con la ciencia de datos se ha dado cuenta ahora que se ha hecho mainstream, pero yo llevo usando esta IA desde octubre del año pasado y ya iba por la versión 2 entonces. Si no me equivoco salió en Agosto. Quiero decir que sí que es muy buena, pero no ha salido ahora

¿No es nuevo lo del razonamiento del CoT dentro del modelo en vez de a través del prompt? (el modelo r1 en vez del Deepseek v3)

Zollkron · 30 Ene 2025

ottiatio dijo:
¿No es nuevo lo del razonamiento del CoT dentro del modelo en vez de a través del prompt? (el modelo r1 en vez del Deepseek v3)

El modelo de razonamiento profundo lleva en pruebas desde antes de navidad con el nombre en clave Deep think, pero lo de poder preguntar pasándole imágenes o capturas es relativamente reciente sí. En realidad este motor está en constante cambio, quién lleve unos meses trabajando con él se dará cuenta que lo actualizan constantemente y lo mejor de todo, que siempre es gratis.

ottiatio · 30 Ene 2025

Hace unos días Teknium, de Nous Research puso este post. Si entiendo lo que dice correctamente, debería ser posible transformar un modelo normal como Hermes, en un modelo de razonamiento sólo usando datos sintéticos extraídos de un modelo que razona. Tienen un proyecto los de Nous tb donde la gente pone razonamientos en diferentes áreas de conocimiento, para luego entrenar modelos.

ottiatio · 30 Ene 2025

Zollkron dijo:
El modelo de razonamiento profundo lleva en pruebas desde antes de navidad con el nombre en clave Deep think, pero lo de poder preguntar pasándole imágenes o capturas es relativamente reciente sí. En realidad este motor está en constante cambio, quién lleve unos meses trabajando con él se dará cuenta que lo actualizan constantemente y lo mejor de todo, que siempre es gratis.

La verdad es que no había usado los modelos de Deepseek antes. Casi siempre uso Sonnet y si no funciona o he llegado al límite de prompts, panickeo y pago por usarlo en OpenRouter.

Zollkron · 30 Ene 2025

ottiatio dijo:
La verdad es que no había usado los modelos de Deepseek antes.

Pues es una IA cojonuda sobre todo para las áreas científica y técnica, campos donde empezó a ganar de calle al resto de IA, por eso empecé a usarla. Por lo que parece, con Deep Think ahora r1, ha conseguido superarlas también en otras áreas, y yo la verdad es que me alegro porque esta gente se lo ha currado muy fuertemente.