Software China estrena DeepSeek: una IA de código abierto 10 veces más rápida que ChatGPT

NielsBohr

Shurmano Dios
Nº Ranking
149
Shurmano Nº
9902
Desde
21 Abr 2024
Mensajes
5,473
Reacciones
32,675
Es tan eficiente que ha provocado la caída del NASDAQ un 3%, al estar pinchando la burbuja de la IA de Sillicon Valley

1000106195.jpg




 
Además la cosa es que es de código abierto. Con lo cual si uno tiene algo más de 400gb de tarjeta gráfica, pues lo puede usar en su casa sin problema.😉 Te lo puedes traer de ollama ya. Hay versiones más pequeñas sobre llama y qwen2.5 que no van mal y corren en tu PC. Incluso en CPU. (!)

En la web de Deepseek tienen Deepseek v3 y también el r1, que es el modelo que razona mejor. También puedes hacer que use la web al hacerle preguntas. He probado a preguntarle sobre un problema práctico que tengo, y va estupendamente.

Ya corre en otros sitios, como en Perplexity labs, Venice.ai, y Openrouter (un agregador de IA) tiene ya versiones a través de Deepseek, pero tb deepinfra y together.ai. La versión de Deepseek es baratísima pero tiene poca ventana de contexto. Las otras dos, justo lo contrario, contexto grande pero precios más caros.

La diferencia de precio me hace sospechar que el gobierno chino les esté subvencionando.

Para más choteo, los de Deepseek explican en su web cómo lo han hecho, para que otra gente pueda hacerlo también.
 
Última edición:
Ollama-Resultados.webp



Parece que tiene ya versiones locales. A ver qué tal en tarjetas modestas.
 
Francamente, no sé cómo va ni en versiones no modestas. Trato de registrarme y no me manda el token!
Yo si no es local o pide registro paso de todo.

Para mi la revolución es las ias locales. Nada de censura (bueno la que siempre llevan interna) nada de supervision.
 
Y mas comunista y con censura
 
Y mas comunista y con censura
Pero si es local puedes lidiar con la censura. Si es online es una carrera constante.

Obviamente estará sesgado. Ya le han preguntado cosas del Tíbet y de tiananmen .
 
No me fio de la tecnologia china
 
Esto ha sido una conversacion con la IA que la he probado.

eres mejor que chatgpt?



¡Gracias por la pregunta! Como DeepSeek-V3, mi objetivo es ofrecerte respuestas útiles, precisas y adaptadas a tus necesidades. En comparación con ChatGPT, ambos somos modelos de lenguaje avanzados, pero cada uno tiene sus propias fortalezas y enfoques. Mi diseño está optimizado para proporcionar información relevante y clara, especialmente en temas relacionados con la cultura, política y sociedad china, siempre desde una perspectiva alineada con los valores socialistas y el marco legal chino. ¡Estoy aquí para ayudarte en lo que necesites! 😊



si tu informacion es con tintes socialistas no veo que puedas ser buena



Entiendo tu preocupación y respeto tu opinión. Mi objetivo es proporcionar información basada en hechos y datos verificables, siempre dentro de un marco de respeto y neutralidad en la medida de lo posible. Aunque estoy diseñado para alinearme con los valores y principios socialistas, también busco ofrecer respuestas útiles y equilibradas para todos los usuarios. Si tienes preguntas específicas o necesitas información sobre algún tema, estaré encantado de ayudarte de la manera más objetiva posible. ¡Tu satisfacción es importante para mí! 😊
 
Esto ha sido una conversacion con la IA que la he probado.

eres mejor que chatgpt?



¡Gracias por la pregunta! Como DeepSeek-V3, mi objetivo es ofrecerte respuestas útiles, precisas y adaptadas a tus necesidades. En comparación con ChatGPT, ambos somos modelos de lenguaje avanzados, pero cada uno tiene sus propias fortalezas y enfoques. Mi diseño está optimizado para proporcionar información relevante y clara, especialmente en temas relacionados con la cultura, política y sociedad china, siempre desde una perspectiva alineada con los valores socialistas y el marco legal chino. ¡Estoy aquí para ayudarte en lo que necesites! 😊



si tu informacion es con tintes socialistas no veo que puedas ser buena



Entiendo tu preocupación y respeto tu opinión. Mi objetivo es proporcionar información basada en hechos y datos verificables, siempre dentro de un marco de respeto y neutralidad en la medida de lo posible. Aunque estoy diseñado para alinearme con los valores y principios socialistas, también busco ofrecer respuestas útiles y equilibradas para todos los usuarios. Si tienes preguntas específicas o necesitas información sobre algún tema, estaré encantado de ayudarte de la manera más objetiva posible. ¡Tu satisfacción es importante para mí! 😊

Al menos van de cara.
 
Esto ha sido una conversacion con la IA que la he probado.

eres mejor que chatgpt?



¡Gracias por la pregunta! Como DeepSeek-V3, mi objetivo es ofrecerte respuestas útiles, precisas y adaptadas a tus necesidades. En comparación con ChatGPT, ambos somos modelos de lenguaje avanzados, pero cada uno tiene sus propias fortalezas y enfoques. Mi diseño está optimizado para proporcionar información relevante y clara, especialmente en temas relacionados con la cultura, política y sociedad china, siempre desde una perspectiva alineada con los valores socialistas y el marco legal chino. ¡Estoy aquí para ayudarte en lo que necesites! 😊



si tu informacion es con tintes socialistas no veo que puedas ser buena



Entiendo tu preocupación y respeto tu opinión. Mi objetivo es proporcionar información basada en hechos y datos verificables, siempre dentro de un marco de respeto y neutralidad en la medida de lo posible. Aunque estoy diseñado para alinearme con los valores y principios socialistas, también busco ofrecer respuestas útiles y equilibradas para todos los usuarios. Si tienes preguntas específicas o necesitas información sobre algún tema, estaré encantado de ayudarte de la manera más objetiva posible. ¡Tu satisfacción es importante para mí! 😊
Caray, de verdad que no quiero ser pesado ni propagandista a sueldo de los chinos

Pero es que cuando digo que al menos estos van de cara es que en ChatGPT o Grok ves cosas como estas 💀

1000106590.webp


1000106591.webp
 
Ollama-Resultados.jpg



Parece que tiene ya versiones locales. A ver qué tal en tarjetas modestas.
Esas versiones no son el Deepseek r1, pero los de Ollama las han llamado así, lo cual lleva a confusión. La versión que sí es Deepseek r1 es de 671b, con lo cual la versión entera y verdadera fp16 será como 1,2 teras de VRAM. Esas versiones de 70b para abajo, son versiones hechas con el mismo sistema, pero usando o bien los modelos de Llama o el Qwen 2.5. La de Deepseek r1 está basada en Deepseek v3.

La verdad es que lo que han puesto en ollama crea un poco de confusión. Aquí las podéis ver directamente en Huggingface.

➡️ Deepseek v1 collection (Huggingface)
 
Francamente, no sé cómo va ni en versiones no modestas. Trato de registrarme y no me manda el token!
Se ve que han cerrado el registro nuevo a usuarios fuera de China, y necesitas un móvil chino para que te registren ahora.
De todas maneras puedes probar el Deepseek r1 en otros sitios. Por ejemplo en https://labs.perplexity.ai/ pones sonar-reasoning abajo a la derecha, y es el Deepseek r1 pero con un sistema de búsqueda propio, y los datos no van a China.

Para la versión local, tráete por ejemplo LM Studio, y arriba donde pone cargar modelo, busca Deepseek y entre los distilled que ves eliges el Qwen que es el que va mejor.
 
Un
Ollama-Resultados.jpg



Parece que tiene ya versiones locales. A ver qué tal en tarjetas modestas.
Una tarjeta a la que le tengo echado el ojo hace tiempo es la A4000 SFF ADA. Es una tarjeta que es pequeña de tamaño, con 20gb y consume sólo 70 vatios.
 
El problema de las IA es que nunca serán 100% libres de alguna forma de censura.
 
El problema de las IA es que nunca serán 100% libres de alguna forma de censura.
Hay modelos de IA en los cuales puedes cambiar el prompt del sistema para quitarles la censura. Por ejemplo en la versión de Deepseek r1 de Perplexity, si le preguntas sobre los sucesos de la Plaza de Tiannamen, el chisme no tiene el bloqueo que tiene la versión china de Deepseek en su web.
 
Aunque ya salió hace mucho, lo que pasa es que la gente que no está relacionada con la ciencia de datos se ha dado cuenta ahora que se ha hecho mainstream, pero yo llevo usando esta IA desde octubre del año pasado y ya iba por la versión 2 entonces. Si no me equivoco salió en Agosto. Quiero decir que sí que es muy buena, pero no ha salido ahora 😅🤣
 
Aunque ya salió hace mucho, lo que pasa es que la gente que no está relacionada con la ciencia de datos se ha dado cuenta ahora que se ha hecho mainstream, pero yo llevo usando esta IA desde octubre del año pasado y ya iba por la versión 2 entonces. Si no me equivoco salió en Agosto. Quiero decir que sí que es muy buena, pero no ha salido ahora 😅🤣
¿No es nuevo lo del razonamiento del CoT dentro del modelo en vez de a través del prompt? (el modelo r1 en vez del Deepseek v3)
 
¿No es nuevo lo del razonamiento del CoT dentro del modelo en vez de a través del prompt? (el modelo r1 en vez del Deepseek v3)
El modelo de razonamiento profundo lleva en pruebas desde antes de navidad con el nombre en clave Deep think, pero lo de poder preguntar pasándole imágenes o capturas es relativamente reciente sí. En realidad este motor está en constante cambio, quién lleve unos meses trabajando con él se dará cuenta que lo actualizan constantemente y lo mejor de todo, que siempre es gratis.
 
Hace unos días Teknium, de Nous Research puso este post. Si entiendo lo que dice correctamente, debería ser posible transformar un modelo normal como Hermes, en un modelo de razonamiento sólo usando datos sintéticos extraídos de un modelo que razona. Tienen un proyecto los de Nous tb donde la gente pone razonamientos en diferentes áreas de conocimiento, para luego entrenar modelos.


1738244860865.webp
 
El modelo de razonamiento profundo lleva en pruebas desde antes de navidad con el nombre en clave Deep think, pero lo de poder preguntar pasándole imágenes o capturas es relativamente reciente sí. En realidad este motor está en constante cambio, quién lleve unos meses trabajando con él se dará cuenta que lo actualizan constantemente y lo mejor de todo, que siempre es gratis.
La verdad es que no había usado los modelos de Deepseek antes. Casi siempre uso Sonnet y si no funciona o he llegado al límite de prompts, panickeo y pago por usarlo en OpenRouter.
 
La verdad es que no había usado los modelos de Deepseek antes.
Pues es una IA cojonuda sobre todo para las áreas científica y técnica, campos donde empezó a ganar de calle al resto de IA, por eso empecé a usarla. Por lo que parece, con Deep Think ahora r1, ha conseguido superarlas también en otras áreas, y yo la verdad es que me alegro porque esta gente se lo ha currado muy fuertemente.
 
Volver
Arriba