Agujero Negro
Aviso

Esta página web utiliza "cookies" para personalizar tu visita. Consulta nuestro Aviso Legal. Gracias!

DeepSeek

https://www.deepseek.com

image

DeepSeek es una colección de modelos de lenguaje de gran tamaño (LLM) de código abierto, desarrollada por la startup china DeepSeek. Su modelo más reciente, DeepSeek-V3, cuenta con una arquitectura de "Mixture-of-Experts" (MoE) que suma un total de 671 mil millones de parámetros, de los cuales 37 mil millones se activan por cada token. Este diseño permite un manejo eficiente de tareas como generación de texto, traducción y otras actividades basadas en lenguaje natural.

DeepSeek-V3 ha sido entrenado con un conjunto de datos masivo de 14,8 billones de tokens de alta calidad, lo que contribuye a su eficacia en el manejo de tareas complejas. Además, ofrece una ventana de contexto de 128K, permitiendo procesar y comprender secuencias de entrada extensas de manera efectiva.

Este modelo ha demostrado un rendimiento superior en diversas pruebas de referencia, incluyendo razonamiento matemático, generación de código y tareas multilingües, superando a otros modelos de código abierto y ofreciendo un rendimiento comparable a modelos de código cerrado como los de OpenAI y Anthropic.

DeepSeek-V3 está disponible de forma gratuita y sin necesidad de registro a través de su plataforma de chat en línea, lo que refleja el compromiso de la empresa con la accesibilidad y el código abierto. Además, DeepSeek ofrece una plataforma API para acceder a sus modelos de IA, proporcionando recursos para desarrolladores y documentación de la API.

En resumen, DeepSeek representa un avance significativo en el campo de la inteligencia artificial, ofreciendo modelos de lenguaje de gran tamaño de código abierto que destacan por su eficiencia y rendimiento en una variedad de tareas.

Análisis en Youtube de Carlos Santana.

Artículo de Enrique Dans.

Comentarios

AvisoEntrar

Debes estar logueado para poder comentar.