La disrupción de DeepSeek: cómo un modelo de 6 millones de dólares sacudió el mundo de la IA
Puntos clave
- 1DeepSeek R1 demostró que los modelos de IA de alto rendimiento pueden desarrollarse con costos de entrenamiento significativamente menores a los asumidos.
- 2La masiva caída de la acción de NVIDIA ilustra cuánto depende el sector de IA de la suposición de una demanda de hardware en constante crecimiento.
- 3El éxito de DeepSeek generó un amplio debate sobre la eficiencia de los enfoques actuales de entrenamiento de IA y la asignación de recursos.
- 4Para las empresas, esto significa que las soluciones de IA de alto rendimiento podrían volverse accesibles para presupuestos más reducidos.
- 5Las implicaciones geopolíticas son notables: China demostró sus capacidades de IA a pesar de las restricciones occidentales a la exportación de chips.
La onda expansiva de 589 mil millones de dólares
El 20 de enero de 2025, el laboratorio de IA chino DeepSeek lanzó R1, un modelo de razonamiento de código abierto que se informó costó menos de 6 millones de dólares desarrollar. El modelo igualó o superó al o1 de OpenAI en benchmarks clave mientras usaba una fracción de los recursos computacionales. En pocos días, la aplicación DeepSeek superó a ChatGPT como la aplicación gratuita más descargada en la App Store de Apple.
La reacción del mercado fue rápida y severa. El 27 de enero, NVIDIA perdió 589 mil millones de dólares en capitalización de mercado, la mayor caída en un solo día en la historia del mercado bursátil estadounidense. El Nasdaq cayó un 3,1 por ciento. El impacto de DeepSeek desafió la narrativa prevaleciente de que construir IA de frontera requería miles de millones de dólares en cómputo, planteando preguntas fundamentales sobre la economía de la industria de la IA.
IA de código abierto y la revolución de la eficiencia
El logro de DeepSeek demostró que las técnicas de entrenamiento innovadoras y las optimizaciones de arquitectura podían reducir dramáticamente el costo de producir modelos de IA de alta calidad. Las arquitecturas de mezcla de expertos, la destilación del conocimiento y las estrategias de entrenamiento inteligentes demostraron que el gasto en cómputo bruto no era el único camino hacia el rendimiento de frontera.
Para el ecosistema de IA más amplio, este fue un momento liberador. Las startups y empresas más pequeñas que nunca pudieron permitirse construir o acceder a modelos de miles de millones de dólares de repente tuvieron una alternativa de código abierto que rendía a nivel de frontera. Las implicaciones para la competencia, los precios y la accesibilidad en el mercado de la IA fueron profundas e inmediatas.
Mientras tanto en Japón: Switch 2 y Stargate
Enero de 2025 fue agitado más allá de DeepSeek. Nintendo reveló oficialmente la Switch 2 el 16 de enero, confirmando un lanzamiento en 2025 con un factor de forma más grande y controles Joy-Con magnéticos. La consola de próxima generación del gigante del gaming prometía ser uno de los mayores lanzamientos de productos del año en Japón.
En el frente de la infraestructura de IA, Masayoshi Son de SoftBank se unió a Sam Altman y Larry Ellison en la Casa Blanca el 21 de enero para anunciar el Proyecto Stargate, una empresa conjunta que planea hasta 500 mil millones de dólares en inversión en infraestructura de IA en EE.UU. Son fue nombrado presidente, colocando a un líder empresarial japonés al frente de la mayor iniciativa de infraestructura de IA en la historia.
¿Listo para transformar su marca?
Medusa Japan combina innovación en IA con principios de diseño japonés para crear experiencias digitales extraordinarias.
Contáctenos¿Está su empresa lista para Japón?
Complete nuestro scorecard gratuito de 5 categorías y obtenga su informe personalizado.
Medusa Japan
Medusa Japan es una agencia creativa y estudio de productos de IA con sede en Osaka, especializada en conectar la cultura empresarial japonesa con soluciones tecnológicas de vanguardia.
Artículos relacionados
GPT-5 ha llegado: lo que las agencias creativas y las empresas deben saber
OpenAI publica GPT-5 junto a sus primeros modelos de peso abierto desde GPT-2, marcando un nuevo capítulo tanto para el desarrollo de IA propietario como para el abierto.
Centros de datos en órbita, fábricas en la Luna: por qué declarar « inviable » el plan de cómputo espacial de SpaceX y xAI es el error fácil de 2026
En 2026 SpaceX absorbió a xAI, solicitó lanzar hasta un millón de satélites y presentó el AI-1 — un centro de datos orbital que consume aproximadamente la potencia de un solo rack de NVIDIA y con una envergadura mayor que la de un Boeing 747. El plan se apila desde ahí: una fundición de chips de un teravatio al año llamada Terafab para alimentar todos los proyectos, una fábrica Gigasat que apunta a un gigavatio de cómputo orbital al año para finales de 2027, y una base de fabricación en la Luna que lanza los satélites terminados al espacio con una catapulta electromagnética. Los líderes de opinión de LinkedIn y los divulgadores de YouTube ya han declarado todo el asunto imposible — el mismo veredicto que esa misma multitud emitió sobre los cohetes reutilizables, sobre Starlink y sobre los coches eléctricos. Aquí exponemos por qué las objeciones serias son sobre el calendario y la economía, no sobre la física, y por qué descartar a la empresa que lanzó dos tercios de todos los satélites activos es el error más fácil que un responsable puede cometer.