¿Reaccionará Estados Unidos de forma exagerada ante DeepSeek?
Los últimos días han sido tildados de ser un “momento Sputnik” para los estadounidenses, que están descubriendo que los ingenieros de software extranjeros se encuentran mucho más adelantados de lo que se pensaba. El 20 de enero, la empresa china DeepSeek anunció el lanzamiento de “DeepSeek R1”, su último modelo de lenguaje amplio (LLM como se lo conoce en inglés). Según se informa, DeepSeek R1, entrenado con sólo 6 millones de dólares, alcanza unas capacidades que rivalizan con creces con los resultados de gigantes estadounidenses de la IA como Anthropic, OpenAI, Meta y Google, cuyos modelos han requerido miles de millones (billones en inglés) de inversión.
La DeepSeek RI combina varias técnicas de entrenamiento innovadoras para crear un modelo cuyo desempeño sirve de prueba de concepto para lograr un incremento exponencial de la eficiencia, a pesar de que las técnicas no son especialmente novedosas en sí mismas. A efectos de ilustrar el logro, como dijo un ingeniero retirado de Microsoft: “Es parecido a construir una Ferrari en tu garaje con piezas de repuesto de Chevy… y en realidad es tan bueno como una Ferarri normal”. (Para más información sobre los aspectos técnicos, puedes leer sobre la mezcla de expertos, la cadena de pensamientos y el aprendizaje por refuerzo frente al ajuste fino supervisado).
DeepSeek es una startup relativamente nueva fundada en 2023 por Liang Wenfeng, quien no es un recién llegado a la IA. Anteriormente fundó un notable fondo de cobertura chino, High Flyer, que utilizaba IA para negociar acciones, aparentemente en un esfuerzo por replicar el éxito de la legendaria empresa de negociación algorítmica Renaissance Technologies. Después de poner a prueba otros modelos de lenguaje amplio con el respaldo financiero de High Flyer, DeepSeek lanzó la R1.
¿Por qué ha salido este tema en todas las noticias y por qué puede ser de interés para alguien? Hay un par de razones. Por un lado, demostró que, aunque Estados Unidos se ha destacado tradicionalmente en el desarrollo de software, China puede igualar e incluso superar a los gigantes tecnológicos estadounidenses en importantes pruebas comparativas de IA. El temor es que la IA sea la nueva bomba atómica de la guerra del siglo XXI, y que Estados Unidos se encuentre en una carrera armamentística. En segundo lugar, la noticia de la eficiencia de la R1 provocó la mayor pérdida bursátil en un solo día de la historia: Nvidia perdió 589.000 millones de dólares (billones en inglés) de capitalización bursátil porque algunos temen una caída en la demanda de unidades de procesamiento de gráficos (GPU), que son utilizados para procesar los datos empleados para entrenar los modelos.
El revuelo provocó un gran debate en Internet sobre la estrategia estadounidense en materia de IA, con la Casa Blanca investigando cuestiones de seguridad nacional y comentarios sobre los controles estadounidenses a la exportación de chips. Estados Unidos ha implementado toda clase de políticas destinadas a restringir el acceso foráneo a determinadas tecnologías, desde los antes mencionados controles a la exportación, la Ley Ciencia y chips, el Programa de Red Limpia, y diversas otras protecciones y subvenciones que se suman a los aranceles propuestos. Los políticos no ven el juego a largo plazo.
Lo que a menudo se pierde en estos debates es la importancia de la competencia y el hecho de que las restricciones pueden comprometer la viabilidad a largo plazo. La dirección actual de Estados Unidos evidencia una miopía que, en muchos aspectos, guarda lamentables similitudes con su enfoque de la industria siderúrgica.
Ahora mismo, Estados Unidos sigue dominando el mercado del software. Silicon Valley es tan rico que, si fuera un país, estaría en la lista de las naciones más opulentas. Esto no es algo que debería darse por sentado. Tras la Segunda Guerra Mundial, los estadounidenses tenían prácticamente el monopolio de la producción de acero, en gran parte debido a la destrucción de Europa. Durante un tiempo, la “Ciudad del Acero”, Pittsburgh, fue una de las más ricas del planeta. Considerada estratégicamente vital, la industria siderúrgica ha estado durante mucho tiempo fuertemente protegida por aranceles, subsidios y exenciones especiales. A lo largo del siglo XX, los políticos estadounidenses protegieron a los productores nacionales de acero de la competencia extranjera, creyendo que así preservarían el dominio industrial. Como ha señalado Scott Lincicome, “las empresas siderúrgicas y los trabajadores estadounidenses han recibido desde la década de 1970 probablemente más ayudas públicas que ninguna otra industria del país”.
Sin embargo, este proteccionismo al final terminó siendo contraproducente: sin la presión para innovar y mejorar la eficiencia, las empresas siderúrgicas estadounidenses se estancaron mientras los competidores mundiales, sobre todo en Japón y Europa, desarrollaban métodos de producción superiores y las ineficientes empresas estadounidenses se quedaban rezagadas. El acero estadounidense perdió su ventaja tecnológica. Un riesgo similar se cierne hoy sobre la IA. Si Estados Unidos se apoya demasiado en políticas restrictivas en vez de permitir una innovación y eficiencia sólidas propias, puede verse superado por competidores que se vean obligados a innovar.
China está invirtiendo miles de millones en su capacidad nacional de producción de chips y ya está utilizando el hardware existente para eludir eficazmente estas restricciones. En el caso concreto de DeepSeek, High Flyer adquirido grandes cantidades de chips Nvidia A100 antes de que el gobierno estadounidense impusiera restricciones a la exportación, por lo que es difícil decir si las restricciones habrían impedido la puesta en marcha de la R1.
En cualquier caso, el avance de DeepSeek demuestra que la IA no depende únicamente del acceso a grandes recursos informáticos. En la medida en que China distorsiona y perjudica su propio mercado nacional de IA, será un problema para ellos. El arma de doble filo es que los controles a la exportación limitan el acceso de empresas estadounidenses como NVIDIA a un lucrativo mercado chino, lo que puede reducir sus ingresos y frenar las inversiones nacionales en investigación y desarrollo.
La R1 es de código abierto, lo que significa que más desarrolladores pueden basarse en ella sin costos prohibitivos. Esto hace que la tecnología sea más accesible y reduce la barrera para que los empresarios innoven. Además, el aumento de la eficiencia tiene numerosos beneficios derivados, como la reducción de la demanda sobre la red eléctrica. Las empresas dispondrán de más capital para investigación y desarrollo al no tener que gastar todo su dinero en entrenamiento. Como la R1 es de código abierto, pone los conocimientos técnicos a disposición de investigadores y desarrolladores. No obstante, hay que tener en cuenta que el precio de 6 millones de dólares de la R1 es probablemente una estimación conservadora que descuenta el costo en investigación y desarrollo y de los componentes de DeepSeek. Aun así, no cabe duda de que será más barato emplearla.
La historia enseña que las reacciones exageradas y las intervenciones de mano dura suelen ser contraproducentes. Las políticas tecnológicas del garrote y la zanahoria de Estados Unidos corren el riesgo de socavar los mismos objetivos que estas medidas pretenden alcanzar. La innovación de DeepSeek debería verse como un llamado de atención, pero también como un motivo moderado de optimismo.
Traducido por Gabriel Gasave
- 27 de septiembre, 2021
- 19 de febrero, 2025
- 8 de junio, 2012
Artículo de blog relacionados
Por Javier Aparisi BBC Mundo, Miami Crecimiento de remesas 2001 – US$23.000 millones...
6 de diciembre, 2006- 9 de diciembre, 2015
El Universal La hoy imperante cultura de la depresión ha calado tan hondo...
29 de agosto, 2010- 9 de octubre, 2015