Una carrera artificial y volantazos hacia la derecha

Por: Carolina Martínez Elebi

Sobre DeepSeek y la decisión de Meta que cambiará la experiencia del debate en sus redes.

El 20 de enero la empresa china DeepSeek lanzó su primera aplicación de bot conversacional, basada en el modelo DeepSeek-R1, un LLM (Large Language Model, o modelo de lenguaje de gran tamaño) de código abierto que se basa en lo que se conoce como “computación en tiempo de inferencia”, lo que significa que activan solo las partes más relevantes de su modelo para cada consulta, y eso ahorra dinero y poder de cálculo.

Desde su lanzamiento proliferaron las noticias sobre DeepSeek. Acá van algunas particularidades del caso:

  1. Así describe NVIDIA a DeepSeek-R1 (y abajo vamos a ver por qué importa lo que diga NVIDIA):
    “DeepSeek-R1 es un modelo abierto con capacidades de razonamiento de última generación. En lugar de ofrecer respuestas directas, los modelos de razonamiento como DeepSeek-R1 realizan múltiples pasadas de inferencia sobre una consulta, llevando a cabo métodos de búsqueda, consenso y cadena de pensamiento para generar la mejor respuesta.La ejecución de esta secuencia de pasos de inferencia (utilizando la razón para llegar a la mejor respuesta) se conoce como escalamiento en tiempo de prueba. DeepSeek-R1 es un ejemplo perfecto de esta ley de escalamiento, que demuestra por qué la computación acelerada es fundamental para las demandas de la inferencia de IA con agentes.A medida que se permite que los modelos ‘piensen’ iterativamente en el problema, crean más tokens de salida y ciclos de generación más largos, por lo que la calidad del modelo continúa aumentando. Un cómputo significativo en tiempo de prueba es fundamental para permitir tanto la inferencia en tiempo real como las respuestas de mayor calidad de los modelos de razonamiento como DeepSeek-R1, lo que requiere implementaciones de inferencia más grandes.R1 ofrece una precisión líder para tareas que exigen inferencia lógica, razonamiento, matemáticas, codificación y comprensión del lenguaje y, al mismo tiempo, ofrece una alta eficiencia de inferencia.”

2. Funciona a un costo muchísimo menor que el de sus competidores. El R1 de DeepSeek se construyó a pesar de que Estados Unidos restringió las exportaciones de chips a China tres veces en tres años. Las estimaciones difieren sobre cuánto cuesta exactamente o cuántas GPU se utilizaron para fabricarlo. Los analistas estimaron que una versión reciente tuvo un “costo de capacitación de solo 5,6 millones de dólares (suponiendo un costo de alquiler de 2 dólares por hora de H800). Eso es menos del 10% del costo de Llama, de Meta”. Los informes coinciden en que el modelo se desarrolló con una fracción del costo de los modelos rivales de OpenAI, Anthropic, Google y otros. Para tener de referencia, para GPT-4 de OpenAI en 2023 se invirtieron 100 millones de dólares.

Como resultado, el sector de la IA está inundado de preguntas: ¿Es necesario el creciente número de rondas de financiación astronómicas y valoraciones de miles de millones de dólares de la industria? ¿Es una burbuja a punto de estallar?

3. El código es abierto y sus documentos técnicos están disponibles.

4. En medio de una guerra de chips (en inglés bajo la sigla GPU, por «unidad de procesamiento gráfico») entre Estados Unidos y China, que ya tiene larga trayectoria, y a pocos días de terminar su mandato, la administración de Biden había ampliado las restricciones para evitar que China mejore sus capacidades de IA, a través de un nuevo marco para la exportación de chips informáticos avanzados que se utilizan para el desarrollo de IA, para impedir que China pueda adquirir tecnología de punta que pudiera llevarla a liderar la carrera.

Estas restricciones impactaron directamente sobre la empresa NVIDIA, que tiene el 90% del mercado global de GPU para centros de datos. Desde la compañía, Ned Finkle, vicepresidente de asuntos gubernamentales de NVIDIA, había dicho ni bien se supo la medida: “Aunque se presenten bajo la apariencia de una medida anti-China, estas reglas no harían nada para mejorar la seguridad de Estados Unidos”. A raíz de todo esto, las acciones de NVIDIA cayeron casi un 17% el 27 de enero, lo que significó una pérdida de 600.000 millones de dólares y la mayor pérdida diaria de una empresa en la historia del mercado de valores. Algunas acciones relacionadas con la energía también se desplomaron el lunes debido a las preocupaciones de los inversores de que la nueva tecnología podría requerir menos energía para funcionar, lo que se traduciría en una menor demanda del sector tecnológico (aunque, claro, eso significaría un menor impacto ambiental y esa sería una buena noticia).

Esto llevó a más preguntas: ¿Cuáles son las implicaciones de inversión? ¿Qué dice esto sobre los modelos de código abierto frente a los propietarios? ¿Están funcionando las restricciones a las exportaciones de EEUU? De hecho, sobre este último punto, desde EEUU iniciaron una investigación para saber si DeepSeek obtuvo chips de NVIDIA a través de terceros desde Singapur. Además, EEUU anunció esta semana que seguirá reforzando las restricciones a la exportación hacia China de chips de NVIDIA.

💥 Lo que sabemos es que todo esto movió el avispero en Silicon Valley.

5. En los últimos días surgió preocupación por los datos personales que recopila DeepSeek en servidores ubicados en China. Esto, además, se da en el marco de la reciente ley aprobada en el Congreso de EEUU que prohíbe TikTok en ese país, aunque esto ahora está en proceso de cambio desde que Trump firmara una orden ejecutiva que ordenaba al Departamento de Justicia no hacer cumplir la prohibición durante 75 días. De hecho, en países como Italia bloquearon la app por preocupaciones en torno al manejo de datos de la aplicación. Y, además, hubo una filtración de datos sensibles de los usuarios, que incluye los chats de los usuarios.

Un detalle no menor: La toma de posesión de Trump se realizó en presencia de los principales CEO tecnológicos de Silicon Valley, seguida del anuncio de una inversión milmillonaria para fomentar el desarrollo de la IA y la presentación de una estrategia para abordar esta tecnología. La emoción les duró 1 semana.

Todo pasa tan rápido, cada vez más, que en los últimos 11 días de enero tuvimos el lanzamiento, una gran cascada de acontecimientos, crisis en la industria y cuestionamientos por impacto en la privacidad. Y apenas estamos empezando el año.

¿Soy la única que extraña cuando las cosas se desarrollaban a un ritmo más lento? No hay paz.


Meta se cansó de “verificar hechos”

Pero el año no empezó con la noticia de DeepSeek, sino que Meta ya había hecho ruido a una semana de empezar el 2025.

El martes 7 de enero la empresa liderada por Mark Zuckerberg anunció que pondrá fin a su programa de verificación de datos en sus plataformas. En su lugar, reemplazará el trabajo de periodistas de chequeo de datos por las “notas comunitarias” al estilo de X como parte de una serie de cambios que apuntan a, según Meta, “reducir la censura y abrazar la libertad de expresión”.

Como destacan desde Axios, estos cambios se hacen eco de los llamados de la derecha a levantar la “censura” en las redes sociales y coinciden con el regreso del presidente electo Trump a la Casa Blanca.

Además de reemplazar a sus verificadores de datos, Meta traerá de vuelta más contenido político a sus plataformas y pondrá fin a las restricciones en ciertos temas “fuera de contacto con el discurso dominante”, dijo Zuckerberg, “como la inmigración y el género”.

El día del anuncio, el republicano Joel Kaplan, director de asuntos globales de Meta (a quien le dieron ese cargo luego de que Nick Clegg “abandonara” Meta antes del regreso de Trump), dijo que los verificadores de datos externos de Meta han demostrado “demasiado sesgo político”. Las reglas que rigen el contenido en las plataformas de Meta “se han vuelto demasiado restrictivas con el tiempo, incluso en lo que respecta a ese tipo de temas sensibles… que la gente quiere discutir y debatir, inmigración, cuestiones trans, género”. Además, agregó: “Si puedes decirlo en la televisión, puedes decirlo en el Congreso, ciertamente deberías poder decirlo en Facebook e Instagram sin temor a la censura”. Algo así como… “si ya está roto, ¿por qué no romperlo más?” 🙄

Meta había empezado a intensificar sus esfuerzos de verificación de datos después de las elecciones estadounidenses de 2016, cuando había sido criticada por permitir la desinformación en su plataforma. Así, se basó en una red de socios de verificación de datos que formaban parte de un consorcio de terceros llamado Red Internacional de Verificación de Datos. En Argentina -desde donde escribo-, sus socios fueron Chequeado y AFP, según el mapa de socios de Facebook.

En 2019, casi habían cuadriplicado el número de socios de verificación de datos, pero pronto comenzaron a recibir críticas sobre que “sus socios verificadores de datos eran parciales”, lo que les sirvió como antecedente para argumentar la reciente decisión.

Como dice Scott Rosenberg“distinguir la verdad de la falsedad es una tarea frustrante, interminable e ingrata, y ahora Mark Zuckerberg se está alejando de ella”.

Es cierto que Meta fue denunciada por ejercer censura a través de sus mecanismos de moderación de contenido que son opacos y que no permiten al usuario defenderse en casos de moderación injusta. Sin embargo, eliminar la moderación (en lugar de trabajar en mejorar sus procesos para hacerlos más justos y transparentes) es lo que quieren los republicanos, y Zuckerberg parece que no tiene muchos problemas en acomodarse a los intereses de Trump y la derecha norteamericana.

Para pensar en forma conjunta sobre la decisión de Meta y su impacto en América Latina, OBSERVACOM convocó a expertos de la región como Martín Becerra, Catalina Botero, João Brant, Vladimir Cortés, Javier Pallero, Patricia Peña, Martha Tudón y Jonas Valente para dialogar en un conversatorio coordinado por Gustavo Gómez.

🎬 Si te interesa podés ver el conversatorio completo acá:

Te comparto algunas lecturas que te pueden interesar 📚

  • Los deepfakes resultaron ser una amenaza diferente a la esperada. A medida que la tecnología que impulsa los deepfakes se ha vuelto más capaz y accesible, surgen dos categorías inmediatas de daño: acoso e ingeniería social. En el caso del acoso, por ejemplo, la creación de contenido pornográfico con la imagen de personas que no dieron su consentimiento (imágenes creadas con sistemas de IA). En el caso de ingeniería social, un ejemplo puede ser el de que una persona puede utilizar IA para clonar la voz de otra y utilizarla para intentar estafar a su familia. Disponible online acá.
  • ¿Malvinas o Falkland? Algunos apuntes sobre soberanía digital, por Martín Gendler. Un ejemplo más de que las tecnologías no son neutrales y de por qué es necesaria la defensa de la soberanía también en los entornos digitales. Después de redactar un escrito en Microsoft Word, el programa señala algunas cosas para corregir y hace sugerencias. Entre las sugerencias aparece una que llama la atención: “referencias geopolíticas sensibles”.
    Así lo relata Gendler:
    ”Al ingresar, nos menciona (en inglés) que ‘el nombre más políticamente neutral es el más conveniente’, señalándonos como problemático nada más y nada menos que el nombre ‘Malvinas’, el cual, dicho sea de paso, estaba siendo utilizado en el escrito para nombrar una localidad del conurbano bonaerense donde viven más de 350 mil personas: Malvinas Argentinas. Pero no solo eso, sino que el corrector acerca una sugerencia de cuál sería ese ‘nombre más políticamente neutral’ y por tanto ‘más conveniente’: ‘The Falkland Islands’”.

Espero te haya resultado interesante este correo. Cualquier cosa, podés escribirme. ¡Que tengas un lindo comienzo de febrero!
Gracias por estar ahí.
Carolina

0 comentarios

Enviar un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Filtros

Telegram Sumate a nuestro canal de Telegram