El reto de la inteligencia artificial: construir un LLM en español para evitar el colonialismo algorítmico
Redacción de CubitaNOW ~ viernes 28 de noviembre de 2025
ChatGPT se ha convertido en la plataforma de mayor crecimiento en la historia de internet, alcanzando un millón de usuarios en cinco días y cien millones en apenas dos meses. Su éxito se explica por la novedad del sistema, su facilidad de uso y el acceso gratuito. Hoy, millones de personas lo emplean para trabajar, estudiar o resolver tareas cotidianas, aunque muchos lo usan —de manera equivocada— como si fuera un buscador.
Sin embargo, más allá de los temores sobre el futuro del trabajo, existen desafíos igual de preocupantes en el entorno iberoamericano. Modelos como ChatGPT, Gemini, Bert o Claude no son una sola tecnología, sino que integran sistemas como los Grandes Modelos de Lenguaje (LLM), entrenados con enormes volúmenes de datos para procesar y generar texto con sorprendente naturalidad.
Según OpenAI, ChatGPT se entrenó con información “pública y gratuita” disponible en internet: páginas web, blogs, foros, Wikipedia, artículos y documentos académicos. Aunque esto da una sensación de diversidad, en la práctica más del 70 % de los datos están en inglés, lo que genera una fuerte influencia cultural anglosajona. Así, las respuestas en español suelen ser traducciones automáticas, con pérdida de matices y expresiones propias.
El problema se agrava porque, aunque el español es la segunda lengua más utilizada en internet, sus contenidos digitales apenas representan un 6 % de la web, frente al 49 % del inglés. Esto se traduce en una invisibilidad cultural que afecta a más de 635 millones de hispanohablantes en 21 países. No hablamos igual en Colombia que en España, y nuestras diferencias históricas, sociales y lingüísticas quedan fuera de los datasets que entrenan los modelos.
Este fenómeno ha sido descrito como colonialismo algorítmico, una forma sutil de dominación cultural donde los valores anglosajones marcan el discurso digital. Estudios como el de la Universidad Complutense advierten que nuestra comunicación en correos, redes sociales y WhatsApp está cambiando: frases más cortas, tono artificial y pérdida de riqueza expresiva, influenciados por textos generados en inglés y traducidos al español.
Ante este panorama, la región necesita con urgencia un LLM en español, capaz de reflejar nuestra diversidad lingüística y cultural. Un proyecto de este tipo no solo permitiría inclusión digital, sino que generaría empleo, conocimiento, recursos y alianzas entre universidades, gobiernos y empresas, además de posicionar a Latinoamérica en el mapa mundial de la inteligencia artificial.
No se trata de imitar a Silicon Valley, sino de construir una ética tecnológica situada en Latinoamérica, que entienda quiénes somos y que produzca tecnología por y para nosotros, con capacidad de exportarse al mundo. El verdadero salto no consiste en hablarle a una máquina en español, sino en enseñarle a pensar desde el español, con nuestros valores, voces y formas de entender la realidad. Solo entonces la inteligencia artificial dejará de traducirnos y comenzará, por fin, a reconocernos.