.
ESTADOS UNIDOS

Google y Microsoft están creando un monopolio sobre la codificación en lenguaje sencillo

miércoles, 8 de septiembre de 2021
Foto: Reuters

En los últimos años, empresas como OpenAI y Google han mejorado rápidamente las tecnologías de procesamiento del lenguaje natural

Reuters

A veces, los cambios importantes pasan prácticamente desapercibidos. El 5 de mayo, IBM anunció el Proyecto CodeNet con muy poca atención académica o de los medios de comunicación.

CodeNet es una continuación de ImageNet, un conjunto de datos a gran escala de imágenes y sus descripciones; las imágenes son gratuitas para usos no comerciales. ImageNet ahora es fundamental para el progreso del aprendizaje profundo de la visión por computadora.

CodeNet es un intento de hacer para la codificación de inteligencia artificial (IA) lo que ImageNet hizo para la visión por computadora: es un conjunto de datos de más de 14 millones de muestras de código, que cubren 50 lenguajes de programación, destinados a resolver 4.000 problemas de codificación. El conjunto de datos también contiene numerosos datos adicionales, como la cantidad de memoria necesaria para que el software se ejecute y registre las salidas del código en ejecución.

El propio fundamento de IBM para CodeNet es que está diseñado para actualizar rápidamente los sistemas heredados programados en código desactualizado, un desarrollo largamente esperado desde el pánico del Y2K hace más de 20 años, cuando muchos creían que los sistemas heredados indocumentados podrían fallar con consecuencias desastrosas.

Sin embargo, como investigadores de seguridad, creemos que la implicación más importante de CodeNet, y proyectos similares, es el potencial para reducir las barreras y la posibilidad de la codificación en lenguaje natural (NLC).

En los últimos años, empresas como OpenAI y Google han mejorado rápidamente las tecnologías de procesamiento del lenguaje natural (NLP). Estos son programas impulsados ​​por el aprendizaje automático diseñados para comprender e imitar mejor el lenguaje humano natural y traducir entre diferentes idiomas. El entrenamiento de sistemas de aprendizaje automático requiere acceso a un gran conjunto de datos con textos escritos en los lenguajes humanos deseados. NLC también aplica todo esto a la codificación.

La codificación es una habilidad difícil de aprender, y mucho menos dominar, y se esperaría que un codificador experimentado dominara varios lenguajes de programación. NLC, por el contrario, aprovecha las tecnologías de PNL y una vasta base de datos como CodeNet para permitir que cualquiera use el inglés, o en última instancia, el francés, el chino o cualquier otro idioma natural para codificar. Podría hacer que tareas como diseñar un sitio web fueran tan simples como escribir "hacer un fondo rojo con la imagen de un avión, el logotipo de mi empresa en el medio y un botón de contacto debajo", y ese sitio web exacto surgiría, el resultado de la traducción automática del lenguaje natural al código.

Está claro que IBM no estaba solo en su pensamiento. GPT-3, el modelo de PNL líder en la industria de OpenAI, se ha utilizado para permitir la codificación de un sitio web o una aplicación escribiendo una descripción de lo que desea. Poco después de las noticias de IBM, Microsoft anunció que se había asegurado los derechos exclusivos de GPT-3.

Microsoft también es propietario de GitHub, la colección más grande de código fuente abierto en Internet, adquirida en 2018. La compañía ha aumentado el potencial de GitHub con GitHub Copilot, un asistente de inteligencia artificial. Cuando el programador ingresa la acción que desea codificar, Copilot genera una muestra de codificación que podría lograr lo que especificó. El programador puede aceptar la muestra generada por IA, editarla o rechazarla, simplificando drásticamente el proceso de codificación. Copilot es un gran paso hacia NLC, pero aún no ha llegado.

Aunque NLC aún no es completamente factible, nos estamos moviendo rápidamente hacia un futuro donde la codificación es mucho más accesible para la persona promedio. Las implicaciones son enormes.

Primero, hay consecuencias para la investigación y el desarrollo. Se argumenta que cuanto mayor es el número de innovadores potenciales, mayor es la tasa de innovación. Al eliminar las barreras a la codificación, se expande el potencial de innovación a través de la programación.

Además, disciplinas académicas tan variadas como la física computacional y la sociología estadística dependen cada vez más de programas informáticos personalizados para procesar datos. La disminución de la habilidad requerida para crear estos programas aumentaría la capacidad de los investigadores en campos especializados fuera de las ciencias de la computación para implementar tales métodos y hacer nuevos descubrimientos.

Sin embargo, también existen peligros. Irónicamente, uno es la desdemocratización de la codificación. Actualmente, existen numerosas plataformas de codificación. Algunas de estas plataformas ofrecen características variadas que favorecen a diferentes programadores, sin embargo, ninguna ofrece una ventaja competitiva. Un nuevo programador podría usar fácilmente una terminal de codificación "básica" y estar en una pequeña desventaja.

Sin embargo, la IA al nivel requerido para NLC no es barata de desarrollar o implementar, y es probable que esté monopolizada por las principales corporaciones de plataformas como Microsoft, Google o IBM. El servicio puede ofrecerse por una tarifa o, como la mayoría de los servicios de redes sociales, de forma gratuita pero con condiciones desfavorables o de explotación para su uso.

También hay motivos para creer que estas tecnologías estarán dominadas por las corporaciones de plataformas debido a la forma en que funciona el aprendizaje automático. En teoría, los programas como Copilot mejoran cuando se introducen nuevos datos: cuanto más se utilizan, mejores se vuelven. Esto hace que sea más difícil para los nuevos competidores, incluso si tienen un producto más fuerte o más ético.

A menos que haya un serio contraesfuerzo, parece probable que los grandes conglomerados capitalistas sean los guardianes de la próxima revolución de la codificación.

Conozca los beneficios exclusivos para
nuestros suscriptores

ACCEDA YA SUSCRÍBASE YA

MÁS DE GLOBOECONOMÍA

España 22/04/2024 BCE sanciona a Santander, BBVA y otros 27 bancos por errores en sus reservas mínimas

El BCE ha desvelado que ha impuesto sanciones en los últimos meses a BBVA y a Santander en Alemania por errores en su gestión

Panamá 24/04/2024 First Quantum podría retirar el cobre de la mina de Panamá luego de las elecciones

La compañía canadiense ha estado negociando con el gobierno panameño para que le permita vender el cobre que extraía antes de que comenzara el conflicto

Ecuador 22/04/2024 Partido de Correa respaldará reformas de seguridad pero se opondrá al Gobierno en Ecuador

Los cambios tienen como objetivo combatir el aumento de la violencia que ha aparecido en los titulares internacionales