La lectura obligada de hoy.
Nuestro equipo de narración visual y Madhumita Murgia, nuestra editora de IA, explican la tecnología que sustenta los grandes modelos de lenguaje y por qué esto los convierte en motores cognitivos tan versátiles…
Continúe leyendo para descubrir la historia y lea las respuestas de nuestro editor de IA a sus preguntas más frecuentes sobre inteligencia artificial.
Por Visual Storytelling Team y Madhumita Murgia en Londres
La tecnología ha dado lugar a una gran cantidad de aplicaciones de IA de vanguardia, pero su verdadero poder va más allá de la generación de texto.
Esta tecnología, basada en investigaciones que intentan modelar el cerebro humano, ha llevado a un nuevo campo conocido como IA generativa: software que puede crear textos, imágenes y códigos informáticos plausibles y sofisticados a un nivel que imita la capacidad humana.
Empresas de todo el mundo han comenzado a experimentar con la nueva tecnología con la creencia de que podría transformar los medios, las finanzas, el derecho y los servicios profesionales, así como servicios públicos como la educación. El LLM se basa en un desarrollo científico conocido como modelo transformador, realizado por investigadores de Google en 2017.
«Si bien siempre hemos comprendido la naturaleza innovadora de nuestro trabajo con transformadores, varios años después, nos sentimos entusiasmados por su potencial duradero en nuevos campos, desde la atención médica hasta la robótica y la seguridad, la mejora de la creatividad humana y más», dice Slav Petrov. investigador senior de Google, que trabaja en la creación de modelos de inteligencia artificial, incluidos los LLM.
Los beneficios promocionados de los LLM (la capacidad de aumentar la productividad escribiendo y analizando texto) también son la razón por la que representa una amenaza para los humanos. Según Goldman Sachs, podría exponer a la automatización el equivalente a 300 millones de trabajadores a tiempo completo en las grandes economías, lo que provocaría un desempleo generalizado.
A medida que la tecnología se integra rápidamente en nuestras vidas, comprender cómo los LLM generan texto significa comprender por qué estos modelos son motores cognitivos tan versátiles y qué más pueden ayudar a crear.
Pero esto por sí solo no es lo que hace que los LLM sean tan inteligentes. Lo que desbloqueó sus habilidades para analizar y escribir con tanta fluidez como lo hacen hoy es una herramienta llamada transformador, que aceleró y aumentó radicalmente la forma en que las computadoras entendían el lenguaje.
Los transformadores procesan una secuencia completa a la vez (ya sea una oración, un párrafo o un artículo completo) analizando todas sus partes y no solo palabras individuales.
Esto permite que el software capture mejor el contexto y los patrones, y traduzca (o genere) texto con mayor precisión. Este procesamiento simultáneo también hace que la capacitación de los LLM sea mucho más rápida, lo que a su vez mejora su eficiencia y capacidad de escalar.
La investigación que describe el modelo de transformador fue publicada por primera vez por un grupo de ocho investigadores de IA en Google en junio de 2017 .
Su artículo de investigación de 11 páginas marcó el inicio de la era de la IA generativa.
Un concepto clave de la arquitectura del transformador es la autoatención Esto es lo que permite a los LLM comprender las relaciones entre palabras.
Esta capacidad va más allá de palabras, como interés, que tienen múltiples significados.
En la siguiente frase, autoatención es capaz de calcular que lo más probable es que se esté refiriendo a perro .
Y si modificamos la oración, intercambiando hambre por delicioso , el modelo puede recalcular, y ahora es más probable que se refiera a hueso .
Los beneficios de la autoatención para el procesamiento del lenguaje aumentan cuanto más se amplían las cosas. Permite a los LLM tomar contexto más allá de los límites de las oraciones, brindando al modelo una mayor comprensión de cómo y cuándo se usa una palabra.