¿Qué son los modelos de lenguaje extenso (LLM) y cómo funcionan?

Los modelos de lenguaje extenso (LLM) son la tecnología subyacente que ha impulsado el ascenso meteórico de los chatbots generativos de IA. Herramientas como ChatGPT, Google Bard y Bing Chat se basan en LLM para generar respuestas similares a las humanas a sus indicaciones y preguntas.

Pero, ¿qué son los LLM y cómo funcionan? Aquí nos propusimos desmitificar los LLM.

¿Qué es un modelo de lenguaje grande?

En sus términos más simples, un LLM es una base de datos masiva de datos de texto a la que se puede hacer referencia para generar respuestas similares a las humanas a sus indicaciones. El texto proviene de una variedad de fuentes y puede ascender a miles de millones de palabras.

Entre las fuentes comunes de datos de texto utilizadas se encuentran:

Literatura : los LLM a menudo contienen enormes cantidades de literatura contemporánea y clásica. Esto puede incluir libros, poesía y obras de teatro.

Contenido en línea : un LLM generalmente contendrá un gran depósito de contenido en línea, incluidos blogs, contenido web, preguntas y respuestas de foros y otros textos en línea.

Noticias y temas de actualidad : algunos LLM, pero no todos, pueden acceder a temas de actualidad. Ciertos LLM, como GPT-3.5, están restringidos en este sentido.

Redes Sociales : Las redes sociales representan un enorme recurso de lenguaje natural. Los LLM usan texto de las principales plataformas como Facebook, Twitter e Instagram.

Por supuesto, tener una gran base de datos de texto es una cosa, pero los LLM deben estar capacitados para darle sentido y producir respuestas similares a las humanas. Cómo lo hace es lo que cubrimos a continuación.

¿Cómo funcionan los LLM?

¿Cómo utilizan los LLM estos repositorios para crear sus respuestas? El primer paso es analizar los datos mediante un proceso llamado aprendizaje profundo.

El aprendizaje profundo se utiliza para identificar los patrones y matices del lenguaje humano. Esto incluye obtener una comprensión de la gramática y la sintaxis. Pero, lo que es más importante, también incluye contexto. Comprender el contexto es una parte crucial de los LLM.

Veamos un ejemplo de cómo los LLM pueden usar el contexto.

El aviso en la siguiente imagen menciona ver un murciélago en la noche. A partir de esto, ChatGPT entendió que estábamos hablando de un animal y no, por ejemplo, de un bate de béisbol. Por supuesto, otros chatbots como Bing Chat o Google Bard pueden responder esto de manera completamente diferente.

Sin embargo, no es infalible y, como muestra este ejemplo, a veces necesitará proporcionar información adicional para obtener la respuesta deseada.

En este caso, lanzamos deliberadamente un poco de bola curva para demostrar con qué facilidad se pierde el contexto. Pero los humanos también pueden malinterpretar el contexto de las preguntas, y solo necesitan un aviso adicional para corregir la respuesta.

Para generar estas respuestas, los LLM utilizan una técnica llamada generación de lenguaje natural (NLG). Esto implica examinar la entrada y usar los patrones aprendidos de su depósito de datos para generar una respuesta contextualmente correcta y relevante.

Pero los LLM van más allá de esto. También pueden adaptar las respuestas para que se adapten al tono emocional de la entrada. Cuando se combinan con la comprensión contextual, las dos facetas son los principales impulsores que permiten a los LLM crear respuestas similares a las humanas.

En resumen, los LLM utilizan una base de datos de texto masiva con una combinación de técnicas de aprendizaje profundo y NLG para crear respuestas similares a las humanas a sus indicaciones. Pero hay limitaciones a lo que esto puede lograr.

¿Cuáles son las limitaciones de los LLM?

Los LLM representan un logro tecnológico impresionante. Pero la tecnología está lejos de ser perfecta y todavía hay muchas limitaciones en cuanto a lo que pueden lograr. Algunos de los más notables se enumeran a continuación:

Comprensión contextual: mencionamos esto como algo que los LLM incorporan en sus respuestas. Sin embargo, no siempre lo hacen bien y, a menudo, no pueden entender el contexto, lo que lleva a respuestas inapropiadas o simplemente incorrectas.

Sesgo: cualquier sesgo presente en los datos de entrenamiento a menudo puede estar presente en las respuestas. Esto incluye prejuicios hacia el género, la raza, la geografía y la cultura.

Sentido común: el sentido común es difícil de cuantificar, pero los humanos aprenden esto desde una edad temprana simplemente observando el mundo que los rodea. Los LLM no tienen esta experiencia inherente a la que recurrir. Solo entienden lo que se les ha proporcionado a través de sus datos de entrenamiento, y esto no les da una verdadera comprensión del mundo en el que existen.

Un LLM es tan bueno como sus datos de entrenamiento: nunca se puede garantizar la precisión. El viejo adagio informático de "Basura entra, basura sale" resume perfectamente esta limitación. Los LLM son tan buenos como la calidad y la cantidad de sus datos de capacitación les permiten ser.

También existe el argumento de que las preocupaciones éticas pueden considerarse una limitación de los LLM, pero este tema queda fuera del alcance de este artículo.

3 ejemplos de LLM populares

El avance continuo de la IA ahora está respaldado en gran medida por los LLM. Entonces, si bien no son exactamente una nueva tecnología, ciertamente han alcanzado un punto crítico y ahora hay muchos modelos.

Estos son algunos de los LLM más utilizados.

1. GPT

Transformador preentrenado generativo (GPT) es quizás el LLM más conocido. GPT-3.5 impulsa la plataforma ChatGPT utilizada para los ejemplos de este artículo, mientras que la versión más reciente, GPT-4, está disponible a través de una suscripción a ChatGPT Plus . Microsoft también utiliza la última versión en su plataforma Bing Chat .

2. LaMDA

Este es el LLM inicial utilizado por Google Bard, el chatbot de IA de Google. La versión con la que se lanzó inicialmente Bard se describió como una versión "ligera" del LLM. La iteración PaLM más poderosa del LLM reemplazó esto.

3. BERT

BERT significa Representación de codificador bidireccional de transformadores. Las características bidireccionales del modelo diferencian a BERT de otros LLM como GPT .

Se han desarrollado muchos más LLM, y las derivaciones son comunes de los principales LLM. A medida que se desarrollen, seguirán creciendo en complejidad, precisión y relevancia. Pero, ¿qué depara el futuro para los LLM?

El futuro de los LLM

Estos, sin duda, darán forma a la forma en que interactuamos con la tecnología en el futuro. La rápida aceptación de modelos como ChatGPT y Bing Chat es un testimonio de este hecho. A corto plazo, es poco probable que la IA lo reemplace en el trabajo . Pero todavía hay incertidumbre sobre qué papel jugarán en nuestras vidas en el futuro.

Los argumentos éticos aún pueden tener algo que decir sobre cómo integramos estas herramientas en la sociedad. Sin embargo, dejando esto a un lado, algunos de los desarrollos LLM esperados incluyen:

Eficiencia mejorada : con los LLM que presentan cientos de millones de parámetros, consumen muchos recursos. Con mejoras en el hardware y los algoritmos, es probable que sean más eficientes energéticamente. Esto también acelerará los tiempos de respuesta.

Conciencia contextual mejorada : los LLM son autodidactas; cuanto más uso y comentarios reciben, mejores se vuelven. Es importante destacar que esto es sin ninguna ingeniería importante adicional. A medida que avanza la tecnología, esto verá mejoras en las capacidades lingüísticas y la conciencia contextual.

Capacitado para tareas específicas : las herramientas de Jack-of-all-trade que son la cara pública de los LLM son propensas a errores. Pero a medida que se desarrollan y los usuarios los capacitan para necesidades específicas, los LLM pueden desempeñar un papel importante en campos como la medicina, el derecho, las finanzas y la educación.

Mayor integración : los LLM podrían convertirse en asistentes digitales personales. Piensa en Siri con esteroides y te haces una idea. Los LLM podrían convertirse en asistentes virtuales que lo ayuden con todo, desde sugerir comidas hasta manejar su correspondencia.

Estas son solo algunas de las áreas en las que es probable que los LLM se conviertan en una parte más importante de la forma en que vivimos.

LLM Transformando y Educando

Los LLM están abriendo un apasionante mundo de posibilidades. El rápido aumento de los chatbots como ChatGPT, Bing Chat y Google Bard es evidencia de los recursos que se invierten en el campo.

Tal proliferación de recursos solo puede hacer que estas herramientas se vuelvan más poderosas, versátiles y precisas. Las aplicaciones potenciales de tales herramientas son amplias y, por el momento, solo estamos arañando la superficie de un recurso nuevo e increíble.

¿Qué son los modelos de lenguaje extenso (LLM) y cómo funcionan?

Publicar un comentario

Buscar este blog

SÍGUENOS

ENTRADAS POPULARES

Las 7 mejores alternativas gratuitas de Microsoft Office para Mac

Cómo arreglar el bloqueo de Microsoft Edge al imprimir en Windows 11

Windows 11 24H2 contará con Super Resolution para todas las aplicaciones

Aprende a como usar Windows System Restore y dejar tu PC en un punto de restauración

Noticia

COMENTARIOS

www.recursosinformaticos.org

www.recursosinformaticos.org

Product Services

Best Services

Footer Copyright

#buttons=(Accept !) #days=(20)

Contact form