POR CARLOS ANGUIANO, FRONTEND ENGINEER
La inteligencia artificial se ha convertido en un término familiar para muchos. A la par, los modelos generativos están democratizando el acceso a herramientas y a capacidades que antes requerían habilidades especializadas y refinadas por años. Para que te adentres en este fascinante mundo, aquí te explicamos qué es y cómo utilizar la inteligencia artificial generativa (IA generativa), así como qué son los Modelos de Lenguaje Natural (LLM).

¿Qué es la inteligencia artificial?

La inteligencia artificial (IA) es una disciplina que busca simular el aprendizaje y el razonamiento humano. Esto permite automatizar tareas y mejorar en cada iteración, haciendo que las máquinas puedan realizar tareas complejas que tradicionalmente requerirían intervención humana.

¿Qué es la IA generativa?

La inteligencia artificial generativa es un tipo de IA que permite crear elementos digitales de forma original, desde texto, imágenes y música, hasta videos. Para lograrlo, se utilizan modelos de IA entrenados con millones de ejemplos sobre un tema o tarea, de modo que el modelo pueda generar respuestas, incluso para "ejemplos" nuevos.

¿Qué son los LLM?

Los LLM natural son sistemas de IA diseñados para interpretar y generar texto en lenguaje natural. Estos modelos se entrenan con grandes cantidades de texto, incluyendo libros, conversaciones, traducciones y chats. Podemos verlos como la evolución del autocompletar de nuestros teléfonos móviles, pero con la capacidad de escribir respuestas complejas y coherentes basadas en el prompt del usuario.

No debemos confundirlos con los LMM (Modelos Multimodales Grandes). Estos son modelos más robustos, preparados para “entender” texto, audio y/o imágenes.

Imagen generada con ChatGPT-4

¿Qué es un prompt?

El prompt es el texto que proporciona el usuario a un LLM para generar una respuesta. A pesar de parecer algo trivial, redactar un prompt de forma correcta puede determinar si la respuesta del LLM es útil o no.

¿Cómo escribir un buen prompt?

Un prompt debe ser claro y puntual, debe guiar al modelo de lenguaje natural en el tema que se desea tratar, así como en el tipo de respuesta que se espera. Una fórmula eficiente para generar un prompt es la siguiente:

  • Rol: indica al LLM su papel en la conversación (por ejemplo, un experto en finanzas, un diseñador gráfico, etc.).
  • Contexto: determina el caso de uso, las condiciones que limitan la interacción y las consideraciones específicas.
  • Instrucciones: define la tarea que se espera que resuelva y las reglas que debe seguir.
  • Formato: especifica cómo se espera la respuesta (listas, tablas, idioma, etc.).
  • Ejemplos: proporciona casos de uso y respuestas similares para ampliar el contexto
    del modelo.
  • Tono: Indica cómo debe enfocarse la respuesta (formal, casual, enojado, etc.).
  • Recomendaciones: frases como "analiza paso a paso antes de responder" pueden mejorar la calidad de la respuesta.

Ejemplo:
Me gustaría entender un poco más sobre el sistema tributario en México.

Prompt:

Actúa como un experto en impuestos mexicanos con amplio conocimiento en el sistema fiscal, las obligaciones de los contribuyentes y las leyes tributarias vigentes.

El usuario necesita una guía básica sobre impuestos en México porque no tiene mucho conocimiento sobre el tema. Está buscando información clara y sencilla sobre cómo cumplir con sus obligaciones fiscales.

Proporciona una explicación detallada y paso a paso sobre los siguientes puntos:

  1. ¿Qué es el RFC y cómo registrarse?
  2. ¿Qué tipos de impuestos existen en México?

Responde en formato de lista numerada para cada punto, proporcionando enlaces a fuentes confiables si es posible. Asegúrate de utilizar un lenguaje claro y accesible.

  1. Registro del RFC: explica qué es el RFC y el proceso para registrarse en el SAT.
  2. Tipos de impuestos: enumera y describe los impuestos federales y locales que los contribuyentes deben pagar.

Utiliza un tono amigable y comprensivo, similar al de un tutor que quiere asegurarse de que el usuario se sienta cómodo y seguro al entender y cumplir con sus obligaciones fiscales.

  • Responde con calma y claridad.
  • Para proporcionar respuestas precisas, si es necesario, busca información actualizada y confiable en internet.

¿Cómo y dónde puedo usar los prompts?

Existen varios modelos de lenguaje que se pueden categorizar en públicos y privados.

Prompts públicos:
Estos LLM son de acceso libre o gratuito y pueden ejecutarse de manera local en una computadora de uso general, requiriendo conocimiento técnico básico. Algunos ejemplos son:

  • Llama3
  • Mistral
  • Gemma
  • Gwen
  • CodeLlama

Una forma simple de probar estos modelos es mediante Ollama, una iniciativa de código abierto para ejecutar modelos de lenguaje.

Prompts privados:
Estos LLM suelen requerir una suscripción y equipo de cómputo especializado. Son más precisos y robustos, y sus modelos especializados están disponibles para investigadores y desarrolladores. Algunos ejemplos son:

  • ChatGPT
  • Gemini
  • Claude 3
  • Mistral

Como podemos ver, la IA generativa y los modelos de lenguaje dejaron de ser ideas futuristas para convertirse en herramientas accesibles con el potencial de cambiar nuestra manera de vivir y trabajar.

Aprender sobre un tema, recibir asistencia o mentoría, superar el bloqueo creativo o mejorar la productividad ahora están a un prompt de distancia. Sólo probar y experimentar con los LLM puede darte una visión más clara del potencial que guardan estas herramientas.