Inteligencia artificial sin tecnicismos: un glosario para sacar el mayor provecho a esta tecnología

Todo el mundo habla de inteligencia artificial, pero no siempre queda claro de qué se trata exactamente. Entre siglas, anglicismos y términos que suenan a ciencia ficción, es fácil perderse. Para ponerle nombre preciso a esa conversación, verificamos y ampliamos 20 definiciones organizadas en bloques temáticos que van desde los fundamentos hasta las implicaciones éticas del campo.
El punto de partida es sencillo: la inteligencia artificial no es magia ni ciencia ficción. Son sistemas informáticos diseñados para imitar la forma en que los humanos pensamos, aprendemos y resolvemos problemas. Su insumo indispensable son los datos. Sin ellos, el sistema no tiene base para operar. El hito que masificó su uso fue el lanzamiento de ChatGPT a finales de 2022, que presentó la IA generativa a millones de personas en todo el mundo y desencadenó una nueva fase de desarrollo acelerado. Hoy, la potencia computacional de la IA se duplica cada seis meses, un ritmo que hasta hace poco tomaba cerca de veinte meses.
Cómo aprende una máquina
Dentro de la IA conviven varias familias de métodos. El machine learning agrupa técnicas diseñadas para procesar datos estructurados, detectar patrones y generar predicciones sin ser programadas explícitamente para cada tarea. Es lo que permite que Spotify recomiende canciones o que Amazon sugiera productos. Cuando los datos son más complejos y el volumen es mayor, entra en juego el deep learning, la rama más avanzada del machine learning: se inspira en la arquitectura del cerebro humano y aprende características de manera autónoma, sin que nadie le indique qué atributos son relevantes. Lo usamos sin darlo cuenta cuando el celular reconoce nuestra cara para desbloquearse o cuando el traductor entiende frases completas en otro idioma.
La estructura interna de estos sistemas se llama red neuronal, porque intenta copiar cómo se conectan las neuronas en el cerebro para procesar información compleja. Su "tamaño" se mide en parámetros, es decir, las conexiones internas que el modelo ajusta durante su aprendizaje. GPT-1 contaba con 120 millones de parámetros; GPT-2 alcanzó 1.500 millones; GPT-3 llegó a 175.000 millones. GPT-4 supera el billón según estimaciones del sector, aunque OpenAI no ha confirmado esa cifra de manera oficial.
Los modelos que conversan
El modelo de lenguaje grande, conocido por sus siglas en inglés como LLM, es el cerebro detrás de aplicaciones como ChatGPT o Gemini. Básicamente, es un sistema que ha procesado cantidades masivas de texto para aprender a conversar, resumir, traducir y redactar como lo haría una persona. Para entenderlo internamente, hay que conocer dos conceptos: los tokens y el contexto.
Los tokens son las unidades mínimas con que la IA lee y escribe, algo parecido a sílabas o fragmentos de palabras. En español, una palabra equivale en promedio a dos tokens, y un token corresponde a entre cuatro y cinco caracteres. El contexto, por su parte, es la memoria de trabajo del modelo dentro de una conversación: cuando se supera ese límite, el sistema puede perder el hilo de instrucciones anteriores. GPT-3.5 admite alrededor de 4.000 tokens; GPT-4 Turbo escala hasta 128.000; Gemini 1.5, de Google DeepMind, supera el millón. Esa diferencia es decisiva cuando se necesita analizar documentos extensos o mantener intercambios largos. Finalmente, la inferencia es el proceso técnico que ocurre entre el momento en que el usuario presiona "enviar" y el instante en que aparece la respuesta en pantalla; GPT-4o logra latencias de voz de aproximadamente 320 milisegundos.
El arte de hablarle bien a la IA
Un prompt es la instrucción o pregunta que el usuario escribe para iniciar o guiar una interacción. Instrucciones vagas producen respuestas genéricas; instrucciones detalladas y con contexto producen respuestas precisas. El prompt engineering sistematiza ese diseño: va más allá de escribir bien e implica entender cómo razona el modelo. Una de sus técnicas más efectivas es la cadena de pensamiento, en la que se le pide al sistema que exponga su razonamiento paso a paso antes de dar la respuesta final. Quienes trabajan con Ciencia de Datos o con modelos de lenguaje a diario reconocen esta habilidad como una de las más valoradas en entornos profesionales y académicos.
Dos estrategias complementan ese arsenal. El zero-shot consiste en pedirle a la IA que realice una tarea sin proporcionarle ejemplos previos, apoyándose en su conocimiento general. El few-shot va un paso más allá: antes de la solicitud real, se le presentan dos o tres muestras del resultado esperado para que aprenda por patrón. La diferencia puede ser decisiva: en un caso documentado sobre codificación médica, añadir ejemplos al prompt elevó la precisión del modelo de 0 % a 90 %.
Técnicas avanzadas y uso responsable
Cuando se necesita que la IA responda con información propia de una organización, en lugar de limitarse a lo que memorizó durante su entrenamiento, entra el RAG (Retrieval Augmented Generation o Generación Aumentada por Recuperación). El sistema consulta documentos internos, bases de datos o PDFs, y construye la respuesta combinando ese material con el conocimiento del modelo. Es como darle un libro abierto durante un examen. Esa técnica reduce significativamente las alucinaciones, que ocurren cuando la IA genera información incorrecta o inventada pero la presenta con total seguridad lingüística. En el fondo, el modelo es un predictor de palabras basado en probabilidades, no una mente con comprensión del mundo real.
Para especializarlo en un dominio concreto existe el fine-tuning, un entrenamiento adicional con datos propios que lo hace experto en una tarea específica, del mismo modo en que un médico general se especializa en cardiología. Los agentes de IA, por su parte, llevan la autonomía más lejos todavía: perciben su entorno, toman decisiones, usan herramientas externas y encadenan múltiples pasos sin intervención humana constante.
Toda esa capacidad, sin embargo, viene con advertencias. El sesgo es el conjunto de prejuicios que el modelo hereda de su corpus de entrenamiento. Como ese corpus proviene en gran medida de internet y de producción humana, los sistemas pueden reproducir y amplificar estereotipos culturales, de género o socioeconómicos. Reconocer y gestionar esos sesgos es un requisito ético para cualquier implementación responsable, y una conversación que cobra relevancia creciente en los entornos académicos e investigativos alineados con el Proyecto Educativo Institucional de la Universidad de La Sabana.
Dos términos completan el panorama. El código abierto reúne los modelos cuyos pesos y arquitectura se publican con licencias que permiten su descarga, modificación y uso libre, lo que representa un contrapeso a la concentración de tecnología de frontera en grandes laboratorios privados y abre posibilidades reales para universidades e investigadores independientes. La multimodalidad, por su parte, define el nuevo estándar de los modelos más avanzados: ya no solo procesan texto, sino también voz, imágenes, video y documentos, todo al mismo tiempo. GPT-4o, lanzado por OpenAI en mayo de 2024, es uno de sus referentes más conocidos.
Conocer estos términos permite participar con criterio en una conversación que ya permea la investigación, la docencia y la vida cotidiana en el campus.
La Universidad de La Sabana cuenta con 47 programas en inteligencia artificial dentro de su portafolio de programas de pregrado, posgrado y educación continua. Se destacan la carrera de Ingeniería en Inteligencia Artificial, Ciencia de Datos; las maestrías en Analítica Aplicada e Inteligencia Artificial y el Doctorado en Inteligencia Artificial, una ruta formativa que responde a las exigencias de un campo que no da pausa.
Artículos relacionados

CONTACTO
Tus comentarios y preguntas son importantes para nosotros. Diligencia este formulario y nos pondremos en contacto. También puedes venir a visitarnos y resolveremos tus dudas.