En los últimos años, el uso generalizado de modelos de lenguaje grande (LLM) en las empresas ha aumentado; sin embargo, esto ha creado nuevas oportunidades para los ciberdelincuentes. La inyección de prompt es un tipo de ataque llevado a cabo por personas malintencionadas, que apunta a los puntos en los que los LLM no pueden distinguir entre datos e instrucciones. En el ranking OWASP LLM Top 10 2025, la inyección de prompt fue definida como la vulnerabilidad más crítica con el código LLM01. Esto se debe a la realidad de que los LLM aún no pueden separar las instrucciones de los datos de manera confiable, lo que pone de manifiesto la gravedad de esta vulnerabilidad.

¿Qué ha pasado?

La inyección de prompt ha sido identificada por múltiples fuentes independientes como uno de los vectores de ataque más efectivos y comunes en 2025 y 2026. El Informe Global de Amenazas 2026 de CrowdStrike documentó que este tipo de ataques ocurrieron en más de 90 organizaciones en 2025 y que se utilizaron para robar credenciales y criptomonedas. Ejemplos del mundo real muestran cómo estas vulnerabilidades han sido explotadas en sistemas como Slack AI.

¿Por qué es importante?

La inyección de prompt amenaza directamente la seguridad de los sistemas LLM utilizados por las empresas. Este tipo de ataques puede llevar a acciones no autorizadas en áreas críticas como servicios al cliente y sistemas de automatización, así como a la filtración de datos sensibles y la interrupción de flujos de trabajo internos. En particular, la confianza en las estructuras automáticas de los LLM abre una puerta para los ciberdelincuentes. Por ejemplo, la filtración de información maliciosa a través de líneas RAG (generación aumentada por recuperación) aumenta las debilidades de estos sistemas. Los actores que llevan a cabo ataques cibernéticos de alto nivel se están volviendo más sofisticados con estas nuevas técnicas de ataque, lo que obliga a las empresas a repensar sus estrategias de seguridad.

Tipo de AtaqueDescripciónCaso de Ejemplo
Inyección de PromptInstrucciones maliciosas enviadas por el usuario al LLMVulnerabilidad de Slack AI
Manipulación de Direccionamiento del ModeloApuntar a modelos débilesAtaque a Microsoft 365 Copilot
Envenenamiento de MemoriaAgregar instrucciones dañinas a la memoria a largo plazo-

Entre las medidas que se pueden tomar contra estos ataques se incluyen la restricción de permisos del modelo, la segmentación de contenido no confiable y el monitoreo de flujos internos. Las empresas deben considerar a los LLM no solo como herramientas poderosas, sino también como amenazas potenciales, fortaleciendo así sus estrategias de seguridad.

¿Qué sigue?

En el futuro, la seguridad de los sistemas basados en LLM cobrará mayor importancia. Las empresas necesitarán seguir prácticas de seguridad actualizadas de manera continua para proteger los datos de los usuarios y aumentar la confiabilidad de los sistemas automáticos. Además, dado la evolución de las amenazas cibernéticas, las organizaciones deben reevaluar sus expectativas de los LLM y desarrollar estrategias para abordar las vulnerabilidades.

En conclusión, la inyección de prompt se destaca como una vulnerabilidad que explota la lógica fundamental de funcionamiento de los sistemas de inteligencia artificial. Es crucial que las empresas abandonen la costumbre de ver a los LLM como tomadores de decisiones confiables y comiencen a evaluarlos como amenazas potenciales.