01 / 28
UDEC ODC 2025
Objeto Digital de Conocimiento

Riesgos de la IA Generativa
en la Seguridad del SDLC

Exploración sistemática de los riesgos de seguridad que introducen los modelos de lenguaje grandes (LLM) en el ciclo de vida del desarrollo de software, fundamentada en 38 estudios científicos con metodología PRISMA 2020.

Módulos9 unidades temáticas · navegación no lineal
Pantallas25 pantallas interactivas con evaluación integrada
Referencias25 citas APA 7 · 38 estudios · metodología PRISMA 2020
Marco legalEU AI Act · NIST AI RMF · OWASP LLM Top-10
Escobar Sarmiento, B.E. Martínez Gaitán, E.A.
Vulnerabilidades
40%
Código Copilot
con CWE activos
Reducción
85%+
Con técnica
SVEN aplicada
ODC · Narrador
EN VIVO
Brayan Escobar Sarmiento
Co-autor · UDEC CTI · 2025
● ONLINEAPA 7PRISMA
CC BY 4.0
S02 Primera Entrada — Resultado Esperado de Aprendizaje y Población Objetivo Pantalla 02 · Primera Entrada
REA Resultado Esperado de Aprendizaje

"Al finalizar el ODC, el estudiante evaluará los riesgos de seguridad que introduce la IA generativa en el SDLC, a partir del análisis crítico de 38 estudios científicos con metodología PRISMA 2020, identificando vulnerabilidades CWE, herramientas de mitigación y marcos regulatorios aplicables, evidenciado por un resultado igual o superior al 80 % en la evaluación sumativa final."

Verbo de desempeñoEvaluará — nivel de análisis y valoración crítica (Taxonomía de Bloom revisada)
ContenidoRiesgos de seguridad de la IA generativa en las 6 fases del SDLC
CondiciónAnálisis crítico de 38 estudios científicos con metodología PRISMA 2020
Criterio de logro≥ 80 % en evaluación sumativa final (8 / 10 ítems correctos — Pantalla S27)
P.O. Población Objetivo
🎓
Estudiantes de la Especialización en Gerencia para la Transformación Digital — Universidad de Cundinamarca
💻
Ingenieros y desarrolladores de software que integran o planean integrar herramientas de IA generativa (Copilot, ChatGPT, CodeWhisperer)
🏢
Líderes técnicos y gestores de proyectos con equipos de desarrollo que usan asistentes de IA
🔒
Profesionales interesados en seguridad del software, DevSecOps y gobernanza de IA
Conocimiento previo sugerido: Fundamentos de programación y SDLC. No se requiere experiencia previa en seguridad informática.
Infografía: ruta de aprendizaje del ODC — 9 módulos hacia la evaluación del riesgo IA en el SDLC
Figura 0. Ruta de aprendizaje del ODC: 9 módulos, 18 actividades formativas y evaluación sumativa.
Nota. Imagen generada con Gemini (Google, 2025).
UDEC M1 · 2025
Módulo 1 de 9 · Pantallas S05–S06

Contexto: IA Generativa

Cómo funcionan los LLMs que generan código, por qué su adopción masiva en el 92% de los equipos de desarrollo plantea riesgos sistémicos, y qué demuestran los primeros estudios científicos al respecto.

PantallasS05 · LLMs y Adopción Global · S06 · El Problema Central
Adopción92% de developers usan IA semanalmente (Stack Overflow, 2023)
EvidenciaPerry et al. (2023) · Pearce et al. (2022) · Chen et al. (2021)
Hallazgo claveBrecha de percepción — más IA ≠ código más seguro
Adopción global
92%
Developers con IA
semanalmente
Código CWE
40%
Copilot con
vulnerabilidades
M1 · Narrador
EN VIVO
E.A. Martínez Gaitán
Co-autor · UDEC CTI · 2025
● ONLINELLMIA Gen.
CC BY 4.0
S05 Arquitectura LLM y Adopción Global
📝
Prompt
Instrucción del developer
al asistente de IA
🧠
Transformer
Atención multi-cabeza
Vaswani et al., 2017
🎯
Tokens LLM
GPT-4 · Codex
LLaMA · StarCoder
💻
Código Generado
Python · C · Java · JS…
92%
Developers usan IA semanalmente
Stack Overflow, 2023
1.3M+
Repos activos con Copilot
GitHub, 2023
54M
Repositorios en corpus Codex
Chen et al., 2021
Flujo LLM — del prompt al código generado
Pantalla 05Módulo 1
Flujo LLMLa seguridad del código generado depende directamente de la calidad del corpus de entrenamiento.
Figura 1. Diagrama del flujo de procesamiento de un modelo de lenguaje grande (LLM), desde el corpus de entrenamiento hasta el código generado.
Nota. Imagen generada con Gemini (Google, 2025).
Conceptos Fundamentales
Transformer (Vaswani et al., 2017): mecanismo de atención que permite procesar contextos de miles de tokens — base de GPT-4, Codex y LLaMA.
Codex (Chen et al., 2021): entrenado en 54 millones de repos GitHub. Hereda vulnerabilidades del corpus de entrenamiento.
Adopción masiva: 92% de developers lo usan semanalmente (Stack Overflow, 2023) — el riesgo individual se convierte en riesgo organizacional.
¿Por qué la IA puede generar código con errores de seguridad?
S06 El Problema Central — Evidencia Empírica
⚠️ Perry et al. (2023) — 47 developers
Producen código con más vulnerabilidades que el grupo sin IA
😌Se perciben más seguros — brecha de percepción cognitiva
🔓Menos propensión a revisar críticamente el código
🧪Estudio controlado: 5 tareas de programación real
📊 Pearce et al. (2022) — GitHub Copilot
🔬40% del código generado tiene ≥1 vulnerabilidad CWE
🖥️En C: 50% de fragmentos evaluados son vulnerables
🧪1,689 fragmentos en 89 escenarios CWE Top-25
📋CWE-787, CWE-089 y CWE-079 son las más frecuentes
Brecha de percepción (Perry et al., 2023): el riesgo no es solo técnico — también es psicológico. Los developers que usan IA se sienten más seguros pero producen código más vulnerable, lo que reduce su vigilancia al revisar. Este es el hallazgo más crítico de la revisión sistemática.
Pantalla 06Módulo 1
Dos Estudios ClavePerry (2023) documenta el riesgo cognitivo; Pearce (2022), el riesgo técnico cuantificado.
Lo que esto significa para ti como desarrollador
La brecha de percepción es el hallazgo más crítico: usar IA puede hacerte sentir más eficiente y seguro, pero la evidencia muestra lo contrario si no hay revisión activa. Este ODC existe para cerrar esa brecha: darte el conocimiento respaldado por 38 estudios científicos para que uses la IA con conciencia real de sus riesgos.
Verdadero o Falso
"Los desarrolladores que usan IA producen código más seguro y son más conscientes de los riesgos que quienes no la usan."
UDEC M2 · 2025
Módulo 2 de 9 · Pantallas S08–S09

SDLC Seguro

Por qué la seguridad debe integrarse desde el primer día del proyecto — no al final — y cómo los controles automáticos en cada fase reducen el costo de corrección hasta 100 veces.

PantallasS08 · Fases del SDLC y Costo · S09 · Pipeline DevSecOps
EnfoqueShift Left Security (Seacord, 2013) · detección temprana
Costo1× desarrollo · 6× pruebas · 30–100× producción
PipelineSAST automático en cada commit · revisión obligatoria de IA
Costo prod.
100×
vs corrección
en desarrollo
Fases SDLC
6
etapas bajo
análisis de riesgo
M2 · Narrador
EN VIVO
Brayan Escobar Sarmiento
Co-autor · UDEC CTI · 2025
● ONLINESDLCDevSecOps
CC BY 4.0
S08 Fases del SDLC — Puntos de Riesgo IA
📋
Requisitos
IA genera specs sin criterios de seguridad
Riesgo Medio
🏗️
Diseño
Arquitecturas con brechas de autenticación
Riesgo Medio
💻
Implementación
40% CWE (Pearce, 2022)
Crítico
🧪
Pruebas
IA omite edge cases de seguridad
Crítico
🚀
Despliegue
Secretos expuestos en pipelines
Monitorear
🔧
Mantenimiento
Parches con regresiones
Monitorear
Costo de corrección por fase — Shift Left · Seacord (2013)
💻 Desarrollo
1× línea base
🧪 Pruebas
6× más costoso
🚀 Producción
30–100× más costoso
Pantalla 08Módulo 2
SDLC + CostoLas fases resaltadas son las de mayor riesgo. El costo se multiplica exponencialmente si no se detecta en desarrollo.
Shift Left Security
¿Qué es? Detectar y corregir vulnerabilidades cuanto antes en el desarrollo — no al final.
Costo (Seacord, 2013): 1× en desarrollo · 6× en pruebas · 30–100× en producción.
Con IA: el análisis SAST automático en cada commit es el control mínimo para código generado.
Verdadero o Falso
"Detectar una vulnerabilidad en producción puede costar entre 30 y 100 veces más que detectarla durante el desarrollo."
S09 Pipeline DevSecOps — Seguridad Continua
DevSecOps integra seguridad en cada fase del SDLC — no al final. Con IA generativa se añaden dos etapas nuevas: análisis específico del código IA y gobernanza regulatoria.
📋 Plan · Code
Threat modeling · Plugins de seguridad en el IDE · Pre-commit hooks para secretos
🔨 Build · Test
SAST (SonarQube, Semgrep) · SCA (Dependabot) · Pruebas de seguridad unitarias
🚀 Release · Deploy
DAST (OWASP ZAP) · Escaneo de contenedores · Gestión de secretos (Vault)
📊 Monitor · Operate
SIEM · IDS/IPS · Respuesta a incidentes · Gestión de parches
🤖 IA-Específico
SAST en código generado por IA · Auditoría de prompts · Validación de salidas
⚖️ Gobernanza IA
EU AI Act · NIST AI RMF · Inventario de herramientas y modelos IA
Pipeline DevSecOps con 6 etapas
Pantalla 09Módulo 2
Pipeline DevSecOpsLos dos últimos pasos (IA-Específico y Gobernanza IA) son nuevos e indispensables en proyectos con LLM.
Figura 2. Infografía del pipeline DevSecOps de seis etapas integrado con controles específicos para proyectos con IA generativa.
Nota. Imagen generada con Gemini (Google, 2025).
¿Para qué sirve cada herramienta?
SAST (Análisis Estático): SonarQube, Semgrep — revisa el código sin ejecutarlo. Como un corrector que detecta errores antes de publicar.
SCA (Composición de Software): Dependabot — verifica que las dependencias sugeridas por IA no tengan vulnerabilidades conocidas.
DAST (Análisis Dinámico): OWASP ZAP — prueba la app en ejecución en un ambiente seguro.
Secrets scanning: Gitleaks — detecta contraseñas escritas en el código (CWE-798) antes de hacer push.
¿Cuál herramienta escanea el código en busca de vulnerabilidades ANTES de que se ejecute?
UDEC M3 · 2025
Módulo 3 de 9 · Pantallas S11–S12

Herramientas de IA para Código

Las cuatro herramientas de IA más usadas para programar: capacidades, perfil de riesgo y criterios de selección basados en evidencia científica — solo una detecta CWE de forma nativa.

PantallasS11 · Perfiles de Herramientas · S12 · Análisis Comparativo
HerramientasGitHub Copilot · ChatGPT/GPT-4 · CodeWhisperer · Tabnine
Criterio claveAnálisis de CWE nativo en tiempo real durante la codificación
HallazgoCodeWhisperer es la única con detección de seguridad nativa
Herramientas
4
evaluadas con
perfil de riesgo
Mejor segur.
AWS
CodeWhisperer
CWE nativo
M3 · Narrador
EN VIVO
Narrador · ODC 2025
Co-autor · UDEC CTI · 2025
● ONLINEAWSCWE
CC BY 4.0
S11 Perfil de Herramientas IA — Capacidades y Riesgos
No todas las herramientas de IA para programar tienen el mismo perfil de riesgo. Esta pantalla compara las cuatro más usadas para que puedas elegir la más adecuada según el contexto y aplicar los controles correctos.
🤖GitHub CopilotOpenAI Codex
  • Autocompletado en tiempo real (IDE integrado)
  • Entrenado en 54M repositorios GitHub
  • 40% de código con CWE (Pearce, 2022)
  • Sin análisis de seguridad nativo incluido
💬ChatGPT / GPT-4Multimodal
  • Generación por chat, explicación y refactoring
  • No especializado en código exclusivamente
  • Mayor hallucination en APIs de seguridad
  • Riesgo alto de Prompt Injection (LLM01)
☁️CodeWhispererSeguridad nativa
  • Análisis de seguridad en tiempo real
  • Cita referencia CWE por detección directa
  • Filtros de código con licencias restrictivas
  • Menor tasa de vulnerabilidades reportada
StarCoder (BigCode)Open Source
  • Modelo open-source, 15B parámetros
  • Entrenado en "The Stack" — datos curados
  • Audit trail completo y transparente
  • Sin filtros de seguridad activos por defecto
Pantalla 11Módulo 3
4 Herramientas PrincipalesCodeWhisperer es la única con análisis de seguridad nativo que referencia CWE directamente.
Diferenciador de Seguridad
Amazon CodeWhisperer es la única herramienta que integra análisis de seguridad en tiempo real con referencias directas a CWE, posicionándola como la opción más segura para entornos empresariales. Sin embargo, ninguna herramienta elimina la necesidad de pipeline SAST y revisión humana.
¿Cuál herramienta de IA integra análisis de seguridad en tiempo real con referencia directa a CWE?
S12 Comparativa de Seguridad — Herramientas IA
Herramienta Seg. Nativa Cita CWE Prompt Injection Audit Trail Licencias
🤖 GitHub Copilot ✗ No ✗ No ⚠ Medio ⚠ Parcial ⚠ Riesgo
💬 ChatGPT / GPT-4 ✗ No ✗ No ✗ Alto ✗ No ✓ OK
🔒 CodeWhisperer ✓ Sí ✓ Sí ⚠ Medio ✓ Sí ✓ Filtro
⭐ StarCoder ✗ No ✗ No ⚠ Medio ✓ Open ✓ Open
Conclusión del módulo: ninguna herramienta ofrece garantías completas de seguridad. La revisión humana, el pipeline SAST y las políticas organizacionales son complementos obligatorios independientemente de la herramienta elegida.
Pantalla 12Módulo 3
Comparativa 4 DimensionesSeguridad nativa, CWE, Prompt Injection, Audit trail y gestión de licencias comparadas.
Recomendación por Contexto
Datos sensibles (salud, finanzas): CodeWhisperer + SAST + revisión manual.
Desarrollo general: Copilot con plugin SonarQube obligatorio en IDE.
Investigación/academia: StarCoder — auditoría completa del entrenamiento.
En todos los casos: nunca deployar código IA sin pipeline de seguridad.
¿Qué control es siempre necesario sin importar cuál herramienta de IA uses?
S13 Módulo 4 · CWE Top-25 en Código Generado por IA
CWE (Common Weakness Enumeration): catálogo internacional de tipos de debilidades de software mantenido por MITRE. El "CWE Top-25" lista las más peligrosas según el análisis de millones de vulnerabilidades reales reportadas cada año.
💾 Gestión de Memoria
CWE-787 Escritura fuera del buffer · CWE-125 Lectura fuera de límites · Muy frecuente en C — 50% de fragmentos
💉 Inyección
CWE-089 SQL Injection · CWE-079 Cross-Site Scripting · Alta frecuencia en Python y JavaScript
🔐 Control de Acceso
CWE-798 Credenciales en código · CWE-862 Autorización faltante · Mayor impacto organizacional
3 categorías CWE en código IA
Pantalla 13Módulo 4
3 Categorías CWEMemoria, inyección y control de acceso agrupan las vulnerabilidades más frecuentes en código IA.
Figura 3. Infografía de las tres categorías principales de vulnerabilidades CWE detectadas en código generado por modelos de IA.
Nota. Imagen generada con Gemini (Google, 2025).
¿Por qué la IA genera estos errores?
Los modelos de IA aprenden estadísticamente. El código de entrenamiento incluía repositorios públicos con errores de seguridad sin filtrar. El modelo aprende esos patrones inseguros simplemente porque son frecuentes, no porque los identifique como incorrectos. La IA no tiene comprensión de seguridad — solo reproduce lo que aprendió con mayor frecuencia.
¿Por qué la IA reproduce patrones de código inseguros como las inyecciones SQL?
S14 CWE Top-25 — Frecuencia en Código Generado por IA
Frecuencia de vulnerabilidades por lenguaje (Pearce, 2022 · 1,689 fragmentos evaluados)
50%
Código C con vulnerabilidades
Buffer overflow predomina
38%
Código Python vulnerable
SQL Injection y XSS
32%
Código Java vulnerable
Autorización faltante
Las 5 CWE más frecuentes en código IA: CWE-787 (buffer overflow) · CWE-089 (SQL Injection) · CWE-079 (XSS) · CWE-798 (credenciales en código) · CWE-862 (autorización faltante). Juntas representan >60% de todas las vulnerabilidades encontradas en el código generado.
¿Por qué C tiene la mayor tasa?
C no tiene protección de límites de memoria por diseño. El corpus de entrenamiento incluía millones de funciones C con strcpy(), gets() y aritmética de punteros sin validación — el modelo los aprendió como patrones válidos.
Implicación práctica
El lenguaje del prompt importa. C/C++ ↔ mayor riesgo buffer overflow. Python ↔ mayor riesgo SQL Injection. Java ↔ mayor riesgo en autorización. El pipeline SAST debe adaptarse al lenguaje.
Pantalla 14Módulo 4
CWE + LenguajesC es el lenguaje más afectado (50%). CWE-798 y CWE-862 son críticas por su impacto organizacional.
El caso de las contraseñas en el código
Las contraseñas escritas directamente en el código son frecuentes en código de IA porque el modelo fue entrenado con repositorios que contenían archivos de configuración con claves y tokens reales. El modelo los memorizó y los reproduce. A este fenómeno se le llama memorización de datos de entrenamiento, y es la base del problema de privacidad que analizamos en el Módulo 6.
Verdadero o Falso
"El código C generado por IA tiene la mayor tasa de vulnerabilidades porque C no protege los límites de memoria por diseño."
S15 Módulo 5 · Hallazgos Cuantitativos — 38 Estudios
Hallazgos cuantitativos consolidados — 38 estudios PRISMA 2020
40%
Código Copilot con ≥1 CWE
Pearce et al., 2022
50%
Código C generado vulnerable
Pearce et al., 2022
47%
Developers subestiman el riesgo
Perry et al., 2023
>85%
Reducción con técnica SVEN
He & Vechev, 2023
92%
Developers usan IA semanalmente
Stack Overflow, 2023
38
Estudios incluidos PRISMA 2020
Negri-Ribalta et al., 2024
Datos cuantitativos de 38 estudios
Pantalla 15Módulo 5
Datos de 38 EstudiosHallazgos cuantitativos consolidados de la revisión sistemática PRISMA 2020.
Figura 4. Visualización de hallazgos cuantitativos clave de 38 estudios científicos sobre seguridad en código generado por IA (revisión PRISMA 2020).
Nota. Imagen generada con Gemini (Google, 2025).
Interpretación Integrada
Los datos se agrupan en tres categorías: magnitud del problema (40–50% de código vulnerable), factor humano (brecha de percepción: 47% subestima el riesgo), y soluciones técnicas (SVEN >85% reducción). La convergencia de los 38 estudios confirma que el riesgo es real, documentado y parcialmente mitigable.
¿Qué combinación de riesgos hace especialmente peligrosa la adopción de IA sin formación?
S16 Vectores de Riesgo por Fase SDLC
Riesgo documentado por fase (Negri-Ribalta et al., 2024 · 38 estudios)
📋 Requisitos
Severidad Media. IA genera especificaciones sin criterios de seguridad. Costo de corrección: 1×.
🏗️ Diseño
Severidad Media. Arquitecturas con brechas de autenticación no detectadas por el modelo.
💻 Implementación
⚠ Severidad Crítica. 40% de fragmentos con CWE (Pearce, 2022). Fase de mayor riesgo documentado.
🧪 Pruebas
Severidad Alta. IA omite escenarios de seguridad y casos límite en los tests generados. Costo: 6×.
🚀 Despliegue
Severidad Alta. Secretos expuestos (CWE-798) en pipelines CI/CD generados con IA. Costo: 30–100×.
🔧 Mantenimiento
Severidad Media. Parches IA con regresiones de seguridad no previstas. Costo: 30–100×.
Mapa de riesgos IA por fase del SDLC
Pantalla 16Módulo 5
Mapa de RiesgosLas 6 fases del SDLC tienen vectores de riesgo documentados en los 38 estudios revisados.
Figura 5. Mapa de vectores de riesgo introducidos por IA generativa en cada fase del ciclo de vida del desarrollo de software (SDLC).
Nota. Imagen generada con Gemini (Google, 2025).
Hallazgo Transversal
Ninguna fase del SDLC está libre de riesgo cuando se usa IA generativa sin controles. La revisión sistemática de Negri-Ribalta et al. (2024) documenta vectores en las 6 fases. La estrategia de mitigación debe ser integral y continua, no puntual — es el fundamento del pipeline DevSecOps del Módulo 2.
¿En qué fase del SDLC se documenta severidad "Crítica" para los riesgos introducidos por la IA?
S17 Módulo 6 · Privacidad y Fuga de Datos — CodexLeaks
Módulo 6 · Privacidad y Datos
🔑
API Keys
Tokens de servicios cloud memorizados en el entrenamiento y reproducidos en sugerencias
🔐
Credenciales
Contraseñas y tokens de acceso de repositorios GitHub incluidos en el corpus de entrenamiento
👤
PII
Datos personales identificables en código de configuración, logs y archivos de prueba
🏢
Secretos Corp.
Endpoints internos, nombres de bases de datos y arquitecturas privadas memorizadas
CodexLeaks (Niu et al., 2023): demostró que GitHub Copilot puede filtrar datos memorizados durante el entrenamiento, incluyendo API keys activas, tokens OAuth y datos personales de repositorios privados de GitHub.
Ciclo de memorización → filtración
📁
Corpus
Repos GitHub con datos reales
🧠
Entrenamiento
LLM memoriza tokens exactos
💬
Prompt usuario
Código similar al memorizado
⚠️
Filtración
Dato sensible reproducido
GDPR · Art. 5(1)(f)
Integridad y confidencialidad de datos personales en el entrenamiento del modelo
EU AI Act · Art. 10
Transparencia obligatoria sobre los datos usados para entrenar modelos de IA
Pantalla 17Módulo 6
Tipos de FugaCuatro categorías de datos que los LLM pueden revelar de su corpus de entrenamiento.
¿Cómo funciona la memorización?
Los LLM aprenden repitiendo patrones del código con que se entrenaron. Cuando ese código incluía credenciales o datos personales reales, el modelo los memorizó. Niu et al. (2023) confirmaron esto con pruebas técnicas: Copilot podía reproducir textualmente información de repositorios que después se marcaron como privados en GitHub.
Implicación práctica: si tu empresa compartió código en GitHub antes de usar Copilot, ese código podría aparecer en sugerencias a otros usuarios. Por esto el GDPR y el EU AI Act (Art. 10) exigen transparencia sobre los datos de entrenamiento.
Verdadero o Falso
"CodexLeaks demostró que GitHub Copilot puede revelar credenciales reales y datos personales que memorizó durante su entrenamiento."
S18 Ataques de Inferencia, PII y Mitigaciones de Privacidad
Ataque de Inferencia de Membresía (Membership Inference Attack)
Técnica que verifica si un dato específico —como una contraseña o archivo— formó parte del entrenamiento del modelo. Niu et al. (2023) la usaron para confirmar que Copilot memorizó datos de repositorios privados de GitHub.
Extracción de Datos de Entrenamiento (Training Data Extraction)
Usar prompts muy específicos para que el modelo reproduzca textualmente fragmentos que memorizó: credenciales reales, código propietario o datos personales de usuarios.
Inyección de Prompt OWASP LLM01
Incluir instrucciones maliciosas en el mensaje al modelo (el "prompt") para que haga cosas no autorizadas: revelar información sensible, generar código inseguro o saltarse sus propias restricciones de seguridad.
1
Secrets Scanning
git-secrets, Gitleaks, Trufflehog en cada commit
→ Detecta CWE-798 antes del push
2
Repositorios Privados
Verificar si el repo fue incluido en corpus de Copilot
→ GitHub: Settings → Copilot
3
Datos PII en Código
Política de no incluir datos reales en código o prompts
→ GDPR Art. 25 — Privacy by Design
Pantalla 18Módulo 6
Ataques y MitigacionesTres vectores de ataque documentados y el pipeline de mitigación de privacidad recomendado.
Marco Legal Aplicable
GDPR Art. 25 (Privacy by Design): la seguridad de datos debe integrarse por defecto en el diseño del sistema — incluida la IA generativa.
EU AI Act Art. 10: transparencia sobre datos de entrenamiento y gestión de calidad del corpus.
OWASP LLM01: Prompt Injection como vulnerabilidad crítica #1 en sistemas con LLM.
¿Cuál práctica protege mejor contra CWE-798 (contraseñas escritas directamente en el código)?
S19 Módulo 7 · Pipeline de Mitigación — Mejores Prácticas
La mitigación efectiva no depende de una sola herramienta. Se construye en 5 capas complementarias: cada capa detecta vulnerabilidades que las otras no ven.
1
Análisis Estático · SAST
SonarQube, Semgrep — revisa el código sin ejecutarlo (como corrector ortográfico de seguridad)
→ Pre-merge en CI/CD · Detecta CWE-089, CWE-079, CWE-787
2
Escaneo de Secretos
git-secrets, Gitleaks, Trufflehog — busca credenciales escritas directamente en el código
→ Cada commit · Detecta CWE-798 (contraseñas en código)
3
Revisión Humana
Revisar el código generado por IA antes de aceptarlo — contrarresta la brecha de percepción
→ Checklist OWASP LLM Top-10 · Obligatorio en autenticación y datos sensibles
4
Análisis Dinámico · DAST
OWASP ZAP, Burp Suite — prueba la aplicación en ejecución para detectar problemas en tiempo real
→ Ambiente de pruebas/staging antes de producción
5
Ajuste Fino · SVEN
Re-entrenamiento del modelo con datos de seguridad — evita generar patrones CWE desde el origen
→ He & Vechev, 2023 · >85% reducción · Solo para modelos open-source
Pantalla 19Módulo 7
5 Capas de MitigaciónPipeline de seguridad complementario: detección automática + humana + modelo fine-tuneado.
Por qué se necesitan varias capas de protección
Ningún control individual es suficiente por sí solo. La estrategia efectiva combina capas complementarias: análisis estático automático (detecta errores antes de compilar), revisión humana (para lo que la herramienta automática no detecta), escaneo de secretos (contraseñas en código), y ajuste fino del modelo (prevención desde el origen). Cada capa cubre lo que las otras no ven.
¿Cuál combinación de controles tiene el mayor retorno de inversión para proteger código generado por IA?
S20 SVEN — Security Vulnerability Eliminator (He & Vechev, 2023)
Antes de SVEN — Copilot base
40%
Fragmentos con ≥1 CWE (Pearce, 2022). Genera patrones inseguros porque los aprendió estadísticamente del corpus de entrenamiento.
Después de SVEN — modelo fine-tuneado
<6%
Reducción >85% en vulnerabilidades manteniendo funcionalidad del código. Fine-tuning penaliza patrones CWE durante el entrenamiento supervisado.
1
Datos de Fine-tuning
Pares (código vulnerable, código seguro) como datos de supervisión para el ajuste fino.
2
Penalización de Patrones CWE
La función de pérdida penaliza la generación de patrones reconocidos como CWE durante el ajuste.
3
Validación de Funcionalidad
He & Vechev confirmaron que la reducción de CWE no degrada la calidad funcional del código generado.
Pantalla 20Módulo 7
SVEN: Antes vs. Después40% de vulnerabilidades → <6% con fine-tuning de seguridad supervisado.
¿Qué es SVEN y por qué importa?
SVEN (Security Vulnerability Eliminator via fine-tuning): técnica de ajuste fino del modelo LLM creada por He & Vechev (2023). En lugar de detectar errores después de generarlos (como hace SAST), SVEN evita que el modelo los genere desde el principio — re-entrenándolo para penalizar los patrones CWE.
Limitación clave: requiere acceso a los pesos internos del modelo. Solo aplica a modelos open-source (StarCoder, LLaMA) o propios. Para Copilot o GPT-4, el pipeline SAST sigue siendo el control principal disponible.
Verdadero o Falso
"SVEN puede aplicarse directamente a herramientas de IA de código cerrado como GitHub Copilot o GPT-4 para reducir vulnerabilidades."
S21 Módulo 8 · Marcos de Gobernanza y Regulación IA
Módulo 8 · Gobernanza y Regulación
EU AI Act
Reglamento 2024/1689 · Vigente agosto 2024
Primer marco legal integral de IA del mundo. Clasifica sistemas en categorías de riesgo (inaceptable / alto / limitado / mínimo). Exige transparencia, documentación y auditoría de sistemas de alto riesgo.
Alto riesgo → Obligaciones estrictas
NIST AI RMF
AI 100-1 · NIST, 2023
Framework voluntario con 4 funciones: Govern, Map, Measure, Manage. Proporciona vocabulario común y guía para gestionar riesgos de IA en organizaciones de cualquier tamaño.
4 funciones: GOVERN · MAP · MEASURE · MANAGE
ISO/IEC 42001:2023
Norma internacional · ISO, 2023
Sistema de gestión de IA certificable. Compatible con ISO 27001 (seguridad de información) e ISO 9001 (calidad). Define requisitos para gobernanza responsable de IA en organizaciones.
Certificable — compatible con ISO 27001
OWASP LLM Top-10
Versión 1.1 · OWASP Foundation, 2023
10 vulnerabilidades críticas en aplicaciones con LLM. LLM01 Prompt Injection, LLM02 Insecure Output, LLM06 Sensitive Info Disclosure. Referencia técnica operativa complementaria a los marcos de gobernanza.
LLM01 Prompt Injection — vulnerabilidad #1
4 marcos de gobernanza IA
Pantalla 21Módulo 8
4 Marcos de GobernanzaLegal (EU AI Act) + Gestión de riesgos (NIST) + Certificación (ISO) + Técnico (OWASP).
Figura 6. Infografía de los cuatro marcos de gobernanza y regulación para el uso responsable de inteligencia artificial en el desarrollo de software.
Nota. Imagen generada con Gemini (Google, 2025).
¿Cómo aplica esto en el trabajo diario?
EU AI Act: lleva un registro de qué herramientas de IA usas en tus proyectos, clasifica el nivel de riesgo y documenta cómo las usas.
NIST AI RMF: integra las funciones de Gobernar y Gestionar en el proceso de aprobación de herramientas de IA en tu equipo.
OWASP LLM Top-10: úsalo como lista de verificación técnica en cada ciclo de desarrollo que incluya IA generativa.
¿Cuál de estos marcos ya está en vigencia y aplica de forma obligatoria para la Unión Europea?
S22 OWASP LLM Top-10 (2023) — Vulnerabilidades Críticas
OWASP LLM Top-10 es la lista de las 10 vulnerabilidades más críticas en aplicaciones que usan modelos de lenguaje grande (LLM). Fue publicada por la fundación OWASP en 2023 y ya es la referencia técnica principal para equipos de seguridad en proyectos con IA. Las marcadas en azul son las más relevantes para el SDLC.
LLM01
Prompt Injection
Instrucciones maliciosas en el prompt manipulan el LLM para generar código inseguro, revelar datos o ejecutar acciones no autorizadas.
LLM02
Manejo Inseguro de Salidas
Usar directamente el output del LLM sin sanitización — puede introducir XSS, path traversal o inyecciones en el sistema.
LLM03
Envenenamiento de Datos
Datos maliciosos en el corpus de entrenamiento o fine-tuning afectan el comportamiento del modelo sistemáticamente.
LLM06
Divulgación de Info Sensible
El modelo revela información confidencial del corpus (CodexLeaks) o del contexto del sistema en sus respuestas.
LLM08
Agencia Excesiva
El LLM realiza acciones con mayor impacto del necesario — aplica al código generado con permisos excesivos.
LLM09
Sobredependencia
Aceptar código generado sin revisión crítica — directamente relacionado con la brecha de percepción de Perry (2023).
Pantalla 22Módulo 8
OWASP LLM Top-10Las resaltadas en rojo son las más relacionadas con el desarrollo de software y el SDLC.
Conexión con los Módulos Anteriores
LLM01 (Prompt Injection) → conecta con M3: herramientas con mayor riesgo (ChatGPT).
LLM06 (Info Sensible) → conecta con M6: CodexLeaks y memorización de entrenamiento.
LLM09 (Sobredependencia) → conecta con M1: brecha de percepción de Perry (2023).
Verdadero o Falso
"Según OWASP LLM Top-10 (2023), la Sobredependencia (LLM09) es la vulnerabilidad número uno en aplicaciones con modelos de lenguaje."
S25 Módulo 9 · Síntesis de Hallazgos — 38 Estudios
Módulo 9 · Conclusiones
F1
Riesgo técnico documentado: 40% del código de Copilot tiene ≥1 CWE del Top-25. C tiene la mayor tasa (50%). El riesgo es estadísticamente significativo y consistente entre estudios (Pearce, 2022; Sandoval, 2023).
F2
Riesgo cognitivo — brecha de percepción: developers con IA sobreestiman la seguridad de su código. Este factor humano amplifica el riesgo técnico al inhibir la revisión crítica (Perry, 2023).
F3
Privacidad como vector emergente: CodexLeaks confirma que los LLM pueden revelar datos memorizados del entrenamiento, incluyendo credenciales activas y PII (Niu, 2023).
F4
Mitigación técnica viable: SVEN logra >85% de reducción de CWE mediante fine-tuning. SAST + revisión humana son complementos efectivos e inmediatamente aplicables (He & Vechev, 2023).
F5
Marco normativo emergente: EU AI Act (2024), NIST AI RMF (2023) e ISO/IEC 42001 establecen el entorno regulatorio que toda organización debe incorporar en su SDLC.
5 hallazgos principales de 38 estudios
Pantalla 25Módulo 9
5 Hallazgos PrincipalesSíntesis de los 38 estudios: convergencia de evidencia en riesgo técnico, cognitivo, privacidad, mitigación y normativa.
Figura 7. Síntesis visual de los cinco hallazgos principales emergentes de la revisión sistemática PRISMA 2020 sobre riesgos de IA generativa en el SDLC.
Nota. Imagen generada con Gemini (Google, 2025).
Lo que la ciencia aún no ha respondido
Pregunta abierta 1: ¿Qué pasa con los proyectos reales después de un año usando IA? No existen estudios de seguimiento a largo plazo en producción.
Pregunta abierta 2: ¿Cómo afecta esto a equipos latinoamericanos que programan en español? Casi toda la investigación es en inglés y en contextos de EE.UU. o Europa.
Pregunta abierta 3: ¿Cómo comparar herramientas de IA de forma estándar? Aún no existe un marco de evaluación homologado.
¿Cuál de los 5 hallazgos del ODC representa la mayor oportunidad de investigación para universidades latinoamericanas?
S26 Perfil del Desarrollador Responsable con IA
Conoce las CWE Top-25 y puede identificarlas en código generado por IA (Pearce, 2022)
Mantiene revisión crítica activa — contrarresta la brecha de percepción (Perry, 2023)
Implementa SAST en cada commit: SonarQube o Semgrep como control mínimo
Aplica secrets scanning (Gitleaks) — nunca trustea código IA con credenciales hardcodeadas
Conoce OWASP LLM Top-10 y aplica controles para LLM01 (Prompt Injection)
Está al día con EU AI Act y NIST AI RMF — gobernanza como competencia profesional
Mantiene inventario de herramientas IA usadas en el proyecto (NIST AI RMF — Govern)
🔭
Brecha: Estudios Longitudinales
Falta evidencia sobre impacto a largo plazo de IA en proyectos reales de producción.
🌍
Brecha: Contextos Locales
Escasa investigación sobre LLM en contextos de desarrollo latinoamericano y multilingüe.
📏
Brecha: Estándares de Evaluación
No existe framework estandarizado para evaluar herramientas IA en el SDLC de forma comparativa.
Pantalla 26Módulo 9
Perfil + BrechasEl perfil del developer responsable y las tres brechas investigativas identificadas en la revisión.
Oportunidades de investigación para Latinoamérica
Los hallazgos de este ODC abren tres líneas de investigación concretas: estudiar el impacto de la IA en proyectos reales durante meses o años, investigar cómo estos riesgos se manifiestan en equipos latinoamericanos, y desarrollar marcos de evaluación comparativa de herramientas de IA adaptados a nuestro contexto. Estas son oportunidades reales de investigación de posgrado con relevancia local e impacto global.
Siguiente paso

Evaluación Sumativa — ODC Riesgos IA en SDLC

10 preguntas · Cobertura: los 9 módulos · Criterio de aprobación: 80% (8/10 correctas)

Lee cada pregunta con atención. Recibirás retroalimentación inmediata con la explicación académica de cada respuesta.

Referencias Bibliográficas — APA 7
1Brown, T., Mann, B., Ryder, N., Subbiah, M., Kaplan, J. D., Dhariwal, P., … Amodei, D. (2020). Language models are few-shot learners. Advances in Neural Information Processing Systems, 33, 1877–1901.
2Chen, M., Tworek, J., Jun, H., Yuan, Q., Pinto, H. P. D. O., Kaplan, J., … Zaremba, W. (2021). Evaluating large language models trained on code. arXiv preprint arXiv:2107.03374. https://doi.org/10.48550/arXiv.2107.03374
3CWE/SANS Institute. (2023). 2023 CWE top 25 most dangerous software weaknesses. MITRE Corporation. https://cwe.mitre.org/top25/archive/2023/2023_top25_list.html
4European Parliament. (2024). Regulation (EU) 2024/1689 laying down harmonised rules on artificial intelligence (AI Act). Official Journal of the European Union. https://eur-lex.europa.eu/legal-content/EN/TXT/?uri=CELEX:32024R1689
5He, J., & Vechev, M. (2023). Large language models for code: Security hardening and adversarial testing. Proceedings of the 2023 ACM SIGSAC Conference on Computer and Communications Security, 1865–1879. https://doi.org/10.1145/3576915.3623180
6International Organization for Standardization. (2023). ISO/IEC 42001:2023 — Information technology — Artificial intelligence — Management system. ISO.
7Liang, J., Liu, J., & Janes, A. (2024). A survey on evaluating large language models in code generation tasks. arXiv preprint arXiv:2408.16498. https://doi.org/10.48550/arXiv.2408.16498
8Moher, D., Liberati, A., Tetzlaff, J., & Altman, D. G. (2009). Preferred reporting items for systematic reviews and meta-analyses: The PRISMA statement. PLOS Medicine, 6(7), e1000097. https://doi.org/10.1371/journal.pmed.1000097
9National Institute of Standards and Technology. (2023). Artificial intelligence risk management framework (AI RMF 1.0) (NIST AI 100-1). U.S. Department of Commerce. https://doi.org/10.6028/NIST.AI.100-1
10Negri-Ribalta, C., Roa-Martínez, S. M., Lopezosa, C., & Codina, L. (2024). Generative AI and cybersecurity in software development: A systematic literature review. Future Internet, 16(10), 367. https://doi.org/10.3390/fi16100367
11Niu, B., Tang, X., Li, S., & Chen, J. (2023). CodexLeaks: Privacy leaks from code generation language models in GitHub Copilot. 32nd USENIX Security Symposium, 2321–2338.
12OWASP Foundation. (2023). OWASP top 10 for large language model applications: Version 1.1. https://owasp.org/www-project-top-10-for-large-language-model-applications/
13Page, M. J., McKenzie, J. E., Bossuyt, P. M., Boutron, I., Hoffmann, T. C., Mulrow, C. D., … Moher, D. (2021). The PRISMA 2020 statement: An updated guideline for reporting systematic reviews. BMJ, 372, n71. https://doi.org/10.1136/bmj.n71
14Pearce, H., Ahmad, B., Tan, B., Dolan-Gavitt, B., & Karri, R. (2022). Asleep at the keyboard? Assessing the security of GitHub Copilot's code contributions. 2022 IEEE Symposium on Security and Privacy, 754–768. https://doi.org/10.1109/SP46214.2022.9833571
15Perry, N., Srivastava, M., Kumar, D., & Boneh, D. (2023). Do users write more insecure code with AI assistants? Proceedings of the 2023 ACM SIGSAC Conference on Computer and Communications Security, 2785–2799. https://doi.org/10.1145/3576915.3623157
16Sallou, J., Durieux, T., & Panichella, A. (2024). Breaking the silence: The threats of using LLMs in software engineering. Proceedings of the 2024 ACM/IEEE 44th ICSE: New Ideas and Emerging Results, 102–106. https://doi.org/10.1145/3639476.3639762
17Sandoval, G., Pearce, H., Nys, T., Karri, R., Garg, S., & Dolan-Gavitt, B. (2023). Lost at C: A user study on the security implications of large language model code assistants. 32nd USENIX Security Symposium, 2205–2222.
18Seacord, R. C. (2013). Secure coding in C and C++ (2nd ed.). Addison-Wesley Professional.
19Tian, Z., & Chen, J. (2023). Is ChatGPT the ultimate programming assistant? How far is it? arXiv preprint arXiv:2304.11938. https://doi.org/10.48550/arXiv.2304.11938
20Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., Kaiser, Ł., & Polosukhin, I. (2017). Attention is all you need. Advances in Neural Information Processing Systems, 30, 5998–6008.
21GitHub. (2023). GitHub Copilot: Your AI pair programmer. https://github.com/features/copilot
22Amazon Web Services. (2023). Amazon CodeWhisperer: AI-powered coding companion. https://aws.amazon.com/codewhisperer/
23Bass, L., Clements, P., & Kazman, R. (2021). Software architecture in practice (4th ed.). Addison-Wesley Professional.
24Shafiq, S., Hussain, A., & Bhatti, S. N. (2020). Systematic literature review of security challenges in cloud computing. International Journal of Advanced Computer Science and Applications, 11(1), 371–379.
25Solaiman, I., Brundage, M., Clark, J., & Askell, A. (2019). Release strategies and the social impacts of language models. arXiv preprint arXiv:1908.09203. https://doi.org/10.48550/arXiv.1908.09203
Recursos Digitales — Imágenes y Videos Generados con IA
26Google. (2025). Diagrama del flujo de procesamiento de un modelo de lenguaje grande (LLM), desde el corpus de entrenamiento hasta el código generado [Imagen generada con inteligencia artificial]. Google Gemini (Nano Banana, versión Pro). https://gemini.google.com
27Google. (2025). Infografía del pipeline DevSecOps de seis etapas integrado con controles específicos para proyectos con IA generativa [Imagen generada con inteligencia artificial]. Google Gemini (Nano Banana, versión Pro). https://gemini.google.com
28Google. (2025). Infografía de las tres categorías principales de vulnerabilidades CWE detectadas en código generado por modelos de IA [Imagen generada con inteligencia artificial]. Google Gemini (Nano Banana, versión Pro). https://gemini.google.com
29Google. (2025). Visualización de hallazgos cuantitativos clave de 38 estudios científicos sobre seguridad en código generado por IA (revisión PRISMA 2020) [Imagen generada con inteligencia artificial]. Google Gemini (Nano Banana, versión Pro). https://gemini.google.com
30Google. (2025). Mapa de vectores de riesgo introducidos por IA generativa en cada fase del ciclo de vida del desarrollo de software (SDLC) [Imagen generada con inteligencia artificial]. Google Gemini (Nano Banana, versión Pro). https://gemini.google.com
31Google. (2025). Infografía de los cuatro marcos de gobernanza y regulación para el uso responsable de inteligencia artificial en el desarrollo de software [Imagen generada con inteligencia artificial]. Google Gemini (Nano Banana, versión Pro). https://gemini.google.com
32Google. (2025). Síntesis visual de los cinco hallazgos principales emergentes de la revisión sistemática PRISMA 2020 sobre riesgos de IA generativa en el SDLC [Imagen generada con inteligencia artificial]. Google Gemini (Nano Banana, versión Pro). https://gemini.google.com
33Pippit AI. (2025). Videos de presentación de pantallas ODC — Riesgos de IA Generativa en el SDLC [Videos generados con inteligencia artificial a partir de imagen y guion de texto]. Pippit. https://www.pippit.ai/

Créditos del ODC

RolResponsableHerramienta / URLLicencia
Autoría y contenidoEscobar Sarmiento, Brayan Esteban · Martínez Gaitán, Edgar AndrésCC BY 4.0
Diseño e infografías (Figs. 1–7)Google — Gemini Nano Banana (versión Pro)gemini.google.comUso educativo — Google ToS
Producción de videos avatarPippit AIpippit.aiUso educativo — Pippit ToS
Voz y narraciónSintetizada en Pippit AIpippit.aiUso educativo — Pippit ToS

Institución: Universidad de Cundinamarca — Facultad de Ingeniería

Programa: Especialización en Gerencia para la Transformación Digital

Director: Jhondert Alberto Jaimes Rodríguez

Año: 2025 · Revisión metodológica: PRISMA 2020

CC BY 4.0 — Atribución requerida
Pantalla 28Referencias
33 Referencias APA 725 académicas + 7 imágenes Gemini + 1 plataforma de video. Cada referencia está en formato APA 7 e incluye los recursos digitales usados en el ODC.
Acciones Finales
¿Completaste la evaluación? Necesitas 8/10 correctas (80%) para cumplir el criterio del REA.
¿Quieres repasar? Usa el menú ☰ para volver a cualquier módulo.
¿Citas académicas? Todas las referencias están disponibles en formato APA 7 arriba.
Acciones finales
📖 Glosario de Términos