Este diagrama interactivo resume la arquitectura inferida de los Agents de ChatGPT según el análisis técnico publicado en julio de 2025. Estructurado en 6 capas funcionales, permite entender cómo se orquesta el razonamiento, la ejecución de herramientas, el entorno de sandboxing y la interfaz de colaboración humano-máquina.
Cada capa está codificada por color, incluye referencias cruzadas al informe técnico y muestra el nivel de confianza asignado a cada inferencia. Esta representación visual es útil tanto para desarrolladores, formadores en IA como para auditores técnicos que necesiten entender los límites reales del sistema.
Puedes consultar el artículo completo aquí para el análisis detallado, metodología y anexos empíricos.
Arquitectura Agents ChatGPT (I)
Núcleo
Herramienta
Tool
Núcleo
Media
Baja
Confianza
Capa 0: Metacontexto y Sistema
- {00a} Identidad: LLM OpenAI (cutoff Oct 2023, fecha actual reportada)
- {00b} Versión del meta-prompt y feature flags (no expuestos al usuario)
- {00c} Distinción Free/Plus/Enterprise en recursos y acceso a features
- {00d} Awareness parcial de cambios entre releases
🧠 Capa 1: Núcleo de Razonamiento
- {01} LLM especializado en chain-of-thought (p.7) Alta
- {02} Meta-prompt explícito, instrucción ReAct (p.7) Alta
- {03} Ciclo Thought→Action→Observation (p.21) Alta
- {04} Narración de plan y análisis post-ejecución (p.8) Alta
- {05} Auto-corrección limitada (un solo intento) (p.25) Alta
- {06} Sin memoria entre sesiones (estado efímero) (p.17) Alta
- {07} Principios de formato y claridad de salida (p.23) Media
- {08} Reglas de estilo: gráficos individuales, no seaborn, no colores (p.24) Media
- {09} Reconoce límites y reporta explícitamente (p.23) Alta
- {10} Diferencia arquitectónica: planifica y ejecuta, no solo asesora (p.10) Alta
🛠️ Capa 2: Orquestador de Herramientas
- {11} Integra Python, Navegador, DALL·E bajo gestión centralizada (p.8) Alta
- {12} Carpeta puente
/home/oai/share(p.17) Alta - {13} Transferencia sólo vía copia, no acceso directo (p.17) Alta
- {14} Operación secuencial, nunca concurrente (p.7) Alta
- {15} Edge: posible corrupción en binarios (p.17) Media
- {16} Navegador sin acceso a memoria del intérprete (p.17) Alta
- {17} Imposible instalar paquetes nuevos en Python (p.9) Alta
- {18} Librerías preinstaladas: pandas, numpy, matplotlib (p.24) Media
- {19} DALL·E invocable sólo desde LLM, no API directa (p.8) Alta
- {20} Procesamiento de archivos limitado por expansión RAM (p.15) Alta
- {21} Sin llamadas de red desde Python, sólo desde Navegador (p.9) Alta
- {22} Control de errores propagado por herramientas (p.8) Alta
- {23} Workaround: verifica integridad tras transferencia (p.17) Alta
Arquitectura Agents ChatGPT – (II)
Sandbox
Interfaz
Edge/Riesgo
🔒 Capa 3: Sandbox / Entorno de Ejecución
- {24} Micro-VM Firecracker/gVisor (según inferencia) (p.13) Media
- {25} RAM efectiva asignada ~7-8GB, total VM ~10GB (p.14) Alta
- {26} Estado efímero, destrucción total tras sesión/error (p.14) Alta
- {27} Aislamiento completo de red (sandbox) (p.9) Alta
- {28} Arranque VM <125ms, overhead <5MB (p.9) Alta
- {29} SO base minimalista, espacio temporal /home/oai/share (p.14) Alta
- {30} Límite de sesión por tiempo: ~5 min wall-clock (p.16) Alta
- {31} Límite práctico de archivos: 100-150MB (p.15) Alta
- {32} MemoryError → sandbox degradado, requiere reinicio (p.14) Alta
- {33} GC Python limitado, posible fuga en edge case (p.16) Baja
- {34} No acceso a disco fuera de la VM/sandbox (p.9) Alta
- {35} Coste por sesión = RAM x tiempo + overhead (p.9) Alta
- {36} Workaround: dividir datos en chunks para evitar MemoryError (p.17) Alta
🤝 Capa 4: Interfaz y Colaboración Humano-Agent
- {37} Solicita confirmación en operaciones costosas/irreversibles (p.10) Alta
- {38} Permite intervención humana, espera feedback (p.10) Alta
- {39} Presenta razonamiento anticipado (planificación antes de acción) (p.10) Alta
- {40} Fallback: solicita aclaración tras fallo no resuelto (p.25) Alta
- {41} Adapta narrativa a contexto/rol (prompt) (p.23) Media
- {42} Transparencia de límites/errores, reporta con precisión (p.23) Alta
- {43} Ajuste microdecisional en función de instrucciones (p.23) Alta
- {44} Muestra resultados paso a paso, no oculta procesos (p.8) Alta
- {45} Sesión destruida tras inactividad, sin warning persistente (p.14) Alta
⛔ Capa 5: Edge Cases, Seguridad y Economía
- {46} Sin integración directa con APIs privadas/internas (por diseño) (p.35) Alta
- {47} Límite estricto: timeout 5 min, RAM ~8GB (p.16) Alta
- {48} No memoria persistente, nunca entre sesiones (p.17) Alta
- {49} Límite práctico de archivos vs. límite nominal declarado (100MB vs. 512MB) (p.15) Alta
- {50} Edge: corrupción ocasional binario↔texto en transferencias (p.17) Media
- {51} Seguridad: todo flujo validado, sin ejecución autónoma (p.23) Alta
- {52} Destrucción de VM tras uso: prevención de superficie de ataque (p.14) Alta
- {53} Trade-off arquitectura: prioriza coste y seguridad sobre capacidad (p.16) Alta
- {54} Diferencias Enterprise/Plus: mayores cuotas, más RAM, más tiempo (p.43) Baja
- {55} Evolución continua, feature flags y cambios no siempre documentados (p.47) Media
Arquitectura Agents ChatGPT – (III)
Observabilidad
Sandbox
Núcleo
Herramienta
🔎 Capa 6: Observabilidad y Trazabilidad
- {56} No expone logs detallados al usuario final
- {57} Error y límites reportados por mensaje, no por traza descargable
- {58} Sin auditoría externa de sesión (por seguridad/privacidad)
- {59} Cambios arquitectónicos solo inferibles por comportamiento externo
- {60} Niveles de confianza asignados por evidencia replicable
Ejemplo: Tabla de Metadatos por Ítem
| Nº | Ítem/Resumen | Página | Confianza | Nota/Workaround |
|---|---|---|---|---|
| 24 | Micro-VM Firecracker | 13 | Media | Arquitectura inferida, no confirmada |
| 25 | RAM 7-8GB/sesión | 14 | Alta | Validado empíricamente |
| 32 | Sandbox degradado | 14 | Alta | Reiniciar conversación tras error |
Leyenda y Referencias
- 🟦 Núcleo (Razonamiento, LLM, azul)
- 🟨 Herramienta (Python, Navegador, DALL·E, ámbar)
- 🟩 Sandbox (Micro-VM, entorno aislado, verde)
- 🟫 Interfaz (Colaboración, gris)
- 🟥 Edge/Límite (Seguridad, límites críticos, rojo/naranja)
- 🟪 Observabilidad (Trazabilidad, logs, violeta)
- Alta, Media, Baja: Nivel de confianza
Arquitectura de los agents de ChatGPT: análisis técnico y operativo
