Arquitectura de los Agents de ChatGPT – Diagrama técnico interactivo (v2.3-beta)

Este diagrama interactivo resume la arquitectura inferida de los Agents de ChatGPT según el análisis técnico publicado en julio de 2025. Estructurado en 6 capas funcionales, permite entender cómo se orquesta el razonamiento, la ejecución de herramientas, el entorno de sandboxing y la interfaz de colaboración humano-máquina.

Cada capa está codificada por color, incluye referencias cruzadas al informe técnico y muestra el nivel de confianza asignado a cada inferencia. Esta representación visual es útil tanto para desarrolladores, formadores en IA como para auditores técnicos que necesiten entender los límites reales del sistema.

Puedes consultar el artículo completo aquí para el análisis detallado, metodología y anexos empíricos.

Arquitectura Agents ChatGPT (I)

Metacontexto, Núcleo y Herramientas (v2.3-beta adaptada)

JL de la Torre | Julio 2025 | CC BY-NC-SA

🧠
Núcleo

🛠️
Herramienta

Amarillo
Tool

Azul
Núcleo

Alta
Media
Baja
Confianza

Referencias: (página) | nivel de confianza

Capa 0: Metacontexto y Sistema

{00a} Identidad: LLM OpenAI (cutoff Oct 2023, fecha actual reportada)
{00b} Versión del meta-prompt y feature flags (no expuestos al usuario)
{00c} Distinción Free/Plus/Enterprise en recursos y acceso a features
{00d} Awareness parcial de cambios entre releases

🧠 Capa 1: Núcleo de Razonamiento

{01} LLM especializado en chain-of-thought (p.7) Alta
{02} Meta-prompt explícito, instrucción ReAct (p.7) Alta
{03} Ciclo Thought→Action→Observation (p.21) Alta
{04} Narración de plan y análisis post-ejecución (p.8) Alta
{05} Auto-corrección limitada (un solo intento) (p.25) Alta
{06} Sin memoria entre sesiones (estado efímero) (p.17) Alta
{07} Principios de formato y claridad de salida (p.23) Media
{08} Reglas de estilo: gráficos individuales, no seaborn, no colores (p.24) Media
{09} Reconoce límites y reporta explícitamente (p.23) Alta
{10} Diferencia arquitectónica: planifica y ejecuta, no solo asesora (p.10) Alta

🛠️ Capa 2: Orquestador de Herramientas

{11} Integra Python, Navegador, DALL·E bajo gestión centralizada (p.8) Alta
{12} Carpeta puente /home/oai/share (p.17) Alta
{13} Transferencia sólo vía copia, no acceso directo (p.17) Alta
{14} Operación secuencial, nunca concurrente (p.7) Alta
{15} Edge: posible corrupción en binarios (p.17) Media
{16} Navegador sin acceso a memoria del intérprete (p.17) Alta
{17} Imposible instalar paquetes nuevos en Python (p.9) Alta
{18} Librerías preinstaladas: pandas, numpy, matplotlib (p.24) Media
{19} DALL·E invocable sólo desde LLM, no API directa (p.8) Alta
{20} Procesamiento de archivos limitado por expansión RAM (p.15) Alta
{21} Sin llamadas de red desde Python, sólo desde Navegador (p.9) Alta
{22} Control de errores propagado por herramientas (p.8) Alta
{23} Workaround: verifica integridad tras transferencia (p.17) Alta

Arquitectura Agents ChatGPT – (II)

Sandbox, Interfaz y Edge Cases (v2.3-beta adaptada)

Verde
Sandbox

Gris
Interfaz

Naranja/Rojo
Edge/Riesgo

Referencias: (página) | nivel de confianza

🔒 Capa 3: Sandbox / Entorno de Ejecución

{24} Micro-VM Firecracker/gVisor (según inferencia) (p.13) Media
{25} RAM efectiva asignada ~7-8GB, total VM ~10GB (p.14) Alta
{26} Estado efímero, destrucción total tras sesión/error (p.14) Alta
{27} Aislamiento completo de red (sandbox) (p.9) Alta
{28} Arranque VM <125ms, overhead <5MB (p.9) Alta
{29} SO base minimalista, espacio temporal /home/oai/share (p.14) Alta
{30} Límite de sesión por tiempo: ~5 min wall-clock (p.16) Alta
{31} Límite práctico de archivos: 100-150MB (p.15) Alta
{32} MemoryError → sandbox degradado, requiere reinicio (p.14) Alta
{33} GC Python limitado, posible fuga en edge case (p.16) Baja
{34} No acceso a disco fuera de la VM/sandbox (p.9) Alta
{35} Coste por sesión = RAM x tiempo + overhead (p.9) Alta
{36} Workaround: dividir datos en chunks para evitar MemoryError (p.17) Alta

🤝 Capa 4: Interfaz y Colaboración Humano-Agent

{37} Solicita confirmación en operaciones costosas/irreversibles (p.10) Alta
{38} Permite intervención humana, espera feedback (p.10) Alta
{39} Presenta razonamiento anticipado (planificación antes de acción) (p.10) Alta
{40} Fallback: solicita aclaración tras fallo no resuelto (p.25) Alta
{41} Adapta narrativa a contexto/rol (prompt) (p.23) Media
{42} Transparencia de límites/errores, reporta con precisión (p.23) Alta
{43} Ajuste microdecisional en función de instrucciones (p.23) Alta
{44} Muestra resultados paso a paso, no oculta procesos (p.8) Alta
{45} Sesión destruida tras inactividad, sin warning persistente (p.14) Alta

⛔ Capa 5: Edge Cases, Seguridad y Economía

{46} Sin integración directa con APIs privadas/internas (por diseño) (p.35) Alta
{47} Límite estricto: timeout 5 min, RAM ~8GB (p.16) Alta
{48} No memoria persistente, nunca entre sesiones (p.17) Alta
{49} Límite práctico de archivos vs. límite nominal declarado (100MB vs. 512MB) (p.15) Alta
{50} Edge: corrupción ocasional binario↔texto en transferencias (p.17) Media
{51} Seguridad: todo flujo validado, sin ejecución autónoma (p.23) Alta
{52} Destrucción de VM tras uso: prevención de superficie de ataque (p.14) Alta
{53} Trade-off arquitectura: prioriza coste y seguridad sobre capacidad (p.16) Alta
{54} Diferencias Enterprise/Plus: mayores cuotas, más RAM, más tiempo (p.43) Baja
{55} Evolución continua, feature flags y cambios no siempre documentados (p.47) Media

Arquitectura Agents ChatGPT – (III)

Observabilidad, Trazabilidad y Metadatos (v2.3-beta adaptada)

Violeta
Observabilidad

🟩
Sandbox

🟦
Núcleo

🟨
Herramienta

Colores y símbolos: ver leyenda final | Confianza: Alta, Media, Baja

🔎 Capa 6: Observabilidad y Trazabilidad

{56} No expone logs detallados al usuario final
{57} Error y límites reportados por mensaje, no por traza descargable
{58} Sin auditoría externa de sesión (por seguridad/privacidad)
{59} Cambios arquitectónicos solo inferibles por comportamiento externo
{60} Niveles de confianza asignados por evidencia replicable

Ejemplo: Tabla de Metadatos por Ítem

Nº	Ítem/Resumen	Página	Confianza	Nota/Workaround
24	Micro-VM Firecracker	13	Media	Arquitectura inferida, no confirmada
25	RAM 7-8GB/sesión	14	Alta	Validado empíricamente
32	Sandbox degradado	14	Alta	Reiniciar conversación tras error

Para análisis ampliado: sugerencia de tabla editable (más columnas: fuente, reproducibilidad, etc.)

Leyenda y Referencias

🟦 Núcleo (Razonamiento, LLM, azul)
🟨 Herramienta (Python, Navegador, DALL·E, ámbar)
🟩 Sandbox (Micro-VM, entorno aislado, verde)
🟫 Interfaz (Colaboración, gris)
🟥 Edge/Límite (Seguridad, límites críticos, rojo/naranja)
🟪 Observabilidad (Trazabilidad, logs, violeta)
Alta, Media, Baja: Nivel de confianza

Fuente: Arquitectura Agents ChatGPT, JL de la Torre, v2.3-beta

Arquitectura de los agents de ChatGPT: análisis técnico y operativo

Arquitectura de los Agents de ChatGPT – Diagrama técnico interactivo (v2.3-beta)