Aquesta pàgina complementa l’article tècnic original «Arquitectura dels Agents de ChatGPT: anàlisi tècnica i operativa» (v2.3-beta), redactat per JL de la Torre. El diagrama interactiu següent mostra de forma estructurada les sis capes funcionals inferides mitjançant observació empírica, ús pràctic i enginyeria inversa.
Cada capa està codificada per colors, inclou referències creuades a l’informe complet i incorpora un nivell de confiança basat en evidències replicables. És un recurs útil per a docents en IA, desenvolupadors i auditors tècnics que vulguin comprendre els límits operatius i el model de funcionament intern dels Agents.
Arquitectura dels Agents de ChatGPT (I)
Metacontext, Nucli i Eines (v2.3-beta adaptada)
JL de la Torre | Juliol 2025 | CC BY-NC-SA
🧠
Nucli
Nucli
🛠️
Eina
Eina
Groc
Tool
Tool
Blau
Nucli
Nucli
Alta
Mitjana
Baixa
Confiança
Mitjana
Baixa
Confiança
Referències: (pàgina) | nivell de confiança
Capa 0: Metacontext i Sistema
- {00a} Identitat: LLM d’OpenAI (cutoff Oct 2023, data actual reportada)
- {00b} Versió del meta-prompt i feature flags (no exposats a l’usuari)
- {00c} Distinció Free/Plus/Enterprise en recursos i accés a funcions
- {00d} Awareness parcial dels canvis entre versions
🧠 Capa 1: Nucli de Raonament
- {01} LLM especialitzat en chain-of-thought (p.7) Alta
- {02} Meta-prompt explícit, instrucció ReAct (p.7) Alta
- {03} Cicle Thought→Action→Observation (p.21) Alta
- {04} Narració del pla i anàlisi post-execució (p.8) Alta
- {05} Auto-correcció limitada (un sol intent) (p.25) Alta
- {06} Sense memòria entre sessions (estat efímer) (p.17) Alta
- {07} Principis de format i claredat en la sortida (p.23) Mitjana
- {08} Regles d’estil: gràfics individuals, no seaborn, no colors (p.24) Mitjana
- {09} Reconeix límits i els reporta explícitament (p.23) Alta
- {10} Diferència arquitectònica: planifica i executa, no només assessora (p.10) Alta
Arquitectura dels Agents de ChatGPT – (II)
Sandbox, Interfície i Casos Límit (v2.3-beta adaptada)
Verd
Sandbox
Sandbox
Gris
Interfície
Interfície
Taronja/Vermell
Límit/Risc
Límit/Risc
Referències: (pàgina) | nivell de confiança
🛠️ Capa 2: Orquestrador d’Eines
- {11} Integra Python, Navegador, DALL·E sota gestió centralitzada (p.8) Alta
- {12} Carpeta pont
/home/oai/share(p.17) Alta - {13} Transferència només per còpia, no accés directe (p.17) Alta
- {14} Operació seqüencial, mai concurrent (p.7) Alta
- {15} Edge: corrupció possible en binaris (p.17) Mitjana
- {16} El Navegador no accedeix a la memòria de l’intèrpret (p.17) Alta
- {17} No es poden instal·lar paquets nous a Python (p.9) Alta
- {18} Llibreries preinstal·lades: pandas, numpy, matplotlib (p.24) Mitjana
- {19} DALL·E només invocable des del LLM, no per API directa (p.8) Alta
- {20} Processament de fitxers limitat per expansió de RAM (p.15) Alta
- {21} Sense trucades de xarxa des de Python, només des del Navegador (p.9) Alta
- {22} Propagació d’errors gestionada per eines (p.8) Alta
- {23} Solució alternativa: verificar la integritat després de la transferència (p.17) Alta
🔒 Capa 3: Sandbox / Entorn d’Execució
- {24} Micro-VM Firecracker/gVisor (segons inferència) (p.13) Mitjana
- {25} RAM efectiva assignada ~7-8GB, total VM ~10GB (p.14) Alta
- {26} Estat efímer, destrucció total després de sessió/error (p.14) Alta
- {27} Aïllament complet de xarxa (sandbox) (p.9) Alta
- {28} Inici VM <125ms, overhead <5MB (p.9) Alta
- {29} SO base minimalista, espai temporal /home/oai/share (p.14) Alta
- {30} Límits per sessió: ~5 min de rellotge (p.16) Alta
- {31} Límits pràctics de fitxers: 100-150MB (p.15) Alta
- {32} MemoryError → sandbox degradat, cal reiniciar (p.14) Alta
- {33} GC de Python limitat, possible fuga en cas límit (p.16) Baixa
- {34} No es pot accedir a disc fora de la VM/sandbox (p.9) Alta
- {35} Cost per sessió = RAM x temps + overhead (p.9) Alta
- {36} Solució: dividir dades en blocs per evitar MemoryError (p.17) Alta
Arquitectura dels Agents de ChatGPT – (III)
Observabilitat, Traçabilitat i Metadades (v2.3-beta adaptada)
Violeta
Observabilitat
Observabilitat
🟩
Sandbox
Sandbox
🟦
Nucli
Nucli
🟨
Eina
Eina
Colors i símbols: veure llegenda final | Confiança: Alta, Mitjana, Baixa
🔎 Capa 6: Observabilitat i Traçabilitat
- {56} No exposa logs detallats a l’usuari final
- {57} Errors i límits reportats per missatge, no amb traca descarregable
- {58} Sense auditoria externa de la sessió (per seguretat i privacitat)
- {59} Canvis arquitectònics inferibles només pel comportament extern
- {60} Nivells de confiança assignats per evidència replicable
Exemple: Taula de Metadades per Ítem
| Nº | Ítem/Resum | Pàgina | Confiança | Nota/Solució |
|---|---|---|---|---|
| 24 | Micro-VM Firecracker | 13 | Mitjana | Arquitectura inferida, no confirmada |
| 25 | RAM 7-8GB/sessió | 14 | Alta | Validat empíricament |
| 32 | Sandbox degradat | 14 | Alta | Reiniciar conversa després de l’error |
Per a una anàlisi ampliada: suggeriment de taula editable (més columnes: font, reproductibilitat, etc.)
Llegenda i Referències
- 🟦 Nucli (Raonament, LLM, blau)
- 🟨 Eina (Python, Navegador, DALL·E, ambre)
- 🟩 Sandbox (Micro-VM, entorn aïllat, verd)
- 🟫 Interfície (Col·laboració, gris)
- 🟥 Límit (Seguretat, restriccions crítiques, vermell)
- 🟪 Observabilitat (Traçabilitat, logs, violeta)
- Alta, Mitjana, Baixa: Nivell de confiança
Font: Arquitectura Agents ChatGPT, JL de la Torre, v2.3-beta
