Diagrama de l'arquitectura dels Agents de ChatGPT (v2.3-beta)

Aquesta pàgina complementa l’article tècnic original «Arquitectura dels Agents de ChatGPT: anàlisi tècnica i operativa» (v2.3-beta), redactat per JL de la Torre. El diagrama interactiu següent mostra de forma estructurada les sis capes funcionals inferides mitjançant observació empírica, ús pràctic i enginyeria inversa.

Cada capa està codificada per colors, inclou referències creuades a l’informe complet i incorpora un nivell de confiança basat en evidències replicables. És un recurs útil per a docents en IA, desenvolupadors i auditors tècnics que vulguin comprendre els límits operatius i el model de funcionament intern dels Agents.

Arquitectura dels Agents de ChatGPT (I)

Metacontext, Nucli i Eines (v2.3-beta adaptada)

JL de la Torre | Juliol 2025 | CC BY-NC-SA

🧠
Nucli

🛠️
Eina

Groc
Tool

Blau
Nucli

Alta
Mitjana
Baixa
Confiança

Referències: (pàgina) | nivell de confiança

Capa 0: Metacontext i Sistema

{00a} Identitat: LLM d’OpenAI (cutoff Oct 2023, data actual reportada)
{00b} Versió del meta-prompt i feature flags (no exposats a l’usuari)
{00c} Distinció Free/Plus/Enterprise en recursos i accés a funcions
{00d} Awareness parcial dels canvis entre versions

🧠 Capa 1: Nucli de Raonament

{01} LLM especialitzat en chain-of-thought (p.7) Alta
{02} Meta-prompt explícit, instrucció ReAct (p.7) Alta
{03} Cicle Thought→Action→Observation (p.21) Alta
{04} Narració del pla i anàlisi post-execució (p.8) Alta
{05} Auto-correcció limitada (un sol intent) (p.25) Alta
{06} Sense memòria entre sessions (estat efímer) (p.17) Alta
{07} Principis de format i claredat en la sortida (p.23) Mitjana
{08} Regles d’estil: gràfics individuals, no seaborn, no colors (p.24) Mitjana
{09} Reconeix límits i els reporta explícitament (p.23) Alta
{10} Diferència arquitectònica: planifica i executa, no només assessora (p.10) Alta

Arquitectura dels Agents de ChatGPT – (II)

Sandbox, Interfície i Casos Límit (v2.3-beta adaptada)

Verd
Sandbox

Gris
Interfície

Taronja/Vermell
Límit/Risc

Referències: (pàgina) | nivell de confiança

🛠️ Capa 2: Orquestrador d’Eines

{11} Integra Python, Navegador, DALL·E sota gestió centralitzada (p.8) Alta
{12} Carpeta pont /home/oai/share (p.17) Alta
{13} Transferència només per còpia, no accés directe (p.17) Alta
{14} Operació seqüencial, mai concurrent (p.7) Alta
{15} Edge: corrupció possible en binaris (p.17) Mitjana
{16} El Navegador no accedeix a la memòria de l’intèrpret (p.17) Alta
{17} No es poden instal·lar paquets nous a Python (p.9) Alta
{18} Llibreries preinstal·lades: pandas, numpy, matplotlib (p.24) Mitjana
{19} DALL·E només invocable des del LLM, no per API directa (p.8) Alta
{20} Processament de fitxers limitat per expansió de RAM (p.15) Alta
{21} Sense trucades de xarxa des de Python, només des del Navegador (p.9) Alta
{22} Propagació d’errors gestionada per eines (p.8) Alta
{23} Solució alternativa: verificar la integritat després de la transferència (p.17) Alta

🔒 Capa 3: Sandbox / Entorn d’Execució

{24} Micro-VM Firecracker/gVisor (segons inferència) (p.13) Mitjana
{25} RAM efectiva assignada ~7-8GB, total VM ~10GB (p.14) Alta
{26} Estat efímer, destrucció total després de sessió/error (p.14) Alta
{27} Aïllament complet de xarxa (sandbox) (p.9) Alta
{28} Inici VM <125ms, overhead <5MB (p.9) Alta
{29} SO base minimalista, espai temporal /home/oai/share (p.14) Alta
{30} Límits per sessió: ~5 min de rellotge (p.16) Alta
{31} Límits pràctics de fitxers: 100-150MB (p.15) Alta
{32} MemoryError → sandbox degradat, cal reiniciar (p.14) Alta
{33} GC de Python limitat, possible fuga en cas límit (p.16) Baixa
{34} No es pot accedir a disc fora de la VM/sandbox (p.9) Alta
{35} Cost per sessió = RAM x temps + overhead (p.9) Alta
{36} Solució: dividir dades en blocs per evitar MemoryError (p.17) Alta

Arquitectura dels Agents de ChatGPT – (III)

Observabilitat, Traçabilitat i Metadades (v2.3-beta adaptada)

Violeta
Observabilitat

🟩
Sandbox

🟦
Nucli

🟨
Eina

Colors i símbols: veure llegenda final | Confiança: Alta, Mitjana, Baixa

🔎 Capa 6: Observabilitat i Traçabilitat

{56} No exposa logs detallats a l’usuari final
{57} Errors i límits reportats per missatge, no amb traca descarregable
{58} Sense auditoria externa de la sessió (per seguretat i privacitat)
{59} Canvis arquitectònics inferibles només pel comportament extern
{60} Nivells de confiança assignats per evidència replicable

Exemple: Taula de Metadades per Ítem

Nº	Ítem/Resum	Pàgina	Confiança	Nota/Solució
24	Micro-VM Firecracker	13	Mitjana	Arquitectura inferida, no confirmada
25	RAM 7-8GB/sessió	14	Alta	Validat empíricament
32	Sandbox degradat	14	Alta	Reiniciar conversa després de l’error

Per a una anàlisi ampliada: suggeriment de taula editable (més columnes: font, reproductibilitat, etc.)

Llegenda i Referències

🟦 Nucli (Raonament, LLM, blau)
🟨 Eina (Python, Navegador, DALL·E, ambre)
🟩 Sandbox (Micro-VM, entorn aïllat, verd)
🟫 Interfície (Col·laboració, gris)
🟥 Límit (Seguretat, restriccions crítiques, vermell)
🟪 Observabilitat (Traçabilitat, logs, violeta)
Alta, Mitjana, Baixa: Nivell de confiança

Font: Arquitectura Agents ChatGPT, JL de la Torre, v2.3-beta

delatorre.ai

Diagrama de l’arquitectura dels Agents de ChatGPT (v2.3-beta)