Log d'Analyse :: Architecte PrincipalAnalysis Log :: Principal Architect
[BOTTLENECK] Le VPS héberge l'inférence. La VRAM est le nerf de la guerre. Les modèles lourds (Qwen 72B) s'exécutent localement sur demande. Le VPS tourne des modèles rapides (DeepSeek 16B) en continu. The VPS hosts inference. VRAM is the critical resource. Heavy models (Qwen 72B) run locally on demand. The VPS runs fast models (DeepSeek 16B) continuously.
[SECURITY] Topologie pull-based : le local initie toujours vers le VPS via WireGuard. Pas de ports ouverts côté local. Le patron ECHO filtre toutes les intentions avant exécution. Pull-based topology: local always initiates toward the VPS via WireGuard. No open ports on the local side. The ECHO pattern filters all intents before execution.
Architecture multi-agents souveraine pour Umbra Labs — 8 agents spécialisés, infrastructure hybride VPS/Local, données 100% sous contrôle. Sovereign multi-agent architecture for Umbra Labs — 8 specialized agents, hybrid VPS/Local infrastructure, 100% data control.
Zone SécuriséeSecure Zone
Orchestrateur PythonPython Orchestrator
Pull Redis → Agent CrewAIPull Redis → CrewAI Agent
Ollama Local
qwen2.5-coder:32b / :72b
gVisor Sandbox
runtime runsc — réseau=noneruntime runsc — network=none
ChromaDB
Base vectorielle RAGRAG vector database
▸ Connexion sortante uniquementOutbound connection only
Tunnel ChiffréEncrypted Tunnel
WireGuard VPN
Headscale (souverain)Headscale (sovereign)
← BLPOP tasks (pull)
→ SET results
Zone PubliquePublic Zone
n8n Orchestrateurn8n Orchestrator
Webhooks + Queue ModeWebhooks + Queue Mode
Redis Queue
File d'attente des tâchesTask queue
AI Gateway (FastAPI)
POST /task → ECHO → Router
Ollama VPS
deepseek-v2:16b (rapide)
▲ Ports exposés: 80, 443, 51820/UDPExposed ports: 80, 443, 51820/UDP
n8n
Orchestrateur centralCentral orchestrator
Gère webhooks (Shopify, GitHub), polling IMAP, déclencheurs cron. Le patron ECHO (risk_validator.js) filtre toutes les intentions avant envoi à l'AI Gateway.Manages webhooks (Shopify, GitHub), IMAP polling, cron triggers. The ECHO pattern (risk_validator.js) filters all intents before sending to the AI Gateway.
CrewAI
Framework Multi-AgentsMulti-Agent Framework
8 agents spécialisés avec leurs tools. Processus séquentiels et hiérarchiques. Context passé entre agents via Task.context.8 specialized agents with their tools. Sequential and hierarchical processes. Context passed between agents via Task.context.
Ollama + FastAPI
Inférence + GatewayInference + Gateway
Ollama expose une API OpenAI-compatible. Le Gateway FastAPI route les tâches vers Redis. Chaque agent sélectionne son LLM selon la complexité.Ollama exposes an OpenAI-compatible API. The FastAPI Gateway routes tasks to Redis. Each agent selects its LLM based on task complexity.
gVisor + ChromaDB
Sécurité + MémoireSecurity + Memory
gVisor isole l'exécution du code généré (réseau coupé, read-only). ChromaDB stocke la base de connaissances vectorielle RAG des agents.gVisor isolates generated code execution (network off, read-only). ChromaDB stores the agents' RAG vector knowledge base.
Capacité de raisonnement vs VRAM requise (taille de bulle)Reasoning capability vs required VRAM (bubble size)
Trigger
Événement externeExternal event
GitHub, IMAP, Cron, Webhook
n8n ECHO
risk_validator.js
LOW / MEDIUM / HIGH
LOW → AUTO_RUN
MEDIUM → gVisor Sandbox
HIGH → Human Gate
AI Gateway
POST /task
FastAPI → Redis → Agent