Claude/Ollama intelligent routing pour optimisation cost-aware
┌────────────────────────────────┐
│ 💬 User Query + Context │
│ (from RAG/Symbolic/Forecast) │
└──────────────┬─────────────────┘
│
▼
┌──────────────────────┐
│ 🔍 Complexity Score │
│ • Token count │
│ • Query type │
│ • Domain expertise │
└──────────┬───────────┘
│
┌──────▼──────┐
│ Cost-aware │
│ routing │
└──┬───────┬──┘
│ │
Simple │ │ Complex
│ │ │ │
▼ ▼ ▼ ▼
┌─────────────┐ ┌──────────────┐
│ 🏠 Ollama │ │ ☁️ Claude API │
│ • Free │ │ • High qual │
│ • Fast │ │ • Reasoning │
│ • llama3.1 │ │ • Sonnet 4.5 │
└─────┬───────┘ └──────┬───────┘
│ │
└────────┬────────┘
│
▼
┌──────────────────────┐
│ ✅ Response Check │
│ • Quality score │
│ • Fallback logic │
└──────────┬───────────┘
│
▼
┌──────────────────────┐
│ 📦 Final Answer │──► User
└──────────────────────┘
