Multi-provider routing
OpenAI, Anthropic, Google, Mistral, open-source modellek + on-prem — egy interfész.
A Nortinia Engine LLM orchestrator: AI döntéshozó és model routing réteg, ami minden kérésnél kiválasztja a leggyorsabb, legpontosabb és legköltséghatékonyabb modellt, eszközt és fallback útvonalat.
Egy LLM orchestrator nem csak proxy: kontextus, költség és latency alapján választ modellt, kezeli a fallback-et, retry-t és a circuit breaker-t, naplózza a döntéseket és tenant-szinten korlátozza a kvótát.
A Nortinia Engine ezt egy HTTP endpoint + SDK formájában adja. Eldöntheted, hogy melyik kérés melyik modellhez menjen (regel + ML-alapú policy), és minden döntés audit-trail-elt.
OpenAI, Anthropic, Google, Mistral, open-source modellek + on-prem — egy interfész.
Per-request modellválasztás kontextus, ár és válaszidő alapján.
Provider-kimaradás esetén automatikus failover. Circuit breaker. Retry per-modell limittel.
Minden döntés naplózott: prompt, modell, kontextus, ár, latency. Tenant-szintű kvóta.
Mely kéréseid mely modellbe valók? Pricing, latency, accuracy szempont.
Routing-szabályok: chat → claude-haiku, kód → gpt-4o, RAG → llama on-prem.
Egy HTTP endpoint a meglévő appodba. SDK-k: TypeScript, Python, Go.
Élő dashboard, eval harness, drift-detection. SLA monitoring.
Az LLM gateway egyetlen API mögé bújtatja a többi providert (auth, rate limit, logging). Az LLM orchestrator ezenfelül per-request döntést hoz a modellválasztásról, fallback-ről, tool routing-ról és optimalizálja a költséget + latency-t.
A use-case-től függ — tipikusan 30-50% a kontextus-szenzitív routing-gal (small model olcsó kérdésekre, large model komplexre). Az eval harness-szel mérve, A/B tesztelhetően.
Egyetlen HTTP endpoint-tal. A meglévő OpenAI/Anthropic SDK-hívásaidat lecseréled a Nortinia Engine endpointra, és a routing már szerveroldalon történik. Kompatibilis a streaming + tool-calling protokollokkal.
Igen — saját VPC, on-premise vagy NIP Platform-managed deployment. Open-source modellek (Llama, Mistral) is támogatva.
30 perces architektúra workshop, ROI-becslés, konkrét bevezetési terv.