AI model routing — provider választás + fallback

Mit jelent ez

AI model routing — mi alapján dönt?

A Nortinia AI model routing négy szempont alapján dönt: kontextus-méret (mely model bírja), latency-igény (real-time vs batch), ár (token cost) és accuracy (eval-set alapján mért).

A routing policy explicit (rule-based, te állítod) és implicit (ML-alapú, eval-set tanítja). Mindkettő kombinálható, és minden döntés audit-trail-elt.

Routing dimenziók

Mi alapján választ modellt az Engine?

01

Kontextus-méret

4k, 16k, 128k, 1M — a kérés mérete alapján a megfelelő window-jú model.

02

Latency-igény

Real-time chat vs. batch task — modell kiválasztása response time alapján.

03

Token ár

Per-request cost optimization. Olcsóbb model olcsóbb kérdésekre.

04

Accuracy

Eval-set alapján mért pontosság. Magasabb accuracy igényű kérdéshez magasabb model.

Folyamat

Hogyan néz ki egy AI model routing pipeline?

01

Kérés érkezik

HTTP endpoint vagy SDK call. Token-count + context tagging.

02

Policy match

Rule-based: ha "/chat" → preferred small model. Ha kontextus > 32k → large window.

03

Eval feedback

Confidence + accuracy score — ha low, eskaláció nagyobb modellhez.

04

Audit

Decision log: melyik prompt, melyik model, ár, latency, fallback?

Kapcsolódó Nortinia / Netorigo megoldások

Mire épül és mihez illeszkedik

Nortinia Engine — termék főoldal

Az AI motor főoldala: működés, dashboard, API.

Fejlesztői dokumentáció

API, SDK, routing pipeline, agent architecture leírása.

Nortinia AI Assistant — fogyasztói és vállalati asszisztens réteg

Beágyazható AI asszisztens — a Nortinia Engine motorral.

NIP Platform — infrastruktúra és deployment

Self-hosted infrastruktúra az Engine futtatásához.

Gyakori kérdések

AI model routing — gyakori kérdések

Mit jelent a "per-request" routing?

Minden egyes API hívásnál a Nortinia Engine kiválasztja a megfelelő modellt — nem session vagy user szinten, hanem kérésenként.

Tudjuk-e felülírni a routing döntést?

Igen. A SDK / HTTP header-rel forced model paraméter — pl. `x-nortinia-model: claude-opus`. Auditban látszik mint manual override.

Mi történik provider outage esetén?

Automatikus fallback a következő provider-re a fallback chain alapján. Pl. anthropic-claude-haiku → openai-gpt-4o-mini → llama-3-8b on-prem.

Tudunk-e saját modellt routing-ba illeszteni?

Igen. Custom HTTP endpoint (OpenAI-compatible vagy egyedi protokoll) regisztrálható model provider-ként.

Routing a te policy-d szerint

Mutatjuk az AI model routing-ot a saját adataidon.

30 perces architektúra workshop, policy-tervezés, eval-becslés a végén.

Beszéljünk a megoldásról Routing pipeline docs