← Vissza a címlapra
RÓLUNK

A döntéshozó réteg mögött tizenkét ember áll.

A Nortinia Engine egy tizenkét fős budapesti mérnöki csapat munkája. Tíz év LLM-tapasztalat, egy meggyőződés: a modell-választást nem a felhasználónak kell intéznie. A motor dönt, te dolgozol.

2024
ELSŐ DÖNTÉS
11
MÉRNÖK
8
MODELL CSALÁD
HU · EN
KORLÁTLAN NYELV
A TÖRTÉNET

Miért építettük.

2024 nyarán megszámoltuk — az átlagos AI-asszisztens projektünkben hat különböző LLM-hívást futtattunk párhuzamosan, és senki nem tudta megmondani, melyik mit költ. Ez nem infrastruktúra. Ez kontrollálatlan számla.

Egy budapesti kereskedelmi platformnál nyolc különböző chat-asszisztens futott egymás mellett — fejlesztett a marketing, a support, a logisztika, és az ügyvezetés. Mindegyik más LLM-en. Mindegyik más prompt-stratégiával. Senki nem mérte, melyik milyen drága, milyen gyors, vagy egyáltalán működik-e.

2024-ben eldöntöttük: felépítjük a réteget, ami eddig hiányzott. Nem újabb LLM-burkolót. Egy döntéshozót, ami minden kérésre futás közben választ modellt, eszközt, lépésszámot, kontextust. Multi-tenant, multi-modell, egy interfész.

Tizenhárom hónappal később 42 tenant futott rajta. Az átlagos költséghatékonyság 3.2×, a tool-választás átlaga 100 ms alatt. A fejlesztők nem írnak több if/else router-logikát — a motor választ.

DÖNTÉS · DÖNTÉSI GRÁF · t = 92ms

Egyetlen kérés. Három jelölt. Egy győztes.

Minden bejövő kéréshez a router kiértékel 3-5 jelöltet (modell × eszköz × kontextus). A győztest a futtatás előtt választja ki — költség, latencia és minőségi score alapján.

REQUESTgpt-4o · €0.42 · 320msquality 0.94 · skippedsonnet-4 · €0.18 · 110msquality 0.92 · PICKEDllama-local · €0.01 · 80msquality 0.76 · skippedRESPONSE
HITVALLÁS

Hat mondat. A többi ebből jön.

01
A modell-választás láthatatlan.

A jó motor nem kérdez vissza, hogy melyik LLM-mel akarsz dolgozni. A te kérdésed számít, nem a szállító neve. Mi a háttérben döntünk, és elmondjuk, miért.

02
A költséget mérni kell.

Minden kérés egy árcédulát kap futás közben. Ha 4 cent elég, nem hívunk 40 centeset. A számládat reggel a metrika magyarázza, nem a havi meglepetés.

03
Az audit nem opció.

Minden döntés mögé indok kerül. Melyik modell, miért, mennyiért, milyen kontextussal. A naplót nem törölheti senki — beleértve minket is.

04
A latencia tervezhető.

92 ms átlagos döntésidő. Nem a véletlen műve — minden cache-szint, minden routing-szabály, minden fallback előre megírt játszma.

05
Korlátlan nyelven.

Nem HU/EN kapcsoló — bármely nyelven kérdezhetsz, és a motor a megfelelő nyelven válaszol. A prompt-tár nem ismer határt.

06
Bevalljuk, ha rossz.

Ha a motor rossz modellt választott, a post-mortem publikus, és a router-szabály kódban változik a következő release-ig. Nincs „tanulság”-nyelv.

A CSAPAT

Tizenkét ember. Egy interfész.

Senior-only mérnöki szervezet. A founderek kódolnak. Mindenki ír router-szabályt, mindenki olvas trace-eket.

4
LLM ops

Router-szabályok, fallback-stratégiák, modell-egészség. Nyolc szállító, egy interfész.

4
Backend

NestJS, Postgres, Redis, BullMQ. Multi-tenant RLS, audit log, kvóták. Egyetlen rendszerben fut a 42 ügyfél.

2
Prompt evaluation

Mérünk: minőség, költség, latencia. Egy kérdés három modellen, három mérőszámon — utána döntés.

1
DevOps

Magyarországi szerverflotta, Kubernetes, CI/CD, monitoring és incidensválasz. A motor rendelkezésre állása az ő keze alatt fut.

2
Founders

Még mindig kódolnak. Heti egy ügyfél-interjú. Nincs HR osztály.

A BEMUTATKOZÁS VÉGE

Beszéljünk a te forgalmadról.

20 perc, képernyőmegosztás, a saját kéréseidből generált becslés. Utána kapsz egy írott összefoglalót, hogy a motor mit tudna nálad átvenni.

Nortinia Engine — LLM orchestrator és AI model routing platform