Multi-Model Consensus API — Business-analyse

0Inleiding — wat bouwen we, en waarom?

De gedachte achter het project, in gewone taal.

Het idee in één alinea

Wie vandaag een AI-vraag stelt, vertrouwt blind op één model van één aanbieder. Maar modellen verschillen: de een is sterker in code, de ander in taal, een derde in feiten. Ons platform laat je één vraag in één API-call aan meerdere topmodellen tegelijk stellen (Claude, GPT, Gemini, …). Vervolgens doet het platform het denkwerk: het versmelt de antwoorden tot één superieur antwoord, laat zien waar de modellen het eens of oneens zijn, kiest het beste, óf geeft alles ruw terug zodat de klant zelf beslist. De klant krijgt dus niet "een AI", maar het gewogen oordeel van meerdere AI's — via een interface die naadloos in bestaande tools past (OpenAI-compatibel).

Waarom dit ertoe doet

Betrouwbaarheid. Als drie onafhankelijke modellen hetzelfde zeggen, is de kans op een hallucinatie veel kleiner. Verschillen ze, dan is dat zélf waardevolle informatie ("hier is onzekerheid").
Kwaliteit boven snelheid. We verkopen geen goedkoop of snel — we verkopen het beste antwoord. Voor wie een fout duur is (juridisch, financieel, medisch, code in productie) is dat het kopen waard.
Geen lock-in voor de klant. Eén integratie, alle modellen — de klant zit niet vast aan één leverancier en profiteert automatisch van elk nieuw topmodel.

Voor wie

Developers en AI-agent-bouwers die hun agents een "second opinion"-laag willen geven, en bedrijven in kwaliteits- of compliance-gevoelige sectoren die zekerheid over een AI-antwoord belangrijker vinden dan de laagste prijs per call.

Gat in de markt — of tijdverlies?

Eerlijk antwoord: het idee is gevalideerd, maar het is géén open gat (meer). De vraag bestaat aantoonbaar — er is een directe concurrent (llmconsensus.io) én, kritischer, de categorieleider OpenRouter (~$1,3B) lanceerde in maart 2026 zelf "Fusion", dat ons kernmechanisme nabootst. Tegelijk: niemand heeft dit segment "gewonnen", de onderliggende markt groeit hard, en de kostprijs/marge-verhouding is gezond (concurrent rekent ~6× onze kostprijs). Het wordt dus geen race om het idee, maar om uitvoering en differentiatie: de diff-modus met zekerheidssignaal, volledige kostentransparantie, BYOK, en EU/NL-hosting zijn dingen die de grote, generieke spelers (nog) niet bieden.

Korte conclusie: bouwbaar, legitiem en met gezonde marges — maar geen blanco gat. Een "me-too consensus-API" tegenover OpenRouter Fusion is tijdverlies. Een scherp gedifferentieerd, EU-gehost kwaliteits/transparantie-product voor een duidelijke niche is dat niet. De go/no-go hangt op de differentiatie- en niche-keuze (sectie 3) — niet op het concept of de techniek.

1Management-samenvatting

De korte versie voor de beslissing.

$0,055

Kostprijs per "Balanced" consensus-call (3 frontier-modellen + synthese)

6×

Marge-headroom: directe concurrent rekent ~$0,35 voor vergelijkbare call

~$1,3B

Waardering categorieleider OpenRouter (Series B, mei 2026) gepub.

$2,76B

LLM-gateway-markt 2026 → $7,21B in 2030 schatting

De markt is reëel en groeit hard. De LLM-gateway/aggregatie-categorie wordt geleid door OpenRouter, dat in mei 2026 een $113M Series B ophaalde (~$1,3B waardering) en ~100 biljoen tokens/maand verwerkt — een 5× groei in zes maanden.
Er zijn al directe concurrenten — inclusief de categorieleider. llmconsensus.io doet vrijwel exact ons concept. En kritischer: OpenRouter lanceerde 31 mrt 2026 "Fusion" — parallel naar meerdere modellen + een Judge-model dat fuseert tot één antwoord. Dat is onze consensus/best_of-kern, van de grootste speler met enorme distributie (zie sectie 3). Differentiatie is geen luxe maar noodzaak.
De unit-economics zijn gezond. Een "Balanced"-call kost ons ~$0,055; de concurrent vraagt er ~$0,35 voor. Zelfs bij conservatieve 2× marge zitten we ruim onder de marktprijs met ~50% brutomarge.
Onze differentiatie: alle vier de modi (consensus / diff / best_of / raw), OpenAI-compatibele drop-in, BYOK-optie, transparante kosten-per-model-rapportage, en EU/NL-hosting + Vault-beveiliging.
Naamgeving: na drie merkanalyses is de aanbeveling claritysynth.com of syntharbiter.com; uit de geverifieerd-beschikbare domeinen is synthvote.com de schoonste. Definitieve keuze = jouw beslissing.

Belangrijk over de cijfers: token-prijzen en de twee kernspelers (OpenRouter, llmconsensus.io) zijn hard geverifieerd uit primaire bronnen. Marktomvang (TAM/SAM) en de omzet van enkele kleinere spelers zijn onderbouwde schattingen of niet bevestigd — overal gemarkeerd met gepub. / schatting / gat. Prijzen zijn dagvers (mei 2026) en bewegen snel: her-verifieer vóór je de pricing vastzet.

2Het product in het kort

Waarom dit een legitiem, verkoopbaar product is.

De klant stuurt één prompt naar een OpenAI-compatibele endpoint en geeft op welke modellen en welke modus hij wil. Het platform legt de taak parallel voor aan meerdere frontier-LLMs en geeft, afhankelijk van de modus, één resultaat terug:

Modus	Wat het doet	Model-calls
`consensus`	Versmelt N antwoorden tot één superieur antwoord (Mixture-of-Agents)	N + 1
`diff`	Toont waar modellen het eens/oneens zijn + zekerheidssignaal	N + 1
`best_of`	Een "judge"-model kiest het beste hele antwoord + reden	N + 1
`raw`	Geeft alle N antwoorden terug — agent beslist zelf (geen synthese)	N

Legitiem, geen doorverkoop. Dit is een "value-added application" bovenop de provider-API's — geen credential-sharing of doorverkoop van ruwe toegang (beide ToS-verboden bij OpenAI & Anthropic). De toegevoegde waarde — multi-model synthese — bestaat bij geen enkele losse provider en vormt zowel de juridische verdediging als het verkoopargument.

3Concurrentielandschap & omvang

Wie zit er in deze hoek, en hoe groot zijn ze?

Speler	Positionering	Funding / omvang	Prijsmodel	Status
OpenRouter	Unified LLM-gateway, 1 key → honderden modellen	$113M Series B (CapitalG/Alphabet), ~$1,3B post-money; ~100T tokens/mnd, 5× in 6 mnd	Pay-per-token + take-rate	gepub.
Together AI	Inference-cloud + GPU-rental (aangrenzend, geen pure gateway)	~$1B ARR (feb '26); $533,5M opgehaald; ronde ~$1B @ $7,5B in de maak. API = 30-40% van omzet	Per-token API + GPU-huur	gepub.
OpenRouter Fusion	⚠️ Directe concurrent — multi-model + Judge-fusie, sinds 31 mrt 2026 (experiment via OpenRouter Labs)	Onderdeel van OpenRouter (~$1,3B); enorme distributie	Bovenop pay-per-token-gebruik	gepub.
llmconsensus.io	⚠️ Directe concurrent — consensus-product, Fast/Balanced/Deep	Geen funding-data (indie/klein)	EUR-credit-packs (€49/149/399) + x402-rail $0,05/$0,35/$4,50	gepub.
Portkey	Enterprise AI-gateway (observability, governance, guardrails)	$18M totaal; $15M Series A (feb '26, Elevation/Lightspeed); ~$5M ARR (2024)	SaaS-tiers + enterprise	gepub.
Helicone	LLM-observability + gateway (open-source, YC W23)	$5M seed @ $25M waardering	Freemium + usage	gepub.
LiteLLM/BerriAI, Not Diamond, Martian, Requesty, nexos.ai	Routing / gateways / model-selectie	Funding/omzet niet bevestigd in deze ronde — apart na te trekken		gat

Wie is de grootste?

Genuanceerd antwoord: OpenRouter is de grootste pure gateway qua funding, waardering en gebruiksvolume (geverifieerd). Together AI is qua omzet groter (~$1B ARR), maar dat is een andere categorie (inference-cloud + GPU-verhuur, API is maar 30-40%). OpenRouter's eigen ARR is niet hard te verifiëren (een rondgaand cijfer van ~$50M overleefde de verificatie niet).

Strategische realiteit (bijgesteld 29 mei): consensus/synthese is géén onbezet gat meer. Naast het kleine llmconsensus.io heeft OpenRouter zelf nu "Fusion" — exact het consensus/judge-mechanisme, vanuit de categorieleider met distributie en pricing-macht. Onze openingen liggen daarom in differentiatie, niet in het concept zelf: (1) de diff-modus (disagreement + zekerheidssignaal — sterk voor compliance/enterprise), (2) raw + volledige kosten-per-model-transparantie, (3) BYOK, (4) EU/NL-hosting & Vault-beveiliging, (5) een dedicated, ondersteund product i.p.v. een experiment-feature. Open vraag voor nader onderzoek: is er ruimte naast Fusion + llmconsensus.io, of moeten we een verticale/niche-positie kiezen? (Paperclip INT-1374, high.)

4Marktomvang

Hoe groot is de taart? — let op: definities lopen sterk uiteen.

$2,76B → $7,21B

LLM-gateway-markt 2026 → 2030 schatting

45,5%

CAGR AI-agents-markt ($8,29B '25 → $12,06B '26) schatting

$11,6B → $824B

Totale LLM-markt 2026 → 2040 (CAGR 35,6%) schatting

Voorbehoud: deze cijfers komen uit verschillende marktrapporten met verschillende definities (smalle "middleware-gateway" $18,9M → $189M vs. brede "LLM-gateway" $2,76B → $7,21B). Geen enkele overleefde een strenge cross-verificatie. Gebruik ze als orde-van-grootte, niet als bodem onder een businessplan. De relevante SAM voor ons (consensus-API, betalende developers/bedrijven) is een fractie hiervan en niet apart becijferd.

De richting is wat telt: een snelgroeiende basismarkt (gateways + agents) waar consensus/kwaliteit een opkomend premium-segment is — inmiddels wél betreden door OpenRouter Fusion en llmconsensus.io, dus de strijd gaat om differentiatie en uitvoering, niet om het idee.

5Unit-economics

Wat kost één call ons écht? — model op basis van geverifieerde mei-2026 token-prijzen.

Geverifieerde token-prijzen gepub.

Model	Input /1M	Output /1M	Kost bij 1k in + 500 out
Claude Opus	$5,00	$25,00	$0,0175
Claude Sonnet	$3,00	$15,00	$0,0105
Claude Haiku	$1,00	$5,00	$0,0035
GPT-5.5	$5,00	$30,00	$0,0200
Gemini 3.1 Pro	$2,00	$12,00	$0,0080
Gemini 2.5 Flash	$0,30	$2,50	$0,0016

Aanname representatieve call: 1.000 tokens input (gedeelde prompt per model), 500 tokens output per model. Synthese-stap: input = prompt + alle N antwoorden, output ~600 tokens.

Kostprijs per call, per tier

Tier (3 modellen + synthese)	Samenstelling	Proposers	Synthese	Totaal/call
Fast	Haiku + Gemini Flash + GPT-minimini=schatting	$0,0063	$0,0055	≈ $0,012
Balanced	GPT-5.5 + Sonnet + Gemini 3.1 Pro (synth=Sonnet)	$0,0385	$0,0165	≈ $0,055
Deep	GPT-5.5 + Opus + Gemini 3.1 Pro (synth=Opus)	$0,0455	$0,0275	≈ $0,073

De N+1-regel: elke synthese-modus kost de N proposer-calls plus één aggregator-call. De raw-modus bespaart die synthese-call (~25-35% goedkoper) — een mooi laaggeprijsd instappunt waarbij de agent zelf beslist. LiteLLM zelf kost nul tokens (puur mechanisch vertalen).

6Prijs- & margestrategie

Waar ligt de prijs-vloer, en hoeveel headroom is er?

Verkoopprijs bij instelbare marge (Balanced-call, kostprijs $0,055)

Marge-factor	Verkoopprijs	Brutomarge	Positie vs. concurrent ($0,35)
1,5× (50% opslag)	$0,083	33%	76% goedkoper
2,0× (100% opslag)	$0,110	50%	69% goedkoper
3,0× (200% opslag)	$0,165	67%	53% goedkoper
llmconsensus.io-niveau	$0,350	84%	marktprijs

Conclusie: de directe concurrent prijst een vergelijkbare call op ~6× onze kostprijs. Er is dus enorme ruimte. Een instelbare marge tussen 2× en 3× levert 50-67% brutomarge én een prijs die fors onder de concurrent ligt — een sterk "betere kwaliteit, eerlijker geprijsd"-verhaal.

De twee verdienmodellen

Credits (default)

Prepaid credits; elke call trekt werkelijk verbruik × instelbare marge af. Voorspelbaar, schaalt met gebruik, volledige kosten-per-model-rapportage. Brutomarge = de marge-factor (minus verwaarloosbare infra).

BYOK (enterprise)

Klant brengt eigen provider-keys in; wij rekenen een platform-fee voor de orkestratie (geen token-marge). Bijna 100% marge op de fee, en nul ToS-risico op doorverkoop. Verkoopt aan grotere klanten die hun eigen spend willen beheren.

Marginale infra-kosten per call (CPU, Postgres/Redis op bestaande dev01) zijn verwaarloosbaar t.o.v. de token-kosten — de brutomarge wordt vrijwel volledig door de marge-factor bepaald.

7Omzet-scenario's

Illustratief — gebaseerd op blended $0,10 verkoopprijs / $0,05 kostprijs (≈ Balanced @ ~2×).

Scenario	Calls/maand	Omzet/maand	Brutowinst/maand	Schaal-referentie
Pilot	100.000	$10.000	$5.000	~50 actieve klanten, lichte agents
Groei	1.000.000	$100.000	$50.000	~0,005% van OpenRouter's volume
Schaal	10.000.000	$1.000.000	$500.000	serieuze niche-speler

Lees als gevoeligheids-model, niet als forecast. Werkelijke cijfers hangen af van adoptie, tier-mix, marge-keuze en gemiddeld verbruik per call. Het punt: zelfs een kleine vangst van een snelgroeiende markt geeft gezonde brutomarges, omdat de prijs-vloer ruim onder de marktprijs ligt. Klantenwerving, niet kostprijs, is de bottleneck.

8Naamgeving & domein

Resultaat van drie merkanalyses + de afweging tussen tegenstrijdige adviezen.

Beschikbare domeinen (door Mes geverifieerd, 29 mei)

consensvote.comvotesynth.comaiconsenso.comsynthvote.com harmoniiq.comsynvote.comconseniq.comunaniiq.comvoteconsens.com

Nieuwe kandidaten (arbiter/judge/clarity — .com nog te checken)

arbitervote.comarbitervox.comvoxarbiter.comsyntharbiter.com arbiterflow.comarbiternex.comjudgevox.comjudgesynth.com judgenex.comclaritysynth.comquorumclarity.com

Aanbeveling (3 analyses samengevoegd)

claritysynth.com— beste overall (3,9/5): verkoopt de uitkomst (zekerheid/helderheid), geen politieke bijklank, internationaal schoon.

Rang	Naam	Sterkte	Let op
#1	claritysynth.com	Beste overall; communiceert de klantbelofte	.com checken; "synth" ≈ synthesizer (laag risico bij devs)
#2	syntharbiter.com	Beste product-fit (5/5): "synthetiseert + arbitreert"	"arbiter" = trademark-risico (legal-tech)
#3	arbitervox.com	Elegant, memorabel; "gezaghebbende stem"	"vox" opaque buiten Westerse markten
vote-hoek	synthvote.com	Schoonste van de geverifieerd-beschikbare domeinen	"vote" = "meerderheid wint"-bijklank

Conflict tussen adviezen — eerlijk gemeld. Eén extern advies beval sterk arbitervote.com of consensvote.com aan. Beide werden door onze analyses juist laag beoordeeld: arbitervote.com kreeg de laagste score van alle namen (interne tegenspraak — "arbiter" = autoriteit vs. "vote" = democratie), en consensvote.com scoorde 2,57/5 (uitspraakproblemen: "censuur"-klank in NL, "consenso/consent"-verwarring in EU). Beide leunen op het "vote"-thema, dat als de zwakste hoek werd aangemerkt. Tegenargument: "vote" is wél meteen begrijpelijk — een reëel marketing-voordeel. Dit is uiteindelijk een positioneringskeuze (begrijpelijkheid vs. kwaliteits-positionering) en jouw beslissing.

Vóór merkbouw: (1) .com-beschikbaarheid van de arbiter/judge/clarity-namen verifiëren. (2) Trademark-check (EUIPO/USPTO klasse 42) — vooral "arbiter" (Arbiter Sports + legal-tech) en "clarity" (historische Salesforce/Oracle-registraties).

9Risico's & aanbevelingen

Risico	Impact	Mitigatie
Directe concurrent (llmconsensus.io) al live	Markt deels bezet	Differentiëren op 4 modi + transparantie + BYOK + EU-hosting; niet op prijs alleen
Token-prijzen bewegen snel	Marge-erosie	Versioned `pricing`-tabel + instelbare marge-knop; her-verifiëren vóór launch
Latency (N+1 parallelle calls)	Trager dan single-model	Positioneren op kwaliteit, niet snelheid; streaming op synthese-stap
Provider-ToS (value-add vs. doorverkoop)	Juridisch	Echte synthese-waarde leveren; geen ruwe key-doorverkoop; BYOK voor zwaar verkeer
Afhankelijkheid LiteLLM	Lock-in	Eigen `ProviderInterface` ervoor; LiteLLM vervangbaar gehouden

Aanbevolen volgende stappen

Domein + naam vastleggen (check beschikbaarheid arbiter/clarity-namen + trademark).
Concurrentie-gat dichten: funding/omzet van LiteLLM, Not Diamond, Martian, Requesty, nexos.ai apart natrekken.
Implementatieplan opstellen (writing-plans) op basis van de afgeronde design-spec.
MVP-prijspunt kiezen (advies: credits @ 2-3× marge, BYOK als enterprise-optie).

10Bronnen & verificatie-status

Wat is hard, wat is schatting, wat is een gat.

gepub. primaire bron, geverifieerd schatting onderbouwd, niet hard bevestigd gat niet geverifieerd deze ronde

gepub. OpenRouter Series B — BusinessWire · TechCrunch (onafh.)
gepub. llmconsensus.io product + pricing — llmconsensus.io · OpenRouter Fusion — openrouter.ai/docs · Fusion
gepub. Claude-prijzen — platform.claude.com · GPT — developers.openai.com · Gemini — ai.google.dev
gepub. Together AI ~$1B ARR / funding — Sacra · Crunchbase News
gepub. Portkey $15M Series A — Portkey · SaaS News · Helicone seed — Tracxn
schatting Markt-omvang LLM-gateway / AI-agents / LLM-markt — getmaxim.ai · IntelMarketResearch · Yahoo/RnM
schatting ToS-legitimiteit — OpenAI Business terms · Anthropic Commercial Terms
gat Omzet/funding LiteLLM/BerriAI, Not Diamond, Martian, Requesty, nexos.ai · OpenRouter eigen ARR/take-rate · harde TAM/SAM

Tijdgevoeligheid: alle prijzen en de OpenRouter-ronde zijn dagverse mei-2026-cijfers. Modelnamen zijn volatiel (Opus 4.5–4.8 alle $5/$25; Opus 4.7+ tokenizer kan ~35% meer tokens per tekst gebruiken → hogere effectieve kost). Her-verifieer vóór je de unit-economics vastzet.