Passerelle LLM compatible OpenAI
Une intention,
pas un modèle.
Demandez auto:economy, balanced ou quality : le routeur arbitre en continu le meilleur modèle au meilleur prix, sur les coûts et la fiabilité réellement observés.
Compatible SDK OpenAI : changez la base URL, gardez votre code. Prépayé, sans abonnement.
décision de routage
POST /v1/chat/completions
model auto:balanced
→ deepseek/deepseek-v4-pro
raison balanced tier, smart:
cheapest healthy
coût $0.000041 / requête
candidats 4 · santé 100 %economybalancedquality
Le prix, surveillé pour vous
Chaque candidat est mesuré en continu : coût réel par requête, taux d'erreur, santé. Un modèle qui se dégrade perd le trafic, automatiquement.
Vos chiffres, au centime
Chaque réponse porte son coût exact (usage.cost). Le tableau de bord agrège par jour et par modèle. Pas d'abonnement : vous créditez, vous consommez.
Sans engagement de code
Un id concret (vendor/model) est honoré tel quel. Les outils, le streaming et les sorties structurées passent intacts, garanti par contrat de test.