Une seule porte vers tous vos LLM
La passerelle IA open-source LiteLLM, installée et maintenue par DINAO. Appelez 100+ modèles au format OpenAI depuis un point unique, hébergé sur nos serveurs français — clés, coûts et accès sous votre contrôle.
Qu'est-ce que LiteLLM ?
LiteLLM est une passerelle IA (AI Gateway) open-source offrant un accès unifié à plus de 100 fournisseurs de modèles de langage — OpenAI, Anthropic, Gemini, Bedrock, Azure, Cohere, modèles locaux… — le tout via un format compatible OpenAI. Vous appelez n'importe quel LLM avec la même interface, et vous changez de modèle sans réécrire votre code.
Au-delà du routage, LiteLLM apporte une couche de gouvernance : clés virtuelles par équipe ou projet, suivi des dépenses (spend tracking), guardrails, load-balancing, logging et un dashboard d'administration. C'est l'outil pour centraliser et maîtriser tous les appels IA d'une organisation.
Côté technique, le proxy s'appuie sur Python, PostgreSQL en production et Redis en forte charge, avec des performances de l'ordre de quelques millisecondes de latence à un millier de requêtes par seconde. Déployé en conteneurs par DINAO et routé vers un modèle local, il devient une passerelle souveraine hébergée en France.
Hébergez LiteLLM chez DINAO
Paliers de ressources compatibles avec les pré-requis de LiteLLM (1 vCPU / 1 Go / 5 Go minimum). Hébergé en France, infogéré.
- 1 vCPU dédiés
- 2 Go de RAM
- 20 Go NVMe
- Sauvegardes quotidiennes
- Infogéré & supervisé par DINAO
- 2 vCPU dédiés
- 4 Go de RAM
- 40 Go NVMe
- Sauvegardes quotidiennes
- Infogéré & supervisé par DINAO
- 4 vCPU dédiés
- 8 Go de RAM
- 80 Go NVMe
- Sauvegardes quotidiennes
- Infogéré & supervisé par DINAO
- 8 vCPU dédiés
- 16 Go de RAM
- 160 Go NVMe
- Sauvegardes quotidiennes
- Infogéré & supervisé par DINAO
Cette application utilise l'IA
Le conteneur n'embarque pas de calcul IA : les étapes IA s'appuient sur une puissance externe au conteneur, fournie via un service complémentaire AI (Mistral, OpenAI, Anthropic…) branché avec votre propre clé. Prenez un pack de tokens pour démarrer (abonnements fournisseurs non inclus).
Détails techniques
Vous vous demandez…
LiteLLM héberge-t-il les modèles ou les appelle-t-il ?
C'est une passerelle : elle route vos appels vers le fournisseur de votre choix, au format OpenAI. Vous pouvez la pointer vers un modèle local hébergé chez DINAO (souverain) ou vers une API externe.
Mes prompts restent-ils en France ?
La passerelle, ses clés et ses logs tournent sur votre instance en France. Si vous la routez vers un modèle local, vos prompts ne sortent pas ; routée vers une API externe, le contenu part chez le fournisseur (voir la note souveraineté).
Comment maîtriser les coûts et les accès ?
LiteLLM permet de créer des clés virtuelles par équipe ou projet, de suivre les dépenses (spend tracking), de poser des quotas et des guardrails — une gouvernance centralisée de vos appels IA.
Dois-je réécrire mon code pour changer de modèle ?
Non. Tous les modèles sont exposés au format OpenAI : vous changez de fournisseur ou de modèle via la configuration, sans modifier votre application.
La passerelle tient-elle la charge ?
Oui. Avec PostgreSQL et Redis, LiteLLM gère un trafic élevé (de l'ordre de 1000 req/s) avec une latence faible. Les paliers supérieurs ajoutent load-balancing et haute disponibilité.