Une seule API pour piloter toute votre IA
La passerelle LLM industrielle qui unifie tous vos modèles, mesure leurs performances et optimise prompts et coûts. Installée et supervisée par DINAO, vos inférences et vos feedbacks restent sur nos serveurs français.
Qu'est-ce que TensorZero ?
TensorZero est une plateforme open-source qui unifie en un seul produit une passerelle LLM, l'observabilité, l'évaluation, l'optimisation et l'expérimentation. Elle expose une API unique compatible OpenAI donnant accès à l'ensemble des grands fournisseurs de modèles, et conserve chaque inférence et chaque feedback pour permettre ensuite d'optimiser prompts, modèles et stratégies d'inférence.
La passerelle est écrite en Rust pour viser des performances industrielles : moins d'une milliseconde de latence au p99 et plusieurs milliers de requêtes par seconde. Routage intelligent, fallbacks automatiques, retries, cache, rate limiting, suivi des coûts et A/B testing sont intégrés nativement, tout comme la prise en charge des sorties structurées, du tool use, des embeddings, du multimodal et du batch.
Côté données, l'observabilité s'appuie sur ClickHouse (recommandé à fort volume) ou PostgreSQL (configuration la plus simple), et le déploiement se fait via Docker ou Kubernetes avec une configuration compatible GitOps.
Hébergez TensorZero chez DINAO
Paliers de ressources compatibles avec les pré-requis de TensorZero (1 vCPU (gateway 0,5 vCPU + store) / 512 Mo (gateway) + 1 Go (store) / 5 à 10 Go minimum). Hébergé en France, infogéré.
- 1 vCPU dédiés
- 2 Go de RAM
- 20 Go NVMe
- Sauvegardes quotidiennes
- Infogéré & supervisé par DINAO
- 2 vCPU dédiés
- 4 Go de RAM
- 40 Go NVMe
- Sauvegardes quotidiennes
- Infogéré & supervisé par DINAO
- 4 vCPU dédiés
- 8 Go de RAM
- 80 Go NVMe
- Sauvegardes quotidiennes
- Infogéré & supervisé par DINAO
- 8 vCPU dédiés
- 16 Go de RAM
- 160 Go NVMe
- Sauvegardes quotidiennes
- Infogéré & supervisé par DINAO
Cette application utilise l'IA
Le conteneur n'embarque pas de calcul IA : les étapes IA s'appuient sur une puissance externe au conteneur, fournie via un service complémentaire AI (Mistral, OpenAI, Anthropic…) branché avec votre propre clé. Prenez un pack de tokens pour démarrer (abonnements fournisseurs non inclus).
Détails techniques
Vous vous demandez…
TensorZero héberge-t-il les modèles eux-mêmes ?
Non. TensorZero est une passerelle : elle route vos requêtes vers les fournisseurs (Anthropic, OpenAI, Mistral…) ou vers un serveur d'inférence local. C'est elle qui unifie l'accès, l'observabilité et l'optimisation — sans GPU requis sur l'instance.
Faut-il réécrire mon code applicatif ?
Non. L'API est compatible OpenAI : il suffit de repointer le base_url de votre SDK vers votre instance DINAO. Vous changez ensuite de modèle ou de fournisseur sans toucher au code.
Où sont hébergées les données ?
Sur l'infrastructure DINAO en France, dans un des datacenters disponible. Vos logs d'inférence, prompts et feedbacks ne quittent pas le territoire.
Faut-il des compétences techniques ?
DINAO gère l'installation, le backend d'observabilité (ClickHouse/PostgreSQL), la sécurité et les mises à jour. Votre équipe technique se concentre sur l'intégration applicative et l'analyse des résultats.
Puis-je changer de formule ou exporter mes données ?
Oui. Vous montez ou descendez de palier à tout moment, et vos inférences restent exportables — pas de verrouillage propriétaire.