
Votre plateforme d'annotation IA, hébergée en France
La suite d'annotation pour la vision par ordinateur propulsée par CVAT, installée et maintenue par DINAO. Vos images, vidéos et datasets restent sur nos serveurs français — l'annotation assistée par IA, sur une infrastructure souveraine.
Qu'est-ce que CVAT ?
CVAT (Computer Vision Annotation Tool) est une plateforme web open source d'annotation d'images, vidéos et nuages de points 3D, conçue pour produire les datasets d'entraînement de la vision par ordinateur. Elle couvre tous les types d'annotation — bounding boxes, polygones, polylignes, masques de segmentation, keypoints/squelettes, cuboids, ellipses, tags — et gère le suivi et l'interpolation sur la vidéo.
Pensée pour les équipes, CVAT apporte la gestion de projets et de tâches, le contrôle qualité (ground-truth, matrice de confusion), l'analytics, la gestion des rôles (RBAC), ainsi que l'annotation assistée par IA via des modèles comme SAM/SAM 2, YOLO ou Mask R-CNN. L'export couvre plus de 20 formats standards (COCO, YOLO, Pascal VOC…).
Côté technique, CVAT repose sur Django et React, avec PostgreSQL et Redis, déployé en stack Docker multi-conteneurs. L'auto-annotation s'appuie sur Nuclio en serverless, et un GPU NVIDIA est recommandé pour les modèles les plus lourds. Une API REST, un SDK Python et une CLI complètent l'ensemble.
Hébergez CVAT chez DINAO
Paliers de ressources compatibles avec les pré-requis de CVAT (2 vCPU / 4 Go / 20 Go minimum). Hébergé en France, infogéré.
Cette application utilise une image non officielle / non vérifiée ou nécessite des ressources sur-mesure. Nous l'étudions et la déployons sur devis.
Demande de devisCette application utilise l'IA
Le conteneur n'embarque pas de calcul IA : les étapes IA s'appuient sur une puissance externe au conteneur, fournie via un service complémentaire AI (Mistral, OpenAI, Anthropic…) branché avec votre propre clé. Prenez un pack de tokens pour démarrer (abonnements fournisseurs non inclus).
Détails techniques
Vous vous demandez…
À quoi sert CVAT ?
CVAT est une suite d'annotation pour la vision par ordinateur. On y annote images, vidéos et nuages de points 3D afin de produire les datasets d'entraînement nécessaires aux modèles d'IA de détection, segmentation ou classification.
L'annotation assistée par IA tourne-t-elle chez vous ou dans un cloud externe ?
En édition auto-hébergée, les modèles d'auto-annotation (SAM, YOLO…) s'exécutent localement dans votre instance DINAO, sans appel à un service cloud externe. Vos images ne quittent pas le serveur — voir la note de souveraineté ci-dessous.
Quels formats d'export sont supportés ?
Plus de 20 formats standards : COCO, YOLO, Pascal VOC et bien d'autres. Vous récupérez vos datasets dans le format attendu par votre framework d'entraînement, via l'interface, l'API ou le SDK Python.
Faut-il un GPU ?
L'annotation manuelle fonctionne sans GPU. Pour l'auto-annotation par les gros modèles (SAM notamment), un GPU NVIDIA est fortement recommandé : il est disponible en option (formule Équipe IA) ou dédié (formule Production).
Puis-je changer de formule ou exporter mes données ?
Oui. Vous montez ou descendez de palier à tout moment, et vos datasets restent exportables dans les formats standards — pas de verrouillage propriétaire.