
Construisez vos datasets IA de qualité, en France
Une plateforme d'annotation et de curation propulsée par Argilla, installée et maintenue par DINAO. Pour fiabiliser vos jeux de données IA — vos données restent sur nos serveurs français.
Qu'est-ce que Argilla ?
Argilla est un outil open source de curation de données qui permet d'annoter et de revoir des datasets, puis de publier les jeux de données curés (par exemple vers le Hugging Face Hub). C'est une plateforme de collaboration pensée pour réunir ingénieurs IA et experts métier afin de produire des données de haute qualité.
Argilla sert à collecter du feedback humain pour une grande variété de projets : NLP traditionnel (classification de texte, NER…), LLM (RAG, alignement de préférences…) ou modèles multimodaux (text-to-image…). Son approche programmatique permet de bâtir des workflows d'évaluation continue et d'amélioration des modèles.
L'objectif : faire en sorte que le travail sur la donnée porte ses fruits, en itérant rapidement sur les bonnes données et les bons modèles. Argilla s'intègre aussi aux LLM pour la pré-annotation et la génération de données synthétiques.
Hébergez Argilla chez DINAO
Paliers de ressources compatibles avec les pré-requis de Argilla (2 vCPU / 4 Go / 10 Go minimum). Hébergé en France, infogéré.
- 2 vCPU dédiés
- 4 Go de RAM
- 40 Go NVMe
- Sauvegardes quotidiennes
- Infogéré & supervisé par DINAO
- 4 vCPU dédiés
- 8 Go de RAM
- 80 Go NVMe
- Sauvegardes quotidiennes
- Infogéré & supervisé par DINAO
- 8 vCPU dédiés
- 16 Go de RAM
- 160 Go NVMe
- Sauvegardes quotidiennes
- Infogéré & supervisé par DINAO
1 palier(s) masqué(s) (ressources insuffisantes pour cette app) : Découverte
Cette application utilise l'IA
Le conteneur n'embarque pas de calcul IA : les étapes IA s'appuient sur une puissance externe au conteneur, fournie via un service complémentaire AI (Mistral, OpenAI, Anthropic…) branché avec votre propre clé. Prenez un pack de tokens pour démarrer (abonnements fournisseurs non inclus).
Détails techniques
Vous vous demandez…
À quoi sert Argilla concrètement ?
À construire des jeux de données de qualité pour l'IA : annoter et revoir des données, collecter du feedback humain pour le NLP, les LLM (RAG, alignement de préférences) ou les modèles multimodaux.
Puis-je utiliser un LLM pour pré-annoter ?
Oui. Argilla s'intègre à des LLM pour pré-annoter ou générer des données synthétiques. En hébergeant un modèle local sur votre instance DINAO, vous gardez ces traitements en France.
Où sont hébergées les données ?
Sur l'infrastructure DINAO en France, dans un des datacenters disponible. Vos données et annotations ne quittent pas le territoire.
Faut-il des compétences techniques ?
Annoter via l'interface est accessible aux experts métier. La mise en place des workflows et du SDK Python relève d'une équipe data. DINAO gère l'installation, la sécurité et les mises à jour.
Puis-je exporter mes datasets ?
Oui. Vos datasets s'exportent vers vos pipelines ou le Hugging Face Hub — pas de verrouillage propriétaire.