Vos modèles d'IA en local, sur GPU français
Faites tourner Llama 3, Mistral, Qwen ou DeepSeek sur une infrastructure GPU dédiée avec Ollama, installé et maintenu par DINAO. Une API LLM privée, compatible OpenAI — vos prompts ne quittent jamais la France.
Qu'est-ce que Ollama ?
Ollama se présente comme « le moyen le plus simple de travailler avec des modèles ouverts ». Il permet d'exécuter des modèles de langage open-weight (Llama, Mistral, Qwen, Gemma et bien d'autres) directement en local, avec une installation et un démarrage en quelques minutes.
Ollama expose une API compatible OpenAI, ce qui le rend immédiatement utilisable par de nombreux outils (Open WebUI, n8n, Flowise…) et bibliothèques existantes. Il gère le traitement de requêtes en parallèle et s'intègre aux environnements de développement (Claude Code, etc.).
Son positionnement met l'accent sur la confidentialité : en mode local, le travail reste sur votre machine et fonctionne hors ligne pour les usages critiques. Une option cloud existe pour la montée en charge, mais le cœur du produit reste l'exécution locale de modèles ouverts.
Hébergez Ollama chez DINAO
Paliers de ressources compatibles avec les pré-requis de Ollama (2 cœurs / 8 Go / 12 Go minimum). Hébergé en France, infogéré.
- 4 vCPU dédiés
- 8 Go de RAM
- 80 Go NVMe
- Sauvegardes quotidiennes
- Infogéré & supervisé par DINAO
- 8 vCPU dédiés
- 16 Go de RAM
- 160 Go NVMe
- Sauvegardes quotidiennes
- Infogéré & supervisé par DINAO
2 palier(s) masqué(s) (ressources insuffisantes pour cette app) : Découverte, Standard
Cette application utilise l'IA
Le conteneur n'embarque pas de calcul IA : les étapes IA s'appuient sur une puissance externe au conteneur, fournie via un service complémentaire AI (Mistral, OpenAI, Anthropic…) branché avec votre propre clé. Prenez un pack de tokens pour démarrer (abonnements fournisseurs non inclus).
Détails techniques
Vous vous demandez…
Quels modèles puis-je faire tourner ?
Tout le catalogue Ollama : Llama 3, Mistral, Qwen, DeepSeek, Phi, des modèles d'embeddings et vos modèles personnalisés. La taille maximale dépend de la VRAM de votre palier.
Puis-je brancher mes applications existantes ?
Oui. Ollama expose une API compatible OpenAI : vous changez simplement l'URL de base et la clé, et vos outils (chatbots, RAG, scripts) fonctionnent sans réécriture.
Où sont hébergées les données ?
Sur l'infrastructure GPU DINAO en France, dans un des datacenters disponible. Vos prompts et inférences ne quittent pas le territoire et ne servent à aucun entraînement.
Faut-il des compétences techniques ?
Pour consommer l'API, des notions de développement aident. DINAO gère l'installation, le GPU, le téléchargement des modèles et les mises à jour. Vous pouvez aussi l'utiliser via une interface comme Open WebUI.
Puis-je changer de formule ou de GPU ?
Oui. Vous montez en gamme à tout moment pour faire tourner des modèles plus grands, et vos modèles personnalisés restent les vôtres — aucun verrouillage.