← Retour au catalogue Ollama · managé par DINAO

Vos modèles d'IA en local, sur GPU français

Faites tourner Llama 3, Mistral, Qwen ou DeepSeek sur une infrastructure GPU dédiée avec Ollama, installé et maintenu par DINAO. Une API LLM privée, compatible OpenAI — vos prompts ne quittent jamais la France.

Hébergé en FranceSouverain en mode localVos modèles open-weightConforme RGPDÉditeur vérifié
Présentation

Qu'est-ce que Ollama ?

Ollama se présente comme « le moyen le plus simple de travailler avec des modèles ouverts ». Il permet d'exécuter des modèles de langage open-weight (Llama, Mistral, Qwen, Gemma et bien d'autres) directement en local, avec une installation et un démarrage en quelques minutes.

Ollama expose une API compatible OpenAI, ce qui le rend immédiatement utilisable par de nombreux outils (Open WebUI, n8n, Flowise…) et bibliothèques existantes. Il gère le traitement de requêtes en parallèle et s'intègre aux environnements de développement (Claude Code, etc.).

Son positionnement met l'accent sur la confidentialité : en mode local, le travail reste sur votre machine et fonctionne hors ligne pour les usages critiques. Une option cloud existe pour la montée en charge, mais le cœur du produit reste l'exécution locale de modèles ouverts.

Offres compatibles

Hébergez Ollama chez DINAO

Paliers de ressources compatibles avec les pré-requis de Ollama (2 cœurs / 8 Go / 12 Go minimum). Hébergé en France, infogéré.

Performance
4 vCPU · 8 Go · 80 Go
39,90 € /mois HT
  • 4 vCPU dédiés
  • 8 Go de RAM
  • 80 Go NVMe
  • Sauvegardes quotidiennes
  • Infogéré & supervisé par DINAO
Commander

2 palier(s) masqué(s) (ressources insuffisantes pour cette app) : Découverte, Standard

🧠

Cette application utilise l'IA

Le conteneur n'embarque pas de calcul IA : les étapes IA s'appuient sur une puissance externe au conteneur, fournie via un service complémentaire AI (Mistral, OpenAI, Anthropic…) branché avec votre propre clé. Prenez un pack de tokens pour démarrer (abonnements fournisseurs non inclus).

Pack IA Découverte
5 M tokens IN · 1 M tokens OUT
9,00 €
Ajouter
Pack IA Starter
25 M tokens IN · 6 M tokens OUT
39,00 €
Ajouter
Pack IA Pro
100 M tokens IN · 25 M tokens OUT
129,00 €
Ajouter
Sous le capot

Détails techniques

vCPU
2 cœurs
idéal : 4 cœurs (ou GPU NVIDIA/AMD)
Mémoire
8 Go
idéal : 16 Go
Disque
12 Go
idéal : 50 Go
Image : ollama/ollama:latest Registre : docker.io Services : ollama Ports : 11434/tcp
Questions fréquentes

Vous vous demandez…

Quels modèles puis-je faire tourner ?

Tout le catalogue Ollama : Llama 3, Mistral, Qwen, DeepSeek, Phi, des modèles d'embeddings et vos modèles personnalisés. La taille maximale dépend de la VRAM de votre palier.

Puis-je brancher mes applications existantes ?

Oui. Ollama expose une API compatible OpenAI : vous changez simplement l'URL de base et la clé, et vos outils (chatbots, RAG, scripts) fonctionnent sans réécriture.

Où sont hébergées les données ?

Sur l'infrastructure GPU DINAO en France, dans un des datacenters disponible. Vos prompts et inférences ne quittent pas le territoire et ne servent à aucun entraînement.

Faut-il des compétences techniques ?

Pour consommer l'API, des notions de développement aident. DINAO gère l'installation, le GPU, le téléchargement des modèles et les mises à jour. Vous pouvez aussi l'utiliser via une interface comme Open WebUI.

Puis-je changer de formule ou de GPU ?

Oui. Vous montez en gamme à tout moment pour faire tourner des modèles plus grands, et vos modèles personnalisés restent les vôtres — aucun verrouillage.