
Un chat IA 100 % local, hébergé en France
Serge est une interface de chat IA entièrement locale, propulsée par LLaMA.cpp : aucune clé API, aucun appel externe. Installée et supervisée par DINAO, hébergée en France — vos prompts ne quittent jamais le serveur.
Qu'est-ce que Serge ?
Serge est une interface de chat IA auto-hébergée et entièrement locale, bâtie autour de LLaMA.cpp. Sans clé API ni appel à un service externe, elle permet de dialoguer avec des modèles de langage open-weight directement depuis le navigateur, dans une interface épurée. Le téléchargement et la bascule entre modèles GGUF / LLaMA se font depuis l'application elle-même.
Pensée pour être simple à déployer (un conteneur Docker regroupant l'API Python/FastAPI, le frontend et le moteur d'inférence), elle convient aux organisations qui veulent une IA conversationnelle sans aucune fuite de données. Les modèles quantifiés tournent sur CPU ; un GPU accélère l'inférence et autorise de plus grands modèles.
DINAO l'héberge en France, gère les modèles, les mises à jour, les sauvegardes et la supervision — pour une IA réellement souveraine.
Hébergez Serge chez DINAO
Paliers de ressources compatibles avec les pré-requis de Serge (2 vCPU / 8 Go / 10 Go minimum). Hébergé en France, infogéré.
- 4 vCPU dédiés
- 8 Go de RAM
- 80 Go NVMe
- Sauvegardes quotidiennes
- Infogéré & supervisé par DINAO
- 8 vCPU dédiés
- 16 Go de RAM
- 160 Go NVMe
- Sauvegardes quotidiennes
- Infogéré & supervisé par DINAO
2 palier(s) masqué(s) (ressources insuffisantes pour cette app) : Découverte, Standard
Cette application utilise l'IA
Le conteneur n'embarque pas de calcul IA : les étapes IA s'appuient sur une puissance externe au conteneur, fournie via un service complémentaire AI (Mistral, OpenAI, Anthropic…) branché avec votre propre clé. Prenez un pack de tokens pour démarrer (abonnements fournisseurs non inclus).
Détails techniques
Vous vous demandez…
Serge envoie-t-il mes messages à OpenAI ou ailleurs ?
Non, jamais. Serge effectue l'inférence localement avec LLaMA.cpp. Aucune clé API, aucun appel sortant : vos prompts et réponses restent intégralement sur votre serveur en France.
Quels modèles puis-je utiliser ?
Des modèles open-weight au format GGUF (familles LLaMA, Mistral, etc.), téléchargeables et changeables depuis l'interface. La taille recommandée dépend de votre formule et de la présence d'un GPU.
Ai-je besoin d'un GPU ?
Non pour démarrer : les petits modèles quantifiés tournent sur CPU. Un GPU (en option dès la formule Équipe) accélère nettement et permet des modèles plus grands.
L'historique de mes conversations est-il privé ?
Oui. Il est stocké sur votre instance dédiée, en France, et n'est ni partagé ni utilisé pour entraîner quoi que ce soit.
Quelle différence avec un ChatGPT classique ?
Serge privilégie la confidentialité absolue : tout est local. La qualité dépend du modèle open-weight choisi, mais aucune donnée ne quitte votre infrastructure, contrairement aux services cloud.