Le coq français de l'IA souveraine

L'IA d'entreprise,100 % souveraine.

Serveurs en France et en Allemagne. Modèles open-source figés sur nos GPU, jamais d'appel externe. Chiffrement post-quantique inclus. Prix fixe par entreprise — pas de pay-per-token.

Prendre un RDV 15 min
Hetzner · Scaleway · OVHcloudRGPD · AI Act 2024/1689Conforme SecNumCloud 3.2

Trois douleurs des décideurs

Le marché actuel est cassé.
Voici exactement pourquoi.

01 / 03

Vos données fuient vers les États-Unis

ChatGPT, Claude, Gemini : tout passe par AWS, GCP ou Azure. Le Cloud Act autorise les autorités fédérales à demander vos prompts. Le DPA ne protège pas — la juridiction US le surcharge.

02 / 03

L'AI Act devient impossible à auditer

Article 12 : traçabilité par requête. Les dashboards américains ne suivent pas vos exigences. Vos contrôleurs CNIL et autorités de marché vous tiennent responsable, pas votre fournisseur.

03 / 03

Vos coûts triplent dès que l'usage décolle

Pay-per-token : à 0,002 €/1K tokens, c'est cheap au démarrage. Trois mois plus tard, la facture explose. Aucun levier de négociation. Aucune ligne budgétaire fixe possible.

Notre réponse

Trois piliers,
zéro compromis.

Pas de modèle américain rebadgé. Pas de chiffrement marketing. Pas de prix variable. Une plate-forme conçue pour résister à dix ans d'audit ANSSI.

Souveraineté UE 100 %

Hetzner (Allemagne), Scaleway (Paris), OVHcloud (Roubaix). Aucune dépendance AWS, GCP, Azure. Aucune télémétrie sortante. Cloud Act inopposable.

0

octet hors UE

Post-quantique inclus

Premier SaaS IA UE à shipper 4 couches PQC en production. ML-KEM-768 hybride, X25519MLKEM768 TLS, SLH-DSA-128f sur audit log. Inclus baseline sur toutes les offres.

NIST 203/205

FIPS · 4 couches

Prix fixe par entreprise

Pas de pay-per-token. Pas de surprise sur facture. Fair-use budgétaire invisible (20 % du prix), fallback automatique vers modèle léger si saturation. Une ligne budgétaire annuelle.

299 € — 2 500 €+

par mois · HT

MEGA plus-value n°1 · le cerveau

Auriga,
le moteur de routage intelligent.

Une question simple n'a pas besoin d'un modèle géant. Un dossier juridique de 200 pages, si. Auriga lit chaque requête, analyse quatre dimensions critiques en moins de 20 ms, et choisit le moteur d'inférence le plus pertinent. Vous gagnez en latence, en coût et en précision — sans jamais avoir à choisir un modèle vous-même.

Schéma fonctionnel · décision serveur, jamais exposée au client

Quatre signaux. Une décision.

Complexité

Résumé simple ? Raisonnement multi-étape ? Le classifieur tranche en moins de 20 ms.

Domaine

Code, juridique, RH, médical… Détection métier pour activer le bon contexte RAG.

Sécurité

Tentative d'injection ou de jailbreak ? Bloquée avant même d'atteindre un modèle.

Données personnelles

PII détectées en temps réel. Anonymisation ou refus selon la politique tenant.

< 20 ms

Décision de routage

Classifieur mmBERT spécialisé, embarqué dans la gateway. Pas d'aller-retour réseau, pas de modèle géant qui décide.

~ 4×

Économie d'inférence

En routant 80 % du trafic sur le modèle léger, vous économisez l'équivalent de trois modèles experts qui tourneraient pour rien.

0

Choix exigé du client

Vos collaborateurs ne voient qu'un seul modèle nommé lecoq.ai. Le routage est invisible, infalsifiable côté serveur.

Auriga s'appuie sur vLLM Semantic Router v0.2 Athena (mmBERT + LoRA, code open-source) couplé à LiteLLM Gateway pour le contrôle budgétaire et la traçabilité AI Act Article 12. Aucune brique américaine sur le chemin critique d'inférence.

MEGA plus-value n°2 · le coffre-fort

Souveraineté radicale.
Quatre zéros, zéro fuite, zéro asterisque.

La plupart des fournisseurs vous demandent de leur faire confiance. Nous prouvons cryptographiquement que la confiance est superflue. Trois datacenters européens, quatre garanties non-négociables, et la défense contre l'ordinateur quantique de demain — dès aujourd'hui.

Là où vivent vos données

Trois datacenters,
deux pays, zéro Cloud Act.

Deux tiers de notre capacité en France. Le reste en Allemagne. Aucune dépendance aux hyperscalers américains.

  • Hetzner · Falkenstein, Allemagne

    Base load 24/7 — GPU expert

  • OVHcloud · Roubaix, France

    Vault HSM + SecNumCloud 3.2

  • Scaleway · Paris, France

    Scale-out horaire

Quatre garanties non-négociables

Pas de petits caractères. Pas d'astérisques.

0 octet hors UE

Hetzner Falkenstein, Scaleway Paris, OVHcloud Roubaix. Aucun cloud américain. Cloud Act inopposable.

0 partage avec un tiers

Pas de télémétrie sortante, pas de SDK analytics, pas de DPA tiers à signer. Vos données restent dans la base PostgreSQL chiffrée de votre tenant.

0 entraînement sur vos prompts

Modèles Qwen open-source téléchargés une fois, figés par leur SHA, servis tels quels. Vos requêtes alimentent l'inférence — jamais l'entraînement.

0 backdoor, 0 angle mort

Code Rust audité, dépendances open-source pinnées, logs immuables 5 ans. Auditabilité PASSI / SecNumCloud sur Gouvernance.

Cryptographie post-quantique

« Harvest now, decrypt later. »
Vos secrets de 2026, vos ennemis en 2040.

Un attaquant patient capture aujourd'hui votre trafic chiffré classique (RSA, ECDH). Quand l'ordinateur quantique cryptographiquement pertinent émerge — NIST estime entre 2030 et 2040 — il déchiffre tout. Quatre couches NIST FIPS 203/205 actives en production, par défaut, pour tous nos clients.

2026 — aujourd'hui2030 — seuil NIST2040 — risque massif

Quatre couches actives en production

01

TLS hybride transport

X25519MLKEM768

NIST FIPS 203

02

Chiffrement des données au repos

ML-KEM-768 + X25519

NIST FIPS 203

03

mTLS interne Postgres / Redis

X25519MLKEM768

NIST FIPS 203

04

Signature audit log plate-forme

SLH-DSA-128f

NIST FIPS 205

Argumentaire technique complet
Vérifiable en live

Un audit RSSI ou ANSSI peut prouver l'activation immédiatement, sans accès SSH, sans NDA. Une commande terminal suffit.

~/audit $openssl 3.5

openssl s_client -groups X25519MLKEM768 -connect lecoq.ai:443

Negotiated TLS1.3 with X25519MLKEM768

Compatible Chrome 131+, Firefox 132+, Safari iOS 26+. Fallback X25519 transparent.

Pour qui ce n'est pas négociable

Quand la rétention dépasse 10 ans, le quantique change tout.

Cabinets juridiques

10-20 ans

Notaires

75 ans

Expert-comptables

10 ans

Santé

20 ans

BITD défense

30+ ans

Public ANSSI

50+ ans

Côté

Concurrents non-UE

leaders mainstream avril 2026

Critère

Garantie objective

lecoq.ai

Notre engagement

Hébergement & juridiction

Données hors UE possibles

100 % UE, Cloud Act inopposable

Cryptographie post-quantique

Roadmap, parfois en option payante

4 couches FIPS 203/205, baseline toutes offres

Entraînement sur vos prompts

Opt-out parfois payant ou contractuel

Modèles open-source figés, pinning par SHA

Coût mensuel

Pay-per-token, dérive imprévisible

Forfait fixe entreprise, fair-use transparent

Auditabilité PASSI

Souvent indisponible ou complexe

Offre Gouvernance SecNumCloud 3.2

Coûts maîtrisés

Une ligne budgétaire fixe.
Pas un compteur Stripe.

Le pay-per-token est un mensonge tarifaire qui transfère le risque chez vous. Notre offre Essentiel à 299 €/mois équivaut à environ 120 heures de chat cumulées pour 20 employés. Un budget IT se planifie en ligne fixe annuelle. Nous tenons cette promesse.

Économies sur 12 mois

0

vs concurrent pay-per-token typique pour 20 employés

0 %

marge brute cible

0 %

plancher hard stop

Coût mensuel comparé

Pay-per-token Prix fixe
M1
120 €
M2
180 €
M3
230 €
M4
310 €
M5
410 €
M6
540 €
M7
660 €
M8
790 €
M9
870 €
M10
950 €
M11
1060 €
M12
1180 €

Modèle illustratif basé sur usage croissant typique d'une PME. Concurrent simulé à 0,002 €/1K tokens, croissance d'usage 8 % mensuel après 90 jours.

Sobriété par design

~80 % de GPU économisé

Le moteur Auriga route 80 % du trafic vers le modèle léger. Le 27B-FP8 ne tourne que pour les requêtes qui le méritent. Cache sémantique Redis pour les questions répétées : 0 GPU consommé.

~80 %

GPU économisé / requête

0 €

scale-to-zero nuit + week-end

GreenIT par sobriété

On ne brûle pas un GPU
pour traduire « bonjour ».

Notre routeur sémantique tranche en 20 ms : 80 % du trafic part sur un modèle léger, l'expert n'est sollicité qu'au juste besoin. Cache sémantique Redis : une question répétée renvoie la réponse précédente sans appel GPU.

  • Scale-to-zero KEDA hors heures ouvrées · 0 € de compute la nuit et le week-end.
  • Cache sémantique Redis ~18 % hit rate · requêtes répétées renvoyées sans appel GPU.
  • Continuous batching vLLM · plusieurs requêtes en parallèle sur le même GPU.
  • Modèles open-weights Apache 2.0 · aucun surcoût propriétaire répercuté.

Démo en conditions réelles

Un seul modèle visible. Tout le routage caché.

Vos employés voient un seul modèle lecoq.ai. En interne, notre routeur sémantique choisit en moins de 20 ms entre un modèle léger (résumés, traductions) ou un modèle expert (raisonnement profond, code, juridique). Le badge final dévoile la décision pour la traçabilité AI Act Article 12.

  • Bypass impossible : tentative de cibler un modèle interne → HTTP 401 LiteLLM.
  • Coût mesuré pour chaque appel, fair-use 20 % du revenu invisible côté employé.
  • Cache sémantique : si la question revient, réponse instantanée — et gratuite.
  • Aucun fine-tuning sur vos données. Modèles figés, traçables par model_commit_sha.
chat.cabinet-dupont.lecoq.ai
TLS PQC
Capture d'Open WebUI montrant un chat lecoq.ai avec le badge interne « Routage interne : qwen-9b », preuve du routage côté serveur.

Tarification

Trois offres, prix prévisible.
Post-quantique inclus partout.

Trois offres calibrées pour des entreprises qui ne veulent pas réveiller leur DAF chaque trimestre. Le quota équivalent en heures de chat est volontairement surdimensionné.

Essentiel

TPE et petites équipes — IA souveraine sans complexité.

299 €/mois HT
  • 20 sièges inclus
  • Modèle léger Qwen 9B
  • RAG limité à 10 Go
  • PQC 4 couches incluses
  • Hébergement EU mutualisé
  • Dashboard AI Act basique
  • Support email 48h · SLA 99 %
Recommandé

Business

PME et départements ETI — routage complet, RAG illimité, SSO.

899 €/mois HT
  • 75 sièges inclus
  • Routage sémantique 9B + 27B-FP8
  • RAG illimité + connecteurs SI (add-on)
  • PQC 4 couches incluses
  • SSO OAuth2 / SAML
  • Dashboard AI Act complet
  • Support 24h + chat · SLA 99,5 %

Gouvernance

ETI, secteur public, santé, défense — SecNumCloud, BYOK HSM, audit eIDAS.

Sur devisdès 2 500 €/mois

3 paliers : Base · Premium TDX · Sovereign

  • Sièges illimités
  • Bare Metal Pod OVH SecNumCloud 3.2
  • BYOK HSM (Eviden / OVH / Thales)
  • PQC 4 couches incluses
  • Reranker RAG inclus + Studio LoRA
  • Confidential Computing TDX (Premium)
  • Support 4h + CSM · SLA 99,9 %

Add-ons modulaires

Activables au mois
RAG Haute Précision (Reranker) · +150 €/mois
Studio Fine-Tuning LoRA · 500 € one-shot + 250 €/mois
Connecteurs SI (Drive, SharePoint, Notion) · +200 €/mois
BYOK HSM externe · +500 €/mois (Business régulé)
Audit signé eIDAS · +50 €/mois
Confidential Computing TEE Intel TDX · +500 €/mois (Q2 2026)

Garantie 30 jours satisfait-ou-remboursé. Engagement annuel : -15 %. Pas de remise au-delà.

Pour qui

Six verticales sensibles
au long cours.

Pour ces métiers, le contenu protégé doit le rester pendant des décennies. Le pas-encore-quantique de 2026 sera un menteur de 2030.

10-20 ans

Avocats

Secret professionnel déontologique

75 ans

Notaires

Code civil — actes authentiques

10 ans

Expert-comptables

Code de commerce — pièces

20 ans

Santé

RGPD + secret médical

30+ ans

BITD défense

Instruction interministérielle 901

50+ ans

Secteur public

ANSSI · classification

Validation technique

Reproductible en moins de dix minutes.
Sans NDA. Sans accès SSH.

Couche 1 — TLS hybride

NIST FIPS 203
$ openssl s_client \
    -groups X25519MLKEM768 \
    -connect lecoq.ai:443

→ Negotiated TLS1.3 with
  X25519MLKEM768

Codepoint IANA 0x11ec. Compatible Chrome 131+, Firefox 132+, Safari iOS 26+. Fallback X25519 transparent pour anciens browsers.

Couche 2 — Wrap KEK app-layer

NIST FIPS 203
$ psql tenant_airetvie -c \
    "SELECT octet_length(chat_dek_wrapped)
     FROM chat;"

octet_length
─────────────
        1181

Format wire : 1 (version) + 1088 (mlkem-768 ct, k=3) + 32 (x25519) + 12 (nonce) + 48 (aes-gcm). Conformité NIST FIPS 203 vérifiable byte par byte.

Couche 4 — Audit log signé

NIST FIPS 205
$ verify-audit-chain \
    --since 7d

→ HMAC chain OK (124 rows)
→ SLH-DSA verify OK
  signature ~17 KB / row

Cron K8s hebdomadaire (dimanche 04:00 UTC). Chaîne HMAC + signature SLH-DSA-128f. Toute divergence = alerte P1 + escalation cofondateurs.

Modèles open-weights pinnés

Apache 2.0
chemin léger:
  Qwen/Qwen3.5-9B
  served-model-name: qwen-9b

chemin expert:
  Qwen/Qwen3.6-27B-FP8
  served-model-name: qwen-27b-fp8

→ Téléchargés une fois
→ Pinnés par SHA
→ Aucun fine-tuning sur vos données

Audit cryptographique expert disponible sur demande · Lire la documentation technique

Questions fréquentes

Tout ce qu'un DSI veut clarifier
avant de signer.

Mes données sortent-elles de l'Union européenne ?

Jamais. Nos serveurs sont chez Hetzner (Falkenstein, Allemagne), Scaleway (Paris) et OVHcloud (Roubaix, Gravelines). Aucun cloud américain, aucune télémétrie sortante, aucune dépendance à AWS, GCP ou Azure. L'offre Gouvernance va plus loin avec un geo-pinning OVHcloud exclusif.

Pourquoi le post-quantique aujourd'hui ?

Parce qu'un attaquant patient capture aujourd'hui votre trafic chiffré classique pour le déchiffrer dans 10 ou 15 ans avec un ordinateur quantique. Pour un notaire (75 ans), un cabinet juridique (10-20 ans), un acteur de la défense (30+ ans), c'est une fuite garantie à terme. Standards NIST FIPS 203/205 finalisés en 2024.

Est-ce que vous entraînez vos modèles avec mes données ?

Non. Strictement non. Les modèles Qwen open-source sont téléchargés une fois depuis Hugging Face, pinnés par leur SHA, et servis tels quels par vLLM. Vos prompts alimentent l'inférence — jamais l'entraînement. Le model_commit_sha est journalisé pour chaque requête (AI Act Article 12).

Comment est calculé le prix fixe ? Et si je dépasse ?

Le prix est par entreprise, pas par utilisateur. Un fair-use budgétaire invisible (calé sur 20 % du prix facturé) protège votre quota. Si vous l'atteignez, le système bascule automatiquement sur le modèle léger plutôt que de couper le service. Vous voyez votre quota en pourcentage et en heures équivalentes — jamais en euros, jamais en tokens.

Combien de temps pour démarrer ?

Trois minutes après signature. L'environnement de votre entreprise (namespace Kubernetes dédié, base chiffrée par votre KEK, virtual key budgétisée, instance Open WebUI brandée) est créé automatiquement. Vos employés peuvent se connecter via SSO immédiatement.

Je peux fournir ma propre clé de chiffrement (BYOK) ?

Oui, sur l'offre Gouvernance (inclus) ou en add-on Business régulé (+500 €/mois). Trois HSM externes supportés : OVHcloud Managed HSM (Thales Luna en backend), Eviden Trustway Proteccio NetHSM (ANSSI Qualifié Renforcé + PQC), Thales Luna Network HSM (FIPS 140-3 niveau 3).

Comment puis-je auditer la conformité AI Act ?

Un dashboard Article 12 intégré au back-office tenant trace chaque requête : timestamp, model_commit_sha, tokens, coût, route_decision, cache_hit. L'export mensuel est signé HMAC + horodaté qualifié eIDAS (Universign), opposable en justice. Sur Gouvernance, un audit PASSI annuel est inclus.

Est-ce que je peux résilier facilement ?

Oui. Pas d'engagement minimum (sauf rabais annuel optionnel -15 %). Garantie 30 jours satisfait-ou-remboursé. À la résiliation, un export RGPD complet (conversations + RAG + audit) est livré sous 7 jours. Au-delà des 30 jours de grâce, votre namespace et votre KEK sont détruits cryptographiquement.

Lancement officiel S2 2026

Reprenez le contrôle
de votre IA d'entreprise.

Programme pilote ouvert à 3 entreprises beta sur le second semestre 2026. Tarif préférentiel -50 % en échange d'un témoignage public à la GA.

Prendre un RDV 15 min en visio

Aucun engagement · Réponse sous 48h ouvrées · equipe@lecoq.ai