Le coq français de l'IA souveraine

L'IA d'entreprise,
100 % souveraine.

Serveurs en France et en Allemagne. Modèles open-source figés sur nos GPU, jamais d'appel externe. Chiffrement post-quantique inclus. Prix fixe par entreprise — pas de pay-per-token.

Prendre un RDV 15 min

Hetzner · Scaleway · OVHcloudRGPD · AI Act 2024/1689Conforme SecNumCloud 3.2

Trois douleurs des décideurs

Le marché actuel est cassé.
Voici exactement pourquoi.

01 / 03

Vos données fuient vers les États-Unis

ChatGPT, Claude, Gemini : tout passe par AWS, GCP ou Azure. Le Cloud Act autorise les autorités fédérales à demander vos prompts. Le DPA ne protège pas — la juridiction US le surcharge.

02 / 03

L'AI Act devient impossible à auditer

Article 12 : traçabilité par requête. Les dashboards américains ne suivent pas vos exigences. Vos contrôleurs CNIL et autorités de marché vous tiennent responsable, pas votre fournisseur.

03 / 03

Vos coûts triplent dès que l'usage décolle

Pay-per-token : à 0,002 €/1K tokens, c'est cheap au démarrage. Trois mois plus tard, la facture explose. Aucun levier de négociation. Aucune ligne budgétaire fixe possible.

Notre réponse

Trois piliers,
zéro compromis.

Pas de modèle américain rebadgé. Pas de chiffrement marketing. Pas de prix variable. Une plate-forme conçue pour résister à dix ans d'audit ANSSI.

Souveraineté UE 100 %

Hetzner (Allemagne), Scaleway (Paris), OVHcloud (Roubaix). Aucune dépendance AWS, GCP, Azure. Aucune télémétrie sortante. Cloud Act inopposable.

octet hors UE

Post-quantique inclus

Premier SaaS IA UE à shipper 4 couches PQC en production. ML-KEM-768 hybride, X25519MLKEM768 TLS, SLH-DSA-128f sur audit log. Inclus baseline sur toutes les offres.

NIST 203/205

FIPS · 4 couches

Prix fixe par entreprise

Pas de pay-per-token. Pas de surprise sur facture. Fair-use budgétaire invisible (20 % du prix), fallback automatique vers modèle léger si saturation. Une ligne budgétaire annuelle.

299 € — 2 500 €+

par mois · HT

MEGA plus-value n°1 · le cerveau

Auriga,
le moteur de routage intelligent.

Une question simple n'a pas besoin d'un modèle géant. Un dossier juridique de 200 pages, si. Auriga lit chaque requête, analyse quatre dimensions critiques en moins de 20 ms, et choisit le moteur d'inférence le plus pertinent. Vous gagnez en latence, en coût et en précision — sans jamais avoir à choisir un modèle vous-même.

Schéma fonctionnel · décision serveur, jamais exposée au client

Quatre signaux. Une décision.

Complexité

Résumé simple ? Raisonnement multi-étape ? Le classifieur tranche en moins de 20 ms.

Domaine

Code, juridique, RH, médical… Détection métier pour activer le bon contexte RAG.

Sécurité

Tentative d'injection ou de jailbreak ? Bloquée avant même d'atteindre un modèle.

Données personnelles

PII détectées en temps réel. Anonymisation ou refus selon la politique tenant.

< 20 ms

Décision de routage

Classifieur mmBERT spécialisé, embarqué dans la gateway. Pas d'aller-retour réseau, pas de modèle géant qui décide.

~ 4×

Économie d'inférence

En routant 80 % du trafic sur le modèle léger, vous économisez l'équivalent de trois modèles experts qui tourneraient pour rien.

Choix exigé du client

Vos collaborateurs ne voient qu'un seul modèle nommé lecoq.ai. Le routage est invisible, infalsifiable côté serveur.

Auriga s'appuie sur vLLM Semantic Router v0.2 Athena (mmBERT + LoRA, code open-source) couplé à LiteLLM Gateway pour le contrôle budgétaire et la traçabilité AI Act Article 12. Aucune brique américaine sur le chemin critique d'inférence.

MEGA plus-value n°2 · le coffre-fort

Souveraineté radicale.
Quatre zéros, zéro fuite, zéro asterisque.

La plupart des fournisseurs vous demandent de leur faire confiance. Nous prouvons cryptographiquement que la confiance est superflue. Trois datacenters européens, quatre garanties non-négociables, et la défense contre l'ordinateur quantique de demain — dès aujourd'hui.

Là où vivent vos données

Trois datacenters,
deux pays, zéro Cloud Act.

Deux tiers de notre capacité en France. Le reste en Allemagne. Aucune dépendance aux hyperscalers américains.

Hetzner · Falkenstein, Allemagne
Base load 24/7 — GPU expert
OVHcloud · Roubaix, France
Vault HSM + SecNumCloud 3.2
Scaleway · Paris, France
Scale-out horaire

Quatre garanties non-négociables

Pas de petits caractères. Pas d'astérisques.

0 octet hors UE

Hetzner Falkenstein, Scaleway Paris, OVHcloud Roubaix. Aucun cloud américain. Cloud Act inopposable.

0 partage avec un tiers

Pas de télémétrie sortante, pas de SDK analytics, pas de DPA tiers à signer. Vos données restent dans la base PostgreSQL chiffrée de votre tenant.

0 entraînement sur vos prompts

Modèles Qwen open-source téléchargés une fois, figés par leur SHA, servis tels quels. Vos requêtes alimentent l'inférence — jamais l'entraînement.

0 backdoor, 0 angle mort

Code Rust audité, dépendances open-source pinnées, logs immuables 5 ans. Auditabilité PASSI / SecNumCloud sur Gouvernance.

Cryptographie post-quantique

« Harvest now, decrypt later. »
Vos secrets de 2026, vos ennemis en 2040.

Un attaquant patient capture aujourd'hui votre trafic chiffré classique (RSA, ECDH). Quand l'ordinateur quantique cryptographiquement pertinent émerge — NIST estime entre 2030 et 2040 — il déchiffre tout. Quatre couches NIST FIPS 203/205 actives en production, par défaut, pour tous nos clients.

2026 — aujourd'hui2030 — seuil NIST2040 — risque massif

Quatre couches actives en production

TLS hybride transport

X25519MLKEM768

NIST FIPS 203

Chiffrement des données au repos

ML-KEM-768 + X25519

NIST FIPS 203

mTLS interne Postgres / Redis

X25519MLKEM768

NIST FIPS 203

Signature audit log plate-forme

SLH-DSA-128f

NIST FIPS 205

Argumentaire technique complet

Vérifiable en live

Un audit RSSI ou ANSSI peut prouver l'activation immédiatement, sans accès SSH, sans NDA. Une commande terminal suffit.

~/audit $openssl 3.5

openssl s_client -groups X25519MLKEM768 -connect lecoq.ai:443

→ Negotiated TLS1.3 with X25519MLKEM768

Compatible Chrome 131+, Firefox 132+, Safari iOS 26+. Fallback X25519 transparent.

Pour qui ce n'est pas négociable

Quand la rétention dépasse 10 ans, le quantique change tout.

Cabinets juridiques

10-20 ans

Notaires

75 ans

Expert-comptables

10 ans

Santé

20 ans

BITD défense

30+ ans

Public ANSSI

50+ ans

Côté

Concurrents non-UE

leaders mainstream avril 2026

Critère

Garantie objective

lecoq.ai

Notre engagement

Hébergement & juridiction

Données hors UE possibles

100 % UE, Cloud Act inopposable

Cryptographie post-quantique

Roadmap, parfois en option payante

4 couches FIPS 203/205, baseline toutes offres

Entraînement sur vos prompts

Opt-out parfois payant ou contractuel

Modèles open-source figés, pinning par SHA

Coût mensuel

Pay-per-token, dérive imprévisible

Forfait fixe entreprise, fair-use transparent

Auditabilité PASSI

Souvent indisponible ou complexe

Offre Gouvernance SecNumCloud 3.2

Coûts maîtrisés

Une ligne budgétaire fixe.
Pas un compteur Stripe.

Le pay-per-token est un mensonge tarifaire qui transfère le risque chez vous. Notre offre Essentiel à 299 €/mois équivaut à environ 120 heures de chat cumulées pour 20 employés. Un budget IT se planifie en ligne fixe annuelle. Nous tenons cette promesse.

Économies sur 12 mois

0 €

vs concurrent pay-per-token typique pour 20 employés

0 %

marge brute cible

0 %

plancher hard stop

Coût mensuel comparé

Pay-per-token Prix fixe

120 €

180 €

230 €

310 €

410 €

540 €

660 €

790 €

870 €

M10

950 €

M11

1060 €

M12

1180 €

Modèle illustratif basé sur usage croissant typique d'une PME. Concurrent simulé à 0,002 €/1K tokens, croissance d'usage 8 % mensuel après 90 jours.

Sobriété par design

~80 % de GPU économisé

Le moteur Auriga route 80 % du trafic vers le modèle léger. Le 27B-FP8 ne tourne que pour les requêtes qui le méritent. Cache sémantique Redis pour les questions répétées : 0 GPU consommé.

~80 %

GPU économisé / requête

0 €

scale-to-zero nuit + week-end

GreenIT par sobriété

On ne brûle pas un GPU
pour traduire « bonjour ».

Notre routeur sémantique tranche en 20 ms : 80 % du trafic part sur un modèle léger, l'expert n'est sollicité qu'au juste besoin. Cache sémantique Redis : une question répétée renvoie la réponse précédente sans appel GPU.

Scale-to-zero KEDA hors heures ouvrées · 0 € de compute la nuit et le week-end.
Cache sémantique Redis ~18 % hit rate · requêtes répétées renvoyées sans appel GPU.
Continuous batching vLLM · plusieurs requêtes en parallèle sur le même GPU.
Modèles open-weights Apache 2.0 · aucun surcoût propriétaire répercuté.

Démo en conditions réelles

Un seul modèle visible. Tout le routage caché.

Vos employés voient un seul modèle lecoq.ai. En interne, notre routeur sémantique choisit en moins de 20 ms entre un modèle léger (résumés, traductions) ou un modèle expert (raisonnement profond, code, juridique). Le badge final dévoile la décision pour la traçabilité AI Act Article 12.

✓Bypass impossible : tentative de cibler un modèle interne → HTTP 401 LiteLLM.
✓Coût mesuré pour chaque appel, fair-use 20 % du revenu invisible côté employé.
✓Cache sémantique : si la question revient, réponse instantanée — et gratuite.
✓Aucun fine-tuning sur vos données. Modèles figés, traçables par model_commit_sha.

chat.cabinet-dupont.lecoq.ai

TLS PQC

Routage interne · qwen-9b

Tarification

Trois offres, prix prévisible.
Post-quantique inclus partout.

Trois offres calibrées pour des entreprises qui ne veulent pas réveiller leur DAF chaque trimestre. Le quota équivalent en heures de chat est volontairement surdimensionné.

Essentiel

TPE et petites équipes — IA souveraine sans complexité.

299 €/mois HT

20 sièges inclus
Modèle léger Qwen 9B
RAG limité à 10 Go
PQC 4 couches incluses
Hébergement EU mutualisé
Dashboard AI Act basique
Support email 48h · SLA 99 %

Recommandé

Business

PME et départements ETI — routage complet, RAG illimité, SSO.

899 €/mois HT

75 sièges inclus
Routage sémantique 9B + 27B-FP8
RAG illimité + connecteurs SI (add-on)
PQC 4 couches incluses
SSO OAuth2 / SAML
Dashboard AI Act complet
Support 24h + chat · SLA 99,5 %

Gouvernance

ETI, secteur public, santé, défense — SecNumCloud, BYOK HSM, audit eIDAS.

Sur devisdès 2 500 €/mois

3 paliers : Base · Premium TDX · Sovereign

Sièges illimités
Bare Metal Pod OVH SecNumCloud 3.2
BYOK HSM (Eviden / OVH / Thales)
PQC 4 couches incluses
Reranker RAG inclus + Studio LoRA
Confidential Computing TDX (Premium)
Support 4h + CSM · SLA 99,9 %

Add-ons modulaires

Activables au mois

RAG Haute Précision (Reranker) · +150 €/mois

Studio Fine-Tuning LoRA · 500 € one-shot + 250 €/mois

Connecteurs SI (Drive, SharePoint, Notion) · +200 €/mois

BYOK HSM externe · +500 €/mois (Business régulé)

Audit signé eIDAS · +50 €/mois

Confidential Computing TEE Intel TDX · +500 €/mois (Q2 2026)

Garantie 30 jours satisfait-ou-remboursé. Engagement annuel : -15 %. Pas de remise au-delà.

Pour qui

Six verticales sensibles
au long cours.

Pour ces métiers, le contenu protégé doit le rester pendant des décennies. Le pas-encore-quantique de 2026 sera un menteur de 2030.

10-20 ans

Avocats

Secret professionnel déontologique

75 ans

Notaires

Code civil — actes authentiques

10 ans

Expert-comptables

Code de commerce — pièces

20 ans

Santé

RGPD + secret médical

30+ ans

BITD défense

Instruction interministérielle 901

50+ ans

Secteur public

ANSSI · classification

Validation technique

Reproductible en moins de dix minutes.
Sans NDA. Sans accès SSH.

Couche 1 — TLS hybride

NIST FIPS 203

$ openssl s_client \
    -groups X25519MLKEM768 \
    -connect lecoq.ai:443

→ Negotiated TLS1.3 with
  X25519MLKEM768

Codepoint IANA 0x11ec. Compatible Chrome 131+, Firefox 132+, Safari iOS 26+. Fallback X25519 transparent pour anciens browsers.

Couche 2 — Wrap KEK app-layer

NIST FIPS 203

$ psql tenant_airetvie -c \
    "SELECT octet_length(chat_dek_wrapped)
     FROM chat;"

octet_length
─────────────
        1181

Format wire : 1 (version) + 1088 (mlkem-768 ct, k=3) + 32 (x25519) + 12 (nonce) + 48 (aes-gcm). Conformité NIST FIPS 203 vérifiable byte par byte.

Couche 4 — Audit log signé

NIST FIPS 205

$ verify-audit-chain \
    --since 7d

→ HMAC chain OK (124 rows)
→ SLH-DSA verify OK
  signature ~17 KB / row

Cron K8s hebdomadaire (dimanche 04:00 UTC). Chaîne HMAC + signature SLH-DSA-128f. Toute divergence = alerte P1 + escalation cofondateurs.

Modèles open-weights pinnés

Apache 2.0

chemin léger:
  Qwen/Qwen3.5-9B
  served-model-name: qwen-9b

chemin expert:
  Qwen/Qwen3.6-27B-FP8
  served-model-name: qwen-27b-fp8

→ Téléchargés une fois
→ Pinnés par SHA
→ Aucun fine-tuning sur vos données

Audit cryptographique expert disponible sur demande · Lire la documentation technique

Questions fréquentes

Tout ce qu'un DSI veut clarifier
avant de signer.

Mes données sortent-elles de l'Union européenne ?

Jamais. Nos serveurs sont chez Hetzner (Falkenstein, Allemagne), Scaleway (Paris) et OVHcloud (Roubaix, Gravelines). Aucun cloud américain, aucune télémétrie sortante, aucune dépendance à AWS, GCP ou Azure. L'offre Gouvernance va plus loin avec un geo-pinning OVHcloud exclusif.

Pourquoi le post-quantique aujourd'hui ?

Parce qu'un attaquant patient capture aujourd'hui votre trafic chiffré classique pour le déchiffrer dans 10 ou 15 ans avec un ordinateur quantique. Pour un notaire (75 ans), un cabinet juridique (10-20 ans), un acteur de la défense (30+ ans), c'est une fuite garantie à terme. Standards NIST FIPS 203/205 finalisés en 2024.

Est-ce que vous entraînez vos modèles avec mes données ?

Non. Strictement non. Les modèles Qwen open-source sont téléchargés une fois depuis Hugging Face, pinnés par leur SHA, et servis tels quels par vLLM. Vos prompts alimentent l'inférence — jamais l'entraînement. Le model_commit_sha est journalisé pour chaque requête (AI Act Article 12).

Comment est calculé le prix fixe ? Et si je dépasse ?

Le prix est par entreprise, pas par utilisateur. Un fair-use budgétaire invisible (calé sur 20 % du prix facturé) protège votre quota. Si vous l'atteignez, le système bascule automatiquement sur le modèle léger plutôt que de couper le service. Vous voyez votre quota en pourcentage et en heures équivalentes — jamais en euros, jamais en tokens.

Combien de temps pour démarrer ?

Trois minutes après signature. L'environnement de votre entreprise (namespace Kubernetes dédié, base chiffrée par votre KEK, virtual key budgétisée, instance Open WebUI brandée) est créé automatiquement. Vos employés peuvent se connecter via SSO immédiatement.

Je peux fournir ma propre clé de chiffrement (BYOK) ?

Oui, sur l'offre Gouvernance (inclus) ou en add-on Business régulé (+500 €/mois). Trois HSM externes supportés : OVHcloud Managed HSM (Thales Luna en backend), Eviden Trustway Proteccio NetHSM (ANSSI Qualifié Renforcé + PQC), Thales Luna Network HSM (FIPS 140-3 niveau 3).

Comment puis-je auditer la conformité AI Act ?

Un dashboard Article 12 intégré au back-office tenant trace chaque requête : timestamp, model_commit_sha, tokens, coût, route_decision, cache_hit. L'export mensuel est signé HMAC + horodaté qualifié eIDAS (Universign), opposable en justice. Sur Gouvernance, un audit PASSI annuel est inclus.

Est-ce que je peux résilier facilement ?

Oui. Pas d'engagement minimum (sauf rabais annuel optionnel -15 %). Garantie 30 jours satisfait-ou-remboursé. À la résiliation, un export RGPD complet (conversations + RAG + audit) est livré sous 7 jours. Au-delà des 30 jours de grâce, votre namespace et votre KEK sont détruits cryptographiquement.

Lancement officiel S2 2026

Reprenez le contrôle
de votre IA d'entreprise.

Programme pilote ouvert à 3 entreprises beta sur le second semestre 2026. Tarif préférentiel -50 % en échange d'un témoignage public à la GA.

Prendre un RDV 15 min en visio

Aucun engagement · Réponse sous 48h ouvrées · equipe@lecoq.ai

L'IA d'entreprise,100 % souveraine.

Le marché actuel est cassé.Voici exactement pourquoi.

Vos données fuient vers les États-Unis

L'AI Act devient impossible à auditer

Vos coûts triplent dès que l'usage décolle

Trois piliers,zéro compromis.

Souveraineté UE 100 %

Post-quantique inclus

Prix fixe par entreprise

Auriga,le moteur de routage intelligent.

Complexité

Domaine

Sécurité

Données personnelles

Souveraineté radicale.Quatre zéros, zéro fuite, zéro asterisque.

Trois datacenters,deux pays, zéro Cloud Act.

Pas de petits caractères. Pas d'astérisques.

0 octet hors UE

0 partage avec un tiers

0 entraînement sur vos prompts

0 backdoor, 0 angle mort

« Harvest now, decrypt later. »Vos secrets de 2026, vos ennemis en 2040.

Quatre couches actives en production

Quand la rétention dépasse 10 ans, le quantique change tout.

Une ligne budgétaire fixe.Pas un compteur Stripe.

On ne brûle pas un GPUpour traduire « bonjour ».

Un seul modèle visible. Tout le routage caché.

Trois offres, prix prévisible.Post-quantique inclus partout.

Essentiel

Business

Gouvernance

Add-ons modulaires

Six verticales sensiblesau long cours.

Avocats

Notaires

Expert-comptables

Santé

BITD défense

Secteur public

Reproductible en moins de dix minutes.Sans NDA. Sans accès SSH.

Tout ce qu'un DSI veut clarifieravant de signer.

Mes données sortent-elles de l'Union européenne ?

Pourquoi le post-quantique aujourd'hui ?

Est-ce que vous entraînez vos modèles avec mes données ?

Comment est calculé le prix fixe ? Et si je dépasse ?

Combien de temps pour démarrer ?

Je peux fournir ma propre clé de chiffrement (BYOK) ?

Comment puis-je auditer la conformité AI Act ?

Est-ce que je peux résilier facilement ?

Reprenez le contrôlede votre IA d'entreprise.

L'IA d'entreprise,
100 % souveraine.

Le marché actuel est cassé.
Voici exactement pourquoi.

Trois piliers,
zéro compromis.

Auriga,
le moteur de routage intelligent.

Souveraineté radicale.
Quatre zéros, zéro fuite, zéro asterisque.

Trois datacenters,
deux pays, zéro Cloud Act.

« Harvest now, decrypt later. »
Vos secrets de 2026, vos ennemis en 2040.

Une ligne budgétaire fixe.
Pas un compteur Stripe.

On ne brûle pas un GPU
pour traduire « bonjour ».

Trois offres, prix prévisible.
Post-quantique inclus partout.

Six verticales sensibles
au long cours.

Reproductible en moins de dix minutes.
Sans NDA. Sans accès SSH.

Tout ce qu'un DSI veut clarifier
avant de signer.

Reprenez le contrôle
de votre IA d'entreprise.