T

Text Machine

Des outils de texte puissants, dans votre navigateur

Solveur de chiffre de substitution

Collez un chiffre de substitution monoalphabétique ou un cryptogramme et récupérez le message original sans connaître la clé. Le solveur fait correspondre les fréquences des lettres pour une première hypothèse, puis utilise le recuit simulé évalué sur les trigrammes anglais pour parcourir l'alphabet de 26 lettres et trouver la lecture qui ressemble le plus à de l'anglais. Tout fonctionne dans votre navigateur.

Essayez un exemple :

Texte chiffré

Collez un chiffre de substitution ci-dessus, appuyez sur Résoudre, et le message récupéré ainsi que l'alphabet de substitution apparaîtront ici. Plus vous fournissez de texte, plus la réponse est fiable.

Comment utiliser Solveur de Substitution

  1. 1

    Collez le texte chiffré

    Copiez votre chiffre de substitution ou votre cryptogramme et collez-le dans la zone. Plus il y a de texte, plus la résolution est fiable ; les lettres sont lues sans tenir compte de la casse, et les espaces, chiffres et ponctuation sont ignorés lors de la résolution puis rétablis dans la réponse.

  2. 2

    Appuyez sur Résoudre

    Cliquez sur Résoudre le chiffre. La recherche s'exécute un instant — elle essaie des centaines de milliers d'alphabets candidats — puis affiche la lecture la plus proche de l'anglais qu'elle a trouvée.

  3. 3

    Lisez le message récupéré

    Le texte déchiffré apparaît avec sa capitalisation, ses espaces et sa ponctuation d'origine rétablis. Copiez-le d'un clic pour conserver le résultat.

  4. 4

    Vérifiez l'alphabet récupéré

    Sous le message, l'alphabet de substitution indique en quoi chaque lettre du texte chiffré a été décodée. Les lettres estompées n'apparaissaient jamais dans votre texte, le solveur n'a donc pas pu les placer. Copiez l'alphabet pour réutiliser ou vérifier la clé.

  5. 5

    Partagez ou effacez

    Copiez un lien partageable qui rouvre l'outil avec votre texte chiffré exact — le texte voyage dans la partie de l'URL située après le dièse, qui n'atteint jamais un serveur. Effacer réinitialise tout.

Casser le chiffre de substitution, expliqué

Ce que fait cet outil

Un chiffre de substitution monoalphabétique remplace chaque lettre de l'alphabet par une autre — A peut devenir Q, B peut devenir W — et utilise ce même alphabet brouillé pour tout le message. C'est le chiffre qui se cache derrière les cryptogrammes des journaux, les énigmes d'escape game et les Aristocrats de l'American Cryptogram Association. Il existe plus de quatre cents septillions d'alphabets possibles, bien trop pour les essayer un par un, et pourtant un chiffre de substitution est l'un des plus faciles de tous les chiffres à casser. Cet outil le casse pour vous, automatiquement, sans clé.

Collez le texte chiffré et le solveur renvoie le message original le plus probable accompagné de l'alphabet de substitution complet qu'il a récupéré. Il fonctionne comme le ferait un amateur de cryptogrammes chevronné — partir des fréquences des lettres, puis continuer à échanger des lettres en conservant les changements qui rendent le texte plus proche de l'anglais — sauf qu'il le fait des centaines de milliers de fois par seconde. Rien ne quitte votre navigateur ; toute la recherche s'exécute sur votre propre machine.

Pourquoi un chiffre de substitution peut être cassé

Un chiffre de substitution cache quelle lettre est quelle, mais il ne peut pas cacher la fréquence d'utilisation de chaque lettre. En anglais, E est bien plus courant que toute autre lettre, suivi de T, A, O, I et N, tandis que J, Q, X et Z sont rares. Le chiffrement ne fait que réétiqueter ces fréquences : quelle que soit la lettre qui remplace E, ce sera la lettre la plus courante dans le texte chiffré. Ce seul fait — les fréquences des lettres survivent à la substitution — est la faille dans l'armure sur laquelle toute la cryptanalyse a été bâtie.

Les fréquences seules ne suffisent pas tout à fait, car plusieurs lettres ont des décomptes similaires et peuvent être échangées par erreur. Le signal le plus profond réside dans la façon dont les lettres se combinent. L'anglais affectionne certaines combinaisons — TH, HE, ING, THE, AND — et en évite presque entièrement d'autres. Un déchiffrement correct est rempli de ces combinaisons naturelles ; un déchiffrement erroné est parsemé de combinaisons que le véritable anglais n'utilise jamais. Mesurer cette différence est ce qui permet à un ordinateur de reconnaître la bonne réponse parmi d'innombrables fausses réponses d'apparence plausible.

Étape un : une hypothèse de départ basée sur les fréquences

Le solveur commence par compter la fréquence d'apparition de chaque lettre dans le texte chiffré et aligne ces décomptes sur l'ordre de fréquence connu de l'anglais. La lettre la plus courante du texte chiffré est supposée être E, la suivante T, puis A, O, I, N et ainsi de suite le long de la liste. C'est le coup d'ouverture classique que tout amateur de cryptogrammes apprend à faire à la main.

Cette hypothèse est rarement parfaite — les lettres les plus rares risquent particulièrement d'être mal placées — mais elle n'a pas besoin de l'être. Il lui suffit d'être assez proche pour donner à la recherche un point de départ raisonnable. À partir de là, l'outil affine l'alphabet lettre par lettre jusqu'à ce que le message devienne net.

Étape deux : le recuit simulé trouve la clé

À partir de l'hypothèse de départ, le solveur échange à plusieurs reprises la signification en texte clair de deux lettres et se demande si le message se lit désormais davantage comme de l'anglais. Si un échange aide, il est conservé. Le hic est qu'exiger toujours une amélioration immédiate bloque la recherche sur un quasi-résultat — un optimum local — dont aucun échange isolé ne peut s'échapper. La résolution de substitution est l'exemple type d'une technique appelée recuit simulé, qui corrige précisément ce problème.

Le recuit simulé accepte parfois un échange qui dégrade momentanément la situation, avec une probabilité qui commence élevée et qui est régulièrement abaissée — comme si la recherche était chaude au début puis refroidissait lentement. Au départ, elle erre librement et se sort des impasses ; plus tard, elle se stabilise et peaufine le meilleur alphabet qu'elle a trouvé. L'outil exécute cela plusieurs fois à partir de différents points de départ, termine chacun par une passe stricte d'amélioration seulement, et conserve l'unique meilleur résultat — c'est pourquoi il trouve de façon fiable des réponses qu'une simple montée de gradient manquerait.

Comment le solveur juge l'anglais : l'adéquation des trigrammes

Chaque alphabet candidat est noté par un seul nombre : son adéquation des trigrammes. L'outil examine chaque suite de trois lettres consécutives dans le texte déchiffré et additionne la probabilité de chaque triplet dans le véritable anglais, à l'aide d'une table de fréquences de trois lettres construite à partir d'un vaste corpus de textes anglais. Les triplets courants comme THE, AND et ING obtiennent de bons scores ; les triplets que l'anglais n'utilise jamais obtiennent des scores catastrophiques.

Les trigrammes comptent parce que la fréquence des lettres isolées est trop facile à tromper — une clé erronée peut faire correspondre les décomptes de lettres tout en restant du charabia. Il est bien plus difficile de simuler une page entière de combinaisons de trois lettres crédibles. En orientant chaque échange vers une meilleure adéquation des trigrammes, la recherche est tirée, échange après échange, vers un anglais authentique. La table est générée à partir des propres articles de ce site, de sorte que rien n'est récupéré de l'extérieur et que l'outil reste rapide et confidentiel.

Combien de texte vous faut-il, et quand le solveur peine

Casser un chiffre de substitution est un travail statistique, il dépend donc entièrement de la quantité de texte que vous lui fournissez. Avec environ cent cinquante lettres ou plus d'anglais ordinaire, la récupération est généralement quasi parfaite. Autour de quatre-vingts à cent lettres, cela fonctionne encore, mais une lettre rare ou deux — les J, Q, X et Z qui apparaissent à peine — peuvent être mal lues, car il n'y a tout simplement pas assez d'indices pour les fixer. En dessous d'une cinquantaine de lettres, tout solveur, humain ou machine, devine en grande partie.

Quelques autres facteurs rendent un message plus difficile : un texte qui évite délibérément les lettres courantes (comme un pangramme), un texte qui n'est pas en anglais, ou un chiffre qui déplace aussi les lettres au lieu de seulement les réétiqueter. Quand la lecture ressort presque correcte, la solution est presque toujours davantage de texte chiffré, ou la correction à l'œil de la ou des deux lettres récalcitrantes. Si le texte n'est pas du tout une simple substitution, l'Identificateur de chiffre peut vous dire ce à quoi vous avez réellement affaire.

Les chiffres de substitution et leurs cousins

Une simple substitution qui conserve les séparations entre les mots est ce que les créateurs de cryptogrammes appellent un Aristocrat ; le même chiffre dont les espaces ont été retirés est un Patristocrat. Les deux sont monoalphabétiques — un seul alphabet fixe pour tout le message — et les deux cèdent à la méthode employée ici. Caesar et Atbash ne sont que des substitutions particulières, encore plus simples, donc cet outil les casse aussi, même si leurs pages dédiées les résolvent instantanément.

Le grand saut de difficulté est le chiffre polyalphabétique, qui change l'alphabet au fur et à mesure, de sorte qu'une même lettre peut en représenter plusieurs différentes. Le chiffre de Vigenère en est l'exemple célèbre, et l'analyse des fréquences sur l'ensemble du message ne fonctionne plus contre lui. Si votre message résiste à ce solveur et que les fréquences des lettres paraissent suspectement plates, il est peut-être polyalphabétique — tournez-vous plutôt vers le Solveur de Vigenère.

Questions fréquentes

Peut-on vraiment résoudre un chiffre de substitution sans la clé ?
Oui. Un chiffre de substitution cache quelle lettre est quelle, mais pas la fréquence d'utilisation de chacune, et les fréquences des lettres et des groupes de trois lettres en anglais sont très distinctives. Le solveur part de ces fréquences puis recherche l'alphabet dont le déchiffrement se lit le plus comme de l'anglais, récupérant à la fois le message et la clé sans rien fournir à l'avance.
Quel type de chiffre cet outil résout-il ?
Il résout les chiffres de substitution monoalphabétiques — ceux où un seul alphabet brouillé fixe remplace les lettres pour tout le message. Cela couvre les cryptogrammes des journaux, les Aristocrats et les Patristocrats, les chiffres à alphabet à mot-clé, et les cas plus simples comme Caesar et Atbash. Il ne résout pas les chiffres polyalphabétiques tels que Vigenère, qui changent l'alphabet au fur et à mesure.
Comment fonctionne le solveur ?
En deux étapes. D'abord, il fait correspondre les fréquences des lettres du texte chiffré à celles de l'anglais pour formuler une hypothèse de départ. Ensuite, il utilise le recuit simulé — en échangeant à plusieurs reprises deux lettres et en conservant les échanges qui rendent le texte plus proche de l'anglais, tout en acceptant occasionnellement un recul pour s'échapper des impasses — évalué selon le naturel des combinaisons de trois lettres. Il s'exécute plusieurs fois et conserve le meilleur résultat.
Pourquoi utiliser la notation par trigrammes plutôt que les fréquences des lettres ?
Les fréquences des lettres isolées peuvent être satisfaites par une clé qui produit malgré tout du charabia, elles ne suffisent donc pas à elles seules pour reconnaître la bonne réponse. L'adéquation des trigrammes note chaque suite de trois lettres par rapport au véritable anglais, où THE, AND et ING sont courants tandis que la plupart des triplets sont extrêmement rares. Une clé erronée produit des triplets non naturels et obtient un mauvais score, ce qui permet à la recherche de cibler la lecture authentique.
De combien de texte ai-je besoin pour casser un cryptogramme ?
Visez au moins cent cinquante lettres d'anglais ordinaire pour une résolution quasi parfaite. Autour de quatre-vingts à cent lettres, cela fonctionne généralement mais peut mal lire une lettre rare ou deux. En dessous d'une cinquantaine de lettres, il y a rarement assez d'indices statistiques pour qu'un solveur soit sûr, attendez-vous donc à une lecture seulement partielle.
Le résultat est presque correct mais quelques lettres sont fausses. Pourquoi ?
Les lettres rares comme J, Q, X et Z apparaissent si rarement qu'un message court peut ne pas en contenir assez pour les placer avec certitude, et deux lettres de fréquences similaires peuvent occasionnellement être échangées. La solution consiste généralement à fournir davantage de texte chiffré, ou à corriger à l'œil la ou les deux lettres égarées une fois que le reste du message est lisible.
Résoudra-t-il un cryptogramme qui conserve les espaces (un Aristocrat) ?
Oui. Les espaces, chiffres et ponctuation sont préservés dans le résultat mais ignorés lors de la résolution, de sorte que les séparations entre les mots n'aident ni ne gênent. Que votre énigme conserve les espaces (un Aristocrat) ou les retire (un Patristocrat), la même méthode fréquences-et-trigrammes récupère le message.
Le solveur est-il déterministe ?
Oui. Bien qu'il utilise une recherche aléatoire, le hasard est piloté par une graine fixe, de sorte que le même texte chiffré produit toujours le même résultat. Cela signifie aussi qu'un lien partagé reproduit exactement la même résolution pour quiconque l'ouvre.
Fonctionne-t-il uniquement sur l'anglais ?
Les tables intégrées de fréquences et de trigrammes décrivent l'anglais, l'outil est donc réglé pour un texte clair en anglais. Un message dans une autre langue ressortira généralement comme du non-sens même lorsque la recherche réussit, parce qu'il fait correspondre les mauvaises statistiques. Pour un texte non anglais, il vous faudrait des données de fréquence pour cette langue.
Mon texte chiffré est-il envoyé à un serveur ?
Non. Toute la recherche s'exécute dans votre navigateur, votre texte n'est donc jamais téléversé, journalisé ni stocké. Même le lien de partage conserve votre texte chiffré dans la partie de l'URL située après le dièse, que les navigateurs ne transmettent jamais à un serveur, de sorte qu'il reste privé à moins que vous ne choisissiez de le partager.
Et s'il ne s'agit pas du tout d'un chiffre de substitution ?
Si la résolution ressort comme du charabia et que les fréquences des lettres paraissent anormalement plates, le message est peut-être polyalphabétique, basé sur une transposition, ou tout autre chose. Lancez l'Identificateur de chiffre pour découvrir à quoi vous avez affaire, puis utilisez l'outil correspondant — par exemple le Solveur de Vigenère pour un chiffre à clé répétée.

Outils similaires

Continuez avec ces outils pratiques

Identificateur de chiffre

Analyse de fréquence

Convertisseur de Timestamp Unix

Convertisseur JSON en CSV

Convertisseur CSV en JSON

Convertisseur JSON en YAML