Solucionador de cifrado por sustitución
Pega un cifrado por sustitución monoalfabética o un criptograma y recupera el mensaje original sin conocer la clave. El solucionador empareja las frecuencias de las letras para una suposición inicial, y luego usa recocido simulado (simulated annealing) puntuado sobre trigramas en inglés para buscar en el alfabeto de 26 letras la lectura que más se parezca al inglés. Todo se ejecuta en tu navegador.
Prueba un ejemplo:
Pega un cifrado por sustitución arriba, pulsa Resolver, y aquí aparecerán el mensaje recuperado y el alfabeto de sustitución. Cuanto más texto le des, más fiable será la respuesta.
Cómo usar Solucionador de Sustitución
- 1
Pega el texto cifrado
Copia tu cifrado por sustitución o criptograma y pégalo en la casilla. Cuanto más texto, más fiable es la resolución; las letras se leen sin tener en cuenta las mayúsculas, y los espacios, dígitos y signos de puntuación se ignoran durante la resolución y luego se restauran en la respuesta.
- 2
Pulsa Resolver
Haz clic en Resolver cifrado. La búsqueda se ejecuta un momento —prueba cientos de miles de alfabetos candidatos— y luego muestra la lectura más parecida al inglés que encontró.
- 3
Lee el mensaje recuperado
El texto descifrado aparece con sus mayúsculas, espaciado y puntuación originales restaurados. Cópialo con un solo clic para conservar el resultado.
- 4
Comprueba el alfabeto recuperado
Debajo del mensaje, el alfabeto de sustitución muestra a qué se decodificó cada letra del texto cifrado. Las letras atenuadas nunca aparecieron en tu texto, así que el solucionador no pudo ubicarlas. Copia el alfabeto para reutilizar o verificar la clave.
- 5
Comparte o borra
Copia un enlace compartible que reabre la herramienta con tu texto cifrado exacto: el texto viaja en la parte de la URL posterior al símbolo de almohadilla, que nunca llega a un servidor. Borrar lo restablece todo.
Cómo descifrar el cifrado por sustitución, explicado
Qué hace esta herramienta
Un cifrado por sustitución monoalfabética reemplaza cada letra del alfabeto por otra distinta —la A puede convertirse en Q, la B puede convertirse en W— y usa ese mismo alfabeto revuelto para todo el mensaje. Es el cifrado que está detrás de los criptogramas de los periódicos, los acertijos de las salas de escape y los Aristocrats de la American Cryptogram Association. Hay más de cuatrocientos cuatrillones de alfabetos posibles, demasiados para probarlos uno por uno y, sin embargo, un cifrado por sustitución es uno de los más fáciles de romper. Esta herramienta lo rompe por ti, automáticamente, sin clave.
Pega el texto cifrado y el solucionador devuelve el mensaje original más probable junto con el alfabeto de sustitución completo que recuperó. Funciona como lo haría un aficionado experimentado: parte de las frecuencias de las letras y luego sigue intercambiando letras y conservando los cambios que hacen que el texto se lea más como inglés, solo que lo hace cientos de miles de veces por segundo. Nada sale de tu navegador; toda la búsqueda se ejecuta en tu propia máquina.
Por qué se puede romper un cifrado por sustitución
Un cifrado por sustitución oculta qué letra es cuál, pero no puede ocultar con qué frecuencia se usa cada letra. En inglés, la E es mucho más común que cualquier otra letra, seguida de T, A, O, I y N, mientras que J, Q, X y Z son raras. El cifrado solo reetiqueta esas frecuencias: cualquiera que sea la letra que sustituya a la E será la letra más común del texto cifrado. Ese único hecho —las frecuencias de las letras sobreviven a la sustitución— es la grieta en la armadura sobre la que se construyó todo el criptoanálisis.
Las frecuencias por sí solas no bastan del todo, porque varias letras tienen conteos parecidos y pueden intercambiarse por error. La señal más profunda está en cómo se combinan las letras. El inglés adora ciertos patrones —TH, HE, ING, THE, AND— y evita otros casi por completo. Un descifrado correcto está lleno de esos patrones naturales; uno incorrecto está plagado de combinaciones que el inglés real nunca usa. Medir esa diferencia es lo que permite a una computadora reconocer la respuesta correcta entre incontables respuestas erróneas de apariencia plausible.
Paso uno: una suposición inicial ajustada por frecuencia
El solucionador empieza por contar con qué frecuencia aparece cada letra en el texto cifrado y alinear esos conteos con el orden de frecuencia conocido del inglés. Se supone que la letra más común del texto cifrado es la E, la siguiente la T, luego A, O, I, N y así sucesivamente. Este es el clásico primer movimiento que todo solucionador de criptogramas aprende a mano.
Esa suposición rara vez es perfecta —las letras menos frecuentes son especialmente propensas a quedar mal colocadas—, pero no necesita serlo. Solo tiene que ser lo bastante buena para darle a la búsqueda un punto de partida razonable. A partir de ahí, la herramienta refina el alfabeto letra por letra hasta que el mensaje se enfoca con nitidez.
Paso dos: el recocido simulado encuentra la clave
Desde la suposición inicial, el solucionador intercambia repetidamente el significado en texto plano de dos letras y se pregunta si el mensaje ahora se lee más como inglés. Si un intercambio ayuda, se conserva. El problema es que insistir siempre en una mejora inmediata deja la búsqueda atascada en un casi acierto —un óptimo local— del que ningún intercambio aislado puede escapar. La resolución por sustitución es el caso de manual para una técnica llamada recocido simulado (simulated annealing), que resuelve exactamente esto.
El recocido simulado a veces acepta un intercambio que empeora las cosas momentáneamente, con una probabilidad que empieza alta y se reduce de forma constante, como si la búsqueda estuviera caliente al principio y se enfriara lentamente. Al comienzo deambula con libertad y sale de los callejones sin salida; más tarde se asienta y pule el mejor alfabeto que ha encontrado. La herramienta ejecuta esto varias veces desde puntos de partida distintos, termina cada uno con una pasada estricta de solo mejora, y conserva el único mejor resultado, que es la razón por la que encuentra de forma fiable respuestas que un simple ascenso por gradiente pasaría por alto.
Cómo juzga el solucionador el inglés: el ajuste de trigramas
Cada alfabeto candidato se califica con un único número: su ajuste de trigramas. La herramienta examina cada secuencia de tres letras consecutivas del texto descifrado y suma cuán probable es cada trío en inglés real, usando una tabla de frecuencias de tres letras construida a partir de un gran corpus de textos en inglés. Tríos comunes como THE, AND e ING puntúan bien; los tríos que el inglés nunca usa puntúan fatal.
Los trigramas importan porque la frecuencia de letras individuales es demasiado fácil de engañar: una clave incorrecta puede coincidir con el conteo de letras y aun así ser un galimatías. Es mucho más difícil falsificar una página entera de combinaciones de tres letras creíbles. Al orientar cada intercambio hacia un mayor ajuste de trigramas, la búsqueda es arrastrada, intercambio a intercambio, hacia un inglés genuino. La tabla se genera a partir de los propios artículos de este sitio, así que no se obtiene nada del exterior y la herramienta se mantiene rápida y privada.
Cuánto texto necesitas, y cuándo le cuesta
Romper un cifrado por sustitución es una tarea estadística, así que vive o muere según la cantidad de texto que le des. Con aproximadamente ciento cincuenta letras o más de inglés corriente, la recuperación suele ser casi perfecta. En torno a ochenta o cien letras todavía funciona, pero una letra rara o dos —la J, Q, X y Z que apenas aparecen— pueden leerse mal, porque simplemente no hay suficiente evidencia para fijarlas. Por debajo de unas cincuenta letras, cualquier solucionador, humano o máquina, en gran medida adivina.
Algunas otras cosas hacen que un mensaje sea más difícil: texto que evita deliberadamente las letras comunes (como un pangrama), escritura que no es inglés, o un cifrado que además mueve las letras de lugar en vez de solo reetiquetarlas. Cuando la lectura sale casi correcta, la respuesta casi siempre es más texto cifrado, o corregir a ojo la letra o dos tercas. Si el texto no es en absoluto una sustitución simple, el Identificador de cifrados puede decirte qué estás mirando realmente.
Los cifrados por sustitución y sus parientes
Una sustitución simple que conserva las separaciones entre palabras es lo que los creadores de criptogramas llaman Aristocrat; el mismo cifrado con los espacios eliminados es un Patristocrat. Ambos son monoalfabéticos —un alfabeto fijo para todo el mensaje— y ambos caen ante el método de aquí. Caesar y Atbash son simplemente sustituciones especiales, aún más sencillas, así que esta herramienta también los rompe, aunque sus páginas dedicadas los resuelven al instante.
El gran salto de dificultad es el cifrado polialfabético, que cambia el alfabeto a medida que avanza, de modo que la misma letra puede representar varias distintas. El cifrado de Vigenère es el ejemplo célebre, y el análisis de frecuencia sobre el mensaje completo ya no funciona contra él. Si tu mensaje se resiste a este solucionador y las frecuencias de las letras se ven sospechosamente planas, puede ser polialfabético: recurre entonces al Solucionador de Vigenère.
Preguntas frecuentes
¿De verdad se puede resolver un cifrado por sustitución sin la clave?
¿Qué tipo de cifrado resuelve esto?
¿Cómo funciona el solucionador?
¿Por qué se usa la puntuación de trigramas en vez de las frecuencias de letras?
¿Cuánto texto necesito para descifrar un criptograma?
El resultado es casi correcto pero algunas letras están mal. ¿Por qué?
¿Resolverá un criptograma que conserva los espacios (un Aristocrat)?
¿Es determinista el solucionador?
¿Solo funciona en inglés?
¿Se envía mi texto cifrado a un servidor?
¿Y si no es un cifrado por sustitución en absoluto?
Herramientas relacionadas
Sigue trabajando con estas prácticas herramientas