T

Text Machine

शक्तिशाली टेक्स्ट टूल्स, आपके ब्राउज़र में

सब्स्टीट्यूशन सिफर सॉल्वर

एक मोनोएल्फाबेटिक सब्स्टीट्यूशन सिफर या क्रिप्टोग्राम पेस्ट करें और कुंजी जाने बिना मूल संदेश पुनः प्राप्त करें। सॉल्वर शुरुआती अनुमान के लिए अक्षर फ्रीक्वेंसी का मिलान करता है, फिर अंग्रेज़ी trigrams पर स्कोर किए गए simulated annealing का उपयोग करके 26-अक्षरों की वर्णमाला में उस पठन को खोजता है जो सबसे अधिक अंग्रेज़ी जैसा दिखता है। सब कुछ आपके ब्राउज़र में चलता है।

एक नमूना आज़माएँ:

सिफरटेक्स्ट

ऊपर एक सब्स्टीट्यूशन सिफर पेस्ट करें, Solve दबाएँ, और पुनः प्राप्त किया गया संदेश तथा सब्स्टीट्यूशन वर्णमाला यहाँ दिखाई देंगे। आप जितना अधिक टेक्स्ट देंगे, उत्तर उतना ही विश्वसनीय होगा।

प्रतिस्थापन सॉल्वर का उपयोग कैसे करें

  1. 1

    सिफरटेक्स्ट पेस्ट करें

    अपना सब्स्टीट्यूशन सिफर या क्रिप्टोग्राम कॉपी करें और इसे बॉक्स में पेस्ट करें। अधिक टेक्स्ट अधिक विश्वसनीय रूप से हल होता है; अक्षरों को केस की परवाह किए बिना पढ़ा जाता है, और हल करते समय स्पेस, अंक तथा विराम चिह्न अनदेखे रहते हैं और फिर उत्तर में पुनर्स्थापित कर दिए जाते हैं।

  2. 2

    Solve दबाएँ

    Solve cipher पर क्लिक करें। खोज कुछ क्षण चलती है — यह लाखों उम्मीदवार वर्णमालाएँ आज़माती है — और फिर जो सबसे अंग्रेज़ी जैसा पठन उसे मिला उसे दिखाती है।

  3. 3

    पुनः प्राप्त संदेश पढ़ें

    डिक्रिप्ट किया गया टेक्स्ट अपने मूल बड़े-छोटे अक्षरों, स्पेसिंग और विराम चिह्नों के पुनर्स्थापित होने के साथ दिखाई देता है। परिणाम रखने के लिए इसे एक क्लिक से कॉपी करें।

  4. 4

    पुनः प्राप्त वर्णमाला जाँचें

    संदेश के नीचे, सब्स्टीट्यूशन वर्णमाला दिखाती है कि प्रत्येक सिफरटेक्स्ट अक्षर किसमें डिकोड हुआ। धुंधले अक्षर आपके टेक्स्ट में कभी नहीं आए, इसलिए सॉल्वर उन्हें स्थान नहीं दे सका। कुंजी को पुनः उपयोग करने या सत्यापित करने के लिए वर्णमाला कॉपी करें।

  5. 5

    साझा करें या साफ़ करें

    एक साझा करने योग्य लिंक कॉपी करें जो आपके ठीक उसी सिफरटेक्स्ट के साथ टूल को फिर से खोलता है — टेक्स्ट URL के हैश के बाद वाले भाग में चलता है, जो कभी किसी सर्वर तक नहीं पहुँचता। Clear सब कुछ रीसेट कर देता है।

सब्स्टीट्यूशन सिफर तोड़ना, समझाया गया

यह टूल क्या करता है

एक मोनोएल्फाबेटिक सब्स्टीट्यूशन सिफर वर्णमाला के प्रत्येक अक्षर को एक अलग अक्षर से बदल देता है — A शायद Q बन जाए, B शायद W बन जाए — और पूरे संदेश के लिए उसी उलझी हुई वर्णमाला का उपयोग करता है। यही वह सिफर है जो अख़बारी क्रिप्टोग्राम, एस्केप-रूम पहेलियों और अमेरिकन क्रिप्टोग्राम एसोसिएशन के Aristocrats के पीछे है। चार सौ सेप्टिलियन से भी अधिक संभावित वर्णमालाएँ होती हैं, जो एक-एक करके आज़माने के लिए बहुत अधिक हैं, फिर भी सब्स्टीट्यूशन सिफर सभी सिफरों में से तोड़ने के लिए सबसे आसान सिफरों में से एक है। यह टूल इसे आपके लिए, अपने-आप, बिना किसी कुंजी के तोड़ देता है।

सिफरटेक्स्ट पेस्ट करें और सॉल्वर सबसे संभावित मूल संदेश के साथ-साथ उस पूरी सब्स्टीट्यूशन वर्णमाला को लौटाता है जो उसने पुनः प्राप्त की। यह वैसे ही काम करता है जैसे एक अनुभवी पहेली-हल करने वाला करता है — अक्षर फ्रीक्वेंसी से शुरू करें, फिर अक्षरों को बदलते रहें और उन परिवर्तनों को रखें जो टेक्स्ट को अधिक अंग्रेज़ी जैसा पढ़ाते हैं — बस यह ऐसा प्रति सेकंड लाखों बार करता है। कुछ भी आपके ब्राउज़र से बाहर नहीं जाता; पूरी खोज आपकी अपनी मशीन पर चलती है।

सब्स्टीट्यूशन सिफर क्यों तोड़ा जा सकता है

एक सब्स्टीट्यूशन सिफर यह छिपाता है कि कौन-सा अक्षर कौन-सा है, लेकिन यह नहीं छिपा सकता कि प्रत्येक अक्षर कितनी बार उपयोग होता है। अंग्रेज़ी में, E किसी भी अन्य अक्षर से कहीं अधिक सामान्य है, उसके बाद T, A, O, I और N, जबकि J, Q, X और Z दुर्लभ हैं। एन्क्रिप्शन बस उन फ्रीक्वेंसियों पर दोबारा लेबल लगाता है: जो भी अक्षर E के स्थान पर खड़ा होगा वह सिफरटेक्स्ट में सबसे सामान्य अक्षर होगा। वह एकमात्र तथ्य — अक्षर फ्रीक्वेंसियाँ सब्स्टीट्यूशन के बाद भी बनी रहती हैं — कवच में वह दरार है जिस पर पूरी क्रिप्टएनालिसिस खड़ी की गई थी।

केवल फ्रीक्वेंसियाँ पूरी तरह से पर्याप्त नहीं हैं, क्योंकि कई अक्षरों की गणना समान होती है और उन्हें गलती से आपस में बदला जा सकता है। गहरा संकेत इसमें है कि अक्षर कैसे जुड़ते हैं। अंग्रेज़ी को कुछ निश्चित पैटर्न पसंद हैं — TH, HE, ING, THE, AND — और दूसरों से लगभग पूरी तरह बचती है। एक सही डिक्रिप्शन उन प्राकृतिक पैटर्नों से भरा होता है; एक गलत डिक्रिप्शन उन संयोजनों से जड़ा होता है जिन्हें असली अंग्रेज़ी कभी उपयोग नहीं करती। उस अंतर को मापना ही वह चीज़ है जो किसी कंप्यूटर को अनगिनत प्रशंसनीय दिखने वाले गलत उत्तरों में से सही उत्तर पहचानने देती है।

चरण एक: फ्रीक्वेंसी से मिलान किया गया शुरुआती अनुमान

सॉल्वर यह गिनकर शुरू करता है कि सिफरटेक्स्ट में प्रत्येक अक्षर कितनी बार आता है और उन गणनाओं को अंग्रेज़ी के ज्ञात फ्रीक्वेंसी क्रम के सामने पंक्तिबद्ध करता है। सबसे सामान्य सिफरटेक्स्ट अक्षर का अनुमान E लगाया जाता है, अगला T, फिर A, O, I, N और सूची में इसी तरह नीचे की ओर। यह वही क्लासिक पहला कदम है जिसे हर क्रिप्टोग्राम सॉल्वर हाथ से सीखता है।

वह अनुमान शायद ही कभी सटीक होता है — दुर्लभ अक्षरों के गलत स्थान पर रखे जाने की विशेष रूप से संभावना होती है — लेकिन उसे सटीक होने की आवश्यकता नहीं है। उसे बस इतना नज़दीक होना चाहिए कि खोज को शुरू करने के लिए एक समझदार जगह मिल जाए। वहाँ से, टूल वर्णमाला को अक्षर-दर-अक्षर परिष्कृत करता है जब तक संदेश साफ़ न हो जाए।

चरण दो: simulated annealing कुंजी खोजता है

शुरुआती अनुमान से, सॉल्वर बार-बार दो अक्षरों का प्लेनटेक्स्ट अर्थ आपस में बदलता है और पूछता है कि क्या संदेश अब अधिक अंग्रेज़ी जैसा पढ़ा जाता है। यदि कोई अदला-बदली मदद करती है, तो उसे रखा जाता है। दिक्कत यह है कि हमेशा तत्काल सुधार पर ज़ोर देने से खोज एक नज़दीकी-चूक — एक स्थानीय इष्टतम — पर अटक जाती है, जिससे कोई एकल अदला-बदली बच नहीं सकती। सब्स्टीट्यूशन हल करना simulated annealing नामक तकनीक के लिए पाठ्यपुस्तक का उदाहरण है, जो ठीक यही ठीक कर देती है।

Simulated annealing कभी-कभी ऐसी अदला-बदली स्वीकार कर लेता है जो चीज़ों को क्षण भर के लिए बदतर बना देती है, एक ऐसी प्रायिकता के साथ जो ऊँची शुरू होती है और लगातार कम की जाती है — मानो खोज पहले गर्म हो और धीरे-धीरे ठंडी हो जाए। शुरुआत में यह स्वतंत्र रूप से घूमती है और गतिरोधों से बाहर निकलती है; बाद में यह स्थिर हो जाती है और जो सर्वोत्तम वर्णमाला मिली है उसे चमका देती है। टूल इसे विभिन्न शुरुआती बिंदुओं से कई बार चलाता है, प्रत्येक को एक सख्त केवल-सुधार पास के साथ समाप्त करता है, और एकमात्र सर्वोत्तम परिणाम रखता है — यही कारण है कि यह विश्वसनीय रूप से ऐसे उत्तर खोज लेता है जिन्हें एक सादा हिल-क्लाइम्ब चूक जाएगा।

सॉल्वर अंग्रेज़ी का आकलन कैसे करता है: trigram फिटनेस

प्रत्येक उम्मीदवार वर्णमाला को एक ही संख्या से आँका जाता है: उसकी trigram फिटनेस। टूल डिक्रिप्ट किए गए टेक्स्ट में तीन लगातार अक्षरों के प्रत्येक समूह को देखता है और जोड़ता है कि प्रत्येक तिकड़ी असली अंग्रेज़ी में कितनी संभावित है, इसके लिए अंग्रेज़ी लेखन के एक बड़े संग्रह से बनाई गई तीन-अक्षरीय फ्रीक्वेंसियों की एक तालिका का उपयोग करता है। THE, AND और ING जैसी सामान्य तिकड़ियाँ अच्छा स्कोर करती हैं; ऐसी तिकड़ियाँ जिन्हें अंग्रेज़ी कभी उपयोग नहीं करती बहुत बुरा स्कोर करती हैं।

Trigrams इसलिए मायने रखते हैं क्योंकि एकल-अक्षर फ्रीक्वेंसी को मूर्ख बनाना बहुत आसान है — एक गलत कुंजी अक्षर गणना से मेल खा सकती है और फिर भी बकवास हो सकती है। विश्वसनीय तीन-अक्षरीय संयोजनों के पूरे पृष्ठ को नकली बनाना कहीं अधिक कठिन है। प्रत्येक अदला-बदली को उच्च trigram फिटनेस की ओर मोड़कर, खोज को अदला-बदली दर अदला-बदली असली अंग्रेज़ी की ओर खींचा जाता है। तालिका इसी साइट के अपने लेखों से उत्पन्न की जाती है, इसलिए बाहर से कुछ भी नहीं लाया जाता और टूल तेज़ तथा निजी बना रहता है।

आपको कितना टेक्स्ट चाहिए, और यह कब संघर्ष करता है

सब्स्टीट्यूशन सिफर तोड़ना एक सांख्यिकीय काम है, इसलिए यह इस पर निर्भर करता है कि आप इसे कितना टेक्स्ट देते हैं। मोटे तौर पर एक सौ पचास या उससे अधिक अक्षरों की सामान्य अंग्रेज़ी के साथ, पुनर्प्राप्ति आमतौर पर लगभग सटीक होती है। लगभग अस्सी से सौ अक्षरों पर यह अब भी काम करता है लेकिन एक-दो दुर्लभ अक्षर — वे J, Q, X और Z जो मुश्किल से आते हैं — गलत पढ़े जा सकते हैं, क्योंकि उन्हें निश्चित करने के लिए बस इतना प्रमाण नहीं होता। लगभग पचास अक्षरों से नीचे कोई भी सॉल्वर, मानव हो या मशीन, काफ़ी हद तक अनुमान लगा रहा होता है।

कुछ अन्य चीज़ें संदेश को कठिन बना देती हैं: ऐसा टेक्स्ट जो जानबूझकर सामान्य अक्षरों से बचता है (जैसे एक pangram), ऐसा लेखन जो अंग्रेज़ी नहीं है, या ऐसा सिफर जो अक्षरों को केवल दोबारा लेबल करने के बजाय इधर-उधर भी सरकाता है। जब पठन लगभग सही आता है, तो उत्तर लगभग हमेशा अधिक सिफरटेक्स्ट होता है, या उन एक-दो ज़िद्दी अक्षरों को आँख से ठीक करना होता है। यदि टेक्स्ट बिल्कुल भी एक सरल सब्स्टीट्यूशन नहीं है, तो Cipher Identifier आपको बता सकता है कि आप वास्तव में किसे देख रहे हैं।

सब्स्टीट्यूशन सिफर और उनके भाई-बंधु

एक सरल सब्स्टीट्यूशन जो शब्द-विरामों को बनाए रखता है उसे क्रिप्टोग्राम बनाने वाले Aristocrat कहते हैं; वही सिफर जिसमें से स्पेस हटा दिए गए हों, एक Patristocrat होता है। दोनों मोनोएल्फाबेटिक हैं — पूरे संदेश के लिए एक निश्चित वर्णमाला — और दोनों यहाँ दी गई विधि से हल हो जाते हैं। Caesar और Atbash बस विशेष, और भी सरल सब्स्टीट्यूशन हैं, इसलिए यह टूल उन्हें भी तोड़ देता है, हालाँकि उनके समर्पित पृष्ठ उन्हें तुरंत हल कर देते हैं।

कठिनाई में बड़ी छलाँग polyalphabetic सिफर है, जो चलते-चलते वर्णमाला बदल देता है ताकि वही अक्षर कई अलग-अलग अक्षरों के लिए खड़ा हो सके। Vigenère सिफर प्रसिद्ध उदाहरण है, और पूरे संदेश पर फ्रीक्वेंसी विश्लेषण अब उसके खिलाफ काम नहीं करता। यदि आपका संदेश इस सॉल्वर का प्रतिरोध करता है और अक्षर फ्रीक्वेंसियाँ संदेहास्पद रूप से सपाट दिखती हैं, तो यह polyalphabetic हो सकता है — इसके बजाय Vigenère Solver की ओर बढ़ें।

अक्सर पूछे जाने वाले प्रश्न

क्या आप वाकई बिना कुंजी के सब्स्टीट्यूशन सिफर हल कर सकते हैं?
हाँ। एक सब्स्टीट्यूशन सिफर यह छिपाता है कि कौन-सा अक्षर कौन-सा है पर यह नहीं कि प्रत्येक कितनी बार उपयोग होता है, और अंग्रेज़ी अक्षर तथा तीन-अक्षरीय समूहों की फ्रीक्वेंसियाँ बहुत विशिष्ट होती हैं। सॉल्वर उन फ्रीक्वेंसियों से शुरू करता है और फिर उस वर्णमाला को खोजता है जिसका डिक्रिप्शन सबसे अधिक अंग्रेज़ी जैसा पढ़ा जाता है, बिना पहले से कुछ दिए संदेश और कुंजी दोनों पुनः प्राप्त कर लेता है।
यह किस प्रकार का सिफर हल करता है?
यह मोनोएल्फाबेटिक सब्स्टीट्यूशन सिफर हल करता है — वह प्रकार जहाँ एक निश्चित उलझी हुई वर्णमाला पूरे संदेश के लिए अक्षरों को बदल देती है। इसमें अख़बारी क्रिप्टोग्राम, Aristocrats और Patristocrats, कीवर्ड-वर्णमाला सिफर, और Caesar तथा Atbash जैसे सरल मामले शामिल हैं। यह Vigenère जैसे polyalphabetic सिफर हल नहीं करता, जो चलते-चलते वर्णमाला बदल देते हैं।
सॉल्वर कैसे काम करता है?
दो चरणों में। पहले यह शुरुआती अनुमान बनाने के लिए सिफरटेक्स्ट अक्षर फ्रीक्वेंसियों का अंग्रेज़ी से मिलान करता है। फिर यह simulated annealing का उपयोग करता है — बार-बार दो अक्षरों को आपस में बदलना और उन अदला-बदलियों को रखना जो टेक्स्ट को अधिक अंग्रेज़ी जैसा बनाती हैं, जबकि गतिरोधों से बचने के लिए कभी-कभी एक झटका स्वीकार करना — जिसे इस आधार पर स्कोर किया जाता है कि तीन-अक्षरीय संयोजन कितने स्वाभाविक दिखते हैं। यह कई बार चलता है और सर्वोत्तम परिणाम रखता है।
अक्षर फ्रीक्वेंसियों के बजाय trigram स्कोरिंग का उपयोग क्यों किया जाता है?
एकल-अक्षर फ्रीक्वेंसियों को एक ऐसी कुंजी से मिलाया जा सकता है जो फिर भी बकवास उत्पन्न करती है, इसलिए वे सही उत्तर पहचानने के लिए अकेले पर्याप्त नहीं हैं। Trigram फिटनेस तीन अक्षरों के प्रत्येक समूह को असली अंग्रेज़ी के विरुद्ध स्कोर करती है, जहाँ THE, AND और ING सामान्य हैं और अधिकांश तिकड़ियाँ अत्यंत दुर्लभ हैं। एक गलत कुंजी अस्वाभाविक तिकड़ियाँ उत्पन्न करती है और बुरा स्कोर करती है, जिससे खोज असली पठन पर केंद्रित हो जाती है।
एक क्रिप्टोग्राम तोड़ने के लिए मुझे कितना टेक्स्ट चाहिए?
लगभग सटीक हल के लिए कम से कम एक सौ पचास अक्षरों की सामान्य अंग्रेज़ी का लक्ष्य रखें। लगभग अस्सी से सौ अक्षर आमतौर पर काम करते हैं लेकिन एक-दो दुर्लभ अक्षर गलत पढ़ सकते हैं। लगभग पचास अक्षरों से नीचे किसी भी सॉल्वर के लिए निश्चित होने के लिए शायद ही कभी पर्याप्त सांख्यिकीय प्रमाण होता है, इसलिए केवल आंशिक पठन की अपेक्षा करें।
परिणाम लगभग सही है लेकिन कुछ अक्षर गलत हैं। ऐसा क्यों?
J, Q, X और Z जैसे दुर्लभ अक्षर इतने कम आते हैं कि एक छोटे संदेश में उन्हें आत्मविश्वास से स्थान देने के लिए पर्याप्त नहीं हो सकते, और समान फ्रीक्वेंसियों वाले दो अक्षर कभी-कभी आपस में बदले जा सकते हैं। इसका हल आमतौर पर अधिक सिफरटेक्स्ट है, या बाकी संदेश पठनीय हो जाने के बाद उन एक-दो भटके हुए अक्षरों को आँख से ठीक करना है।
क्या यह उस क्रिप्टोग्राम को हल करेगा जो स्पेस बनाए रखता है (एक Aristocrat)?
हाँ। स्पेस, अंक और विराम चिह्न आउटपुट में संरक्षित रहते हैं लेकिन हल करते समय अनदेखे रहते हैं, इसलिए शब्द-विराम न तो मदद करते हैं न बाधा डालते हैं। चाहे आपकी पहेली स्पेस बनाए रखती हो (एक Aristocrat) या उन्हें हटा देती हो (एक Patristocrat), वही फ्रीक्वेंसी-और-trigram विधि संदेश पुनः प्राप्त कर लेती है।
क्या सॉल्वर नियतात्मक (deterministic) है?
हाँ। यद्यपि यह एक यादृच्छिक खोज का उपयोग करता है, यादृच्छिकता एक निश्चित बीज द्वारा संचालित होती है, इसलिए वही सिफरटेक्स्ट हमेशा वही परिणाम उत्पन्न करता है। इसका यह भी अर्थ है कि एक साझा किया गया लिंक उसे खोलने वाले किसी भी व्यक्ति के लिए ठीक वही हल पुनः उत्पन्न करता है।
क्या यह केवल अंग्रेज़ी पर काम करता है?
अंतर्निहित फ्रीक्वेंसी और trigram तालिकाएँ अंग्रेज़ी का वर्णन करती हैं, इसलिए यह अंग्रेज़ी प्लेनटेक्स्ट के लिए ट्यून किया गया है। किसी अन्य भाषा का संदेश आमतौर पर तब भी बकवास के रूप में आएगा जब खोज सफल हो जाए, क्योंकि यह गलत आँकड़ों से मिलान कर रहा होता है। गैर-अंग्रेज़ी टेक्स्ट के लिए आपको उस भाषा के लिए फ्रीक्वेंसी डेटा की आवश्यकता होगी।
क्या मेरा सिफरटेक्स्ट किसी सर्वर पर भेजा जाता है?
नहीं। पूरी खोज आपके ब्राउज़र में चलती है, इसलिए आपका टेक्स्ट कभी अपलोड, लॉग या संग्रहीत नहीं किया जाता। यहाँ तक कि साझा लिंक भी आपके सिफरटेक्स्ट को URL के हैश के बाद वाले भाग में रखता है, जिसे ब्राउज़र कभी किसी सर्वर तक प्रेषित नहीं करते, इसलिए यह तब तक निजी रहता है जब तक आप इसे साझा करना न चुनें।
अगर यह बिल्कुल भी सब्स्टीट्यूशन सिफर न हो तो क्या?
यदि हल बकवास के रूप में आता है और अक्षर फ्रीक्वेंसियाँ असामान्य रूप से सपाट दिखती हैं, तो संदेश polyalphabetic, transposition-आधारित, या कुछ बिल्कुल अलग हो सकता है। यह पता लगाने के लिए कि आप किससे निपट रहे हैं, Cipher Identifier चलाएँ, फिर मेल खाने वाले टूल का उपयोग करें — उदाहरण के लिए एक दोहराई जाने वाली-कुंजी सिफर के लिए Vigenère Solver।

संबंधित टूल्स

इन उपयोगी टूल्स के साथ आगे बढ़ें

साइफर पहचानकर्ता

आवृत्ति विश्लेषण

Unix टाइमस्टैम्प परिवर्तक

JSON से CSV परिवर्तक

CSV से JSON कन्वर्टर

JSON से YAML परिवर्तक