T

Text Machine

Alat teks andal, di browser Anda

Pemecah Sandi Substitusi

Tempel sandi substitusi monoalfabetik atau kriptogram dan pulihkan pesan aslinya tanpa mengetahui kuncinya. Pemecah ini mencocokkan frekuensi huruf untuk tebakan awal, lalu menggunakan simulated annealing yang dinilai berdasarkan trigram bahasa Inggris untuk menelusuri alfabet 26 huruf demi menemukan pembacaan yang paling mirip bahasa Inggris. Semuanya berjalan di peramban Anda.

Coba contoh:

Teks sandi

Tempel sandi substitusi di atas, tekan Pecahkan, dan pesan yang dipulihkan beserta alfabet substitusinya akan muncul di sini. Semakin banyak teks yang Anda berikan, semakin andal jawabannya.

Cara menggunakan Pemecah Sandi Substitusi

  1. 1

    Tempel teks sandi

    Salin sandi substitusi atau kriptogram Anda dan tempel ke dalam kotak. Semakin banyak teks semakin andal hasilnya; huruf dibaca tanpa memperhatikan huruf besar/kecil, dan spasi, angka serta tanda baca diabaikan saat memecahkan lalu dipulihkan pada jawabannya.

  2. 2

    Tekan Pecahkan

    Klik Pecahkan sandi. Pencarian berjalan sejenak — alat ini mencoba ratusan ribu kandidat alfabet — lalu menampilkan pembacaan yang paling mirip bahasa Inggris yang ditemukannya.

  3. 3

    Baca pesan yang dipulihkan

    Teks yang telah dipecahkan muncul dengan huruf besar, spasi dan tanda baca aslinya dipulihkan. Salin dengan satu klik untuk menyimpan hasilnya.

  4. 4

    Periksa alfabet yang dipulihkan

    Di bawah pesan, alfabet substitusi menunjukkan hasil pemecahan setiap huruf teks sandi. Huruf yang diredupkan tidak pernah muncul dalam teks Anda, sehingga pemecah tidak dapat menempatkannya. Salin alfabet untuk digunakan kembali atau memverifikasi kuncinya.

  5. 5

    Bagikan atau hapus

    Salin tautan yang dapat dibagikan yang membuka kembali alat dengan teks sandi Anda persis — teksnya berada di bagian URL setelah tanda pagar, yang tidak pernah sampai ke server. Hapus mengatur ulang segalanya.

Membobol sandi substitusi, dijelaskan

Apa yang dilakukan alat ini

Sandi substitusi monoalfabetik mengganti setiap huruf alfabet dengan huruf lain — A bisa menjadi Q, B bisa menjadi W — dan menggunakan alfabet acak yang sama itu untuk seluruh pesan. Inilah sandi di balik kriptogram surat kabar, teka-teki escape room, dan Aristocrat dari American Cryptogram Association. Ada lebih dari empat ratus septiliun kemungkinan alfabet, jauh terlalu banyak untuk dicoba satu per satu, namun sandi substitusi adalah salah satu sandi yang paling mudah dipecahkan. Alat ini memecahkannya untuk Anda, secara otomatis, tanpa kunci.

Tempel teks sandi dan pemecah akan mengembalikan pesan asli yang paling mungkin beserta seluruh alfabet substitusi yang berhasil dipulihkannya. Alat ini bekerja seperti pemecah teka-teki berpengalaman — mulai dari frekuensi huruf, lalu terus menukar huruf dan mempertahankan perubahan yang membuat teks terbaca lebih mirip bahasa Inggris — hanya saja ia melakukannya ratusan ribu kali per detik. Tidak ada yang keluar dari peramban Anda; seluruh pencarian berjalan di mesin Anda sendiri.

Mengapa sandi substitusi dapat dipecahkan

Sandi substitusi menyembunyikan huruf mana adalah huruf apa, tetapi tidak dapat menyembunyikan seberapa sering setiap huruf digunakan. Dalam bahasa Inggris, E jauh lebih umum daripada huruf lainnya, diikuti oleh T, A, O, I dan N, sementara J, Q, X dan Z langka. Enkripsi hanya melabeli ulang frekuensi itu: huruf apa pun yang menggantikan E akan menjadi huruf paling umum dalam teks sandi. Fakta tunggal itu — frekuensi huruf bertahan melalui substitusi — adalah celah di baju zirah yang menjadi fondasi seluruh kriptanalisis.

Frekuensi saja tidak cukup, karena beberapa huruf memiliki jumlah yang serupa dan dapat tertukar secara keliru. Sinyal yang lebih dalam terletak pada bagaimana huruf-huruf berpadu. Bahasa Inggris menyukai pola tertentu — TH, HE, ING, THE, AND — dan hampir sepenuhnya menghindari pola lainnya. Pemecahan yang benar penuh dengan pola alami itu; pemecahan yang salah dipenuhi kombinasi yang tidak pernah digunakan dalam bahasa Inggris nyata. Mengukur perbedaan itulah yang memungkinkan komputer mengenali jawaban yang benar di antara begitu banyak jawaban salah yang tampak masuk akal.

Langkah pertama: tebakan awal yang dicocokkan dengan frekuensi

Pemecah memulai dengan menghitung seberapa sering setiap huruf muncul dalam teks sandi dan menyejajarkan jumlah itu dengan urutan frekuensi bahasa Inggris yang sudah diketahui. Huruf teks sandi yang paling umum ditebak sebagai E, berikutnya T, lalu A, O, I, N dan seterusnya menuruni daftar. Ini adalah langkah pertama klasik yang dipelajari setiap pemecah kriptogram secara manual.

Tebakan itu jarang sempurna — huruf yang lebih langka sangat mungkin salah ditempatkan — tetapi memang tidak perlu sempurna. Ia hanya perlu cukup dekat untuk memberi pencarian titik awal yang masuk akal. Dari sana, alat ini menyempurnakan alfabet huruf demi huruf hingga pesan menjadi jelas.

Langkah kedua: simulated annealing menemukan kunci

Dari tebakan awal, pemecah berulang kali menukar makna teks asli dari dua huruf dan menanyakan apakah pesan kini terbaca lebih mirip bahasa Inggris. Jika sebuah pertukaran membantu, pertukaran itu dipertahankan. Masalahnya, selalu memaksakan perbaikan langsung membuat pencarian tersangkut pada hampir-benar — optimum lokal — yang tidak dapat dilepaskan oleh satu pertukaran mana pun. Pemecahan substitusi adalah contoh buku teks untuk teknik bernama simulated annealing, yang memperbaiki tepat masalah ini.

Simulated annealing kadang menerima pertukaran yang sesaat memperburuk keadaan, dengan probabilitas yang mula-mula tinggi lalu terus diturunkan — seolah pencarian awalnya panas dan perlahan mendingin. Pada awalnya ia menjelajah bebas dan keluar dari jalan buntu; kemudian ia tenang dan memoles alfabet terbaik yang telah ditemukannya. Alat ini menjalankan proses ini beberapa kali dari titik awal yang berbeda, mengakhiri setiap putaran dengan tahap perbaikan-saja yang ketat, dan mempertahankan satu hasil terbaik — itulah sebabnya ia andal menemukan jawaban yang akan terlewat oleh pendakian bukit biasa.

Bagaimana pemecah menilai bahasa Inggris: kecocokan trigram

Setiap kandidat alfabet dinilai dengan satu angka: kecocokan trigramnya. Alat ini memeriksa setiap rangkaian tiga huruf berurutan dalam teks yang telah dipecahkan dan menjumlahkan seberapa mungkin setiap tiga huruf itu muncul dalam bahasa Inggris nyata, menggunakan tabel frekuensi tiga huruf yang dibangun dari kumpulan besar tulisan bahasa Inggris. Tiga huruf umum seperti THE, AND dan ING mendapat nilai bagus; tiga huruf yang tidak pernah digunakan bahasa Inggris mendapat nilai sangat buruk.

Trigram penting karena frekuensi satu huruf terlalu mudah dikelabui — kunci yang salah dapat mencocokkan jumlah huruf namun tetap menghasilkan omong kosong. Jauh lebih sulit memalsukan satu halaman penuh kombinasi tiga huruf yang meyakinkan. Dengan mengarahkan setiap pertukaran menuju kecocokan trigram yang lebih tinggi, pencarian ditarik, pertukaran demi pertukaran, menuju bahasa Inggris yang asli. Tabelnya dibuat dari artikel situs ini sendiri, sehingga tidak ada yang diambil dari luar dan alat ini tetap cepat dan privat.

Berapa banyak teks yang Anda butuhkan, dan kapan ia kesulitan

Membobol sandi substitusi adalah pekerjaan statistik, jadi keberhasilannya bergantung pada seberapa banyak teks yang Anda berikan. Dengan sekitar seratus lima puluh huruf atau lebih teks bahasa Inggris biasa, pemulihan biasanya nyaris sempurna. Pada sekitar delapan puluh hingga seratus huruf ia masih bekerja tetapi satu atau dua huruf langka — J, Q, X dan Z yang hampir tidak muncul — mungkin salah dibaca, karena memang tidak cukup bukti untuk memastikannya. Di bawah sekitar lima puluh huruf, pemecah mana pun, manusia maupun mesin, sebagian besar hanya menebak.

Beberapa hal lain membuat pesan lebih sulit: teks yang sengaja menghindari huruf umum (seperti pangram), tulisan yang bukan bahasa Inggris, atau sandi yang juga memindahkan posisi huruf alih-alih hanya melabeli ulang. Saat pembacaan keluar hampir benar, jawabannya hampir selalu lebih banyak teks sandi, atau memperbaiki satu atau dua huruf yang membandel secara manual. Jika teksnya sama sekali bukan substitusi sederhana, Cipher Identifier dapat memberi tahu apa sebenarnya yang Anda hadapi.

Sandi substitusi dan kerabatnya

Substitusi sederhana yang mempertahankan jeda kata adalah apa yang disebut penyusun kriptogram sebagai Aristocrat; sandi yang sama dengan spasi dihilangkan disebut Patristocrat. Keduanya monoalfabetik — satu alfabet tetap untuk seluruh pesan — dan keduanya tunduk pada metode di sini. Caesar dan Atbash hanyalah substitusi khusus yang bahkan lebih sederhana, jadi alat ini juga membobolnya, meski halaman khususnya memecahkannya secara instan.

Lonjakan besar dalam tingkat kesulitan adalah sandi polialfabetik, yang mengganti alfabet seiring berjalannya pesan sehingga huruf yang sama dapat mewakili beberapa huruf berbeda. Sandi Vigenère adalah contoh terkenal, dan analisis frekuensi pada seluruh pesan tidak lagi mempan terhadapnya. Jika pesan Anda menolak pemecah ini dan frekuensi hurufnya tampak mencurigakan datar, mungkin ia polialfabetik — gunakan Vigenère Solver sebagai gantinya.

Pertanyaan yang sering diajukan

Apakah Anda benar-benar bisa memecahkan sandi substitusi tanpa kuncinya?
Ya. Sandi substitusi menyembunyikan huruf mana adalah huruf apa tetapi tidak menyembunyikan seberapa sering masing-masing digunakan, dan frekuensi huruf serta kelompok tiga huruf bahasa Inggris sangat khas. Pemecah memulai dari frekuensi itu lalu mencari alfabet yang hasil pemecahannya paling mirip bahasa Inggris, memulihkan baik pesan maupun kunci tanpa apa pun yang disediakan sebelumnya.
Jenis sandi apa yang dipecahkan oleh alat ini?
Alat ini memecahkan sandi substitusi monoalfabetik — jenis di mana satu alfabet acak tetap menggantikan huruf untuk seluruh pesan. Itu mencakup kriptogram surat kabar, Aristocrat dan Patristocrat, sandi alfabet-kata kunci, serta kasus yang lebih sederhana seperti Caesar dan Atbash. Ia tidak memecahkan sandi polialfabetik seperti Vigenère, yang mengganti alfabet seiring berjalannya pesan.
Bagaimana cara kerja pemecah ini?
Dalam dua tahap. Pertama, ia mencocokkan frekuensi huruf teks sandi dengan bahasa Inggris untuk membuat tebakan awal. Lalu ia menggunakan simulated annealing — berulang kali menukar dua huruf dan mempertahankan pertukaran yang membuat teks lebih mirip bahasa Inggris, sambil sesekali menerima kemunduran untuk keluar dari jalan buntu — yang dinilai berdasarkan seberapa alami kombinasi tiga hurufnya terlihat. Ia berjalan beberapa kali dan mempertahankan hasil terbaik.
Mengapa penilaian trigram digunakan alih-alih frekuensi huruf?
Frekuensi satu huruf dapat dicocokkan oleh kunci yang tetap menghasilkan omong kosong, sehingga itu tidak cukup dengan sendirinya untuk mengenali jawaban yang benar. Kecocokan trigram menilai setiap rangkaian tiga huruf terhadap bahasa Inggris nyata, di mana THE, AND dan ING umum sementara sebagian besar tiga huruf sangat langka. Kunci yang salah menghasilkan tiga huruf yang tidak alami dan mendapat nilai buruk, yang memungkinkan pencarian mengarah tepat ke pembacaan yang asli.
Berapa banyak teks yang saya butuhkan untuk membobol kriptogram?
Usahakan setidaknya seratus lima puluh huruf teks bahasa Inggris biasa untuk pemecahan yang nyaris sempurna. Sekitar delapan puluh hingga seratus huruf biasanya berhasil tetapi mungkin salah membaca satu atau dua huruf langka. Di bawah sekitar lima puluh huruf jarang ada cukup bukti statistik bagi pemecah mana pun untuk yakin, jadi harapkan hanya pembacaan sebagian.
Hasilnya hampir benar tetapi beberapa huruf salah. Mengapa?
Huruf langka seperti J, Q, X dan Z muncul begitu jarang sehingga pesan pendek mungkin tidak memuat cukup banyak dari huruf itu untuk menempatkannya dengan percaya diri, dan dua huruf dengan frekuensi serupa kadang dapat tertukar. Solusinya biasanya lebih banyak teks sandi, atau memperbaiki satu atau dua huruf yang nyasar secara manual setelah sisa pesannya dapat dibaca.
Apakah ia akan memecahkan kriptogram yang mempertahankan spasi (Aristocrat)?
Ya. Spasi, angka dan tanda baca dipertahankan pada hasil tetapi diabaikan saat memecahkan, jadi jeda kata tidak membantu maupun menghalangi. Baik teka-teki Anda mempertahankan spasi (Aristocrat) atau menghilangkannya (Patristocrat), metode frekuensi-dan-trigram yang sama akan memulihkan pesannya.
Apakah pemecah ini deterministik?
Ya. Meskipun menggunakan pencarian acak, keacakannya digerakkan oleh seed tetap, sehingga teks sandi yang sama selalu menghasilkan hasil yang sama. Itu juga berarti tautan yang dibagikan mereproduksi pemecahan yang persis sama bagi siapa pun yang membukanya.
Apakah ia hanya bekerja pada bahasa Inggris?
Tabel frekuensi dan trigram bawaan menggambarkan bahasa Inggris, jadi ia disetel untuk teks asli bahasa Inggris. Pesan dalam bahasa lain biasanya akan keluar sebagai omong kosong bahkan ketika pencarian berhasil, karena ia mencocokkan dengan statistik yang salah. Untuk teks non-Inggris Anda membutuhkan data frekuensi untuk bahasa tersebut.
Apakah teks sandi saya dikirim ke server?
Tidak. Seluruh pencarian berjalan di peramban Anda, jadi teks Anda tidak pernah diunggah, dicatat, atau disimpan. Bahkan tautan yang dibagikan menyimpan teks sandi Anda di bagian URL setelah tanda pagar, yang tidak pernah dikirim peramban ke server, sehingga tetap privat kecuali Anda memilih untuk membagikannya.
Bagaimana jika ternyata bukan sandi substitusi sama sekali?
Jika hasil pemecahan keluar sebagai omong kosong dan frekuensi hurufnya tampak luar biasa datar, pesan itu mungkin polialfabetik, berbasis transposisi, atau sesuatu yang sama sekali berbeda. Jalankan Cipher Identifier untuk mengetahui apa yang Anda hadapi, lalu gunakan alat yang sesuai — misalnya Vigenère Solver untuk sandi berkunci-berulang.

Alat terkait

Lanjutkan dengan alat praktis ini

Pengidentifikasi Sandi

Analisis Frekuensi

Konverter Unix Timestamp

Konverter JSON ↔ CSV

Konverter CSV ke JSON

Konverter JSON ↔ YAML