spamsink | Нам пишут из прошлого, программистское

Днесь пришло мне письмо (в ответ на моё, посланное в кодировке UTF-8, как ныне принято у приличных людей), в нем три строчки всего, не считая процитированного моего, на которое адресат отвечал.

Начинается письмо так:

è•Ë’ÂÚ!

Это значит "Привет!" (потому что в процитированном моем, которое я начинал тем же словом, в начале стоят ровно те же значки). В виде quoted-printable: =E8=95=CB=92=C2=DA

Лебедевский декодер оказался НЕ в силах справиться с расшифровкой. Мне пришлось перенести сообщение в редактор и, глядя на мой оригинал, заменять крокозябры на буквы по одной.

Как наиболее простым способом выяснить, какие перекодировки претерпело это сообщение?

Flat | Top-Level Comments Only

From:

vadim-i-z.livejournal.com

Не понял: оказался декодер в силах или не оказался?

spamsink

Ошибка редактирования. Я сначала выразился более резко.

parovoz.livejournal.com

В смысле "НЕ в силах"?

Конечно, спасибо.

hazel-dormouse.livejournal.com

тот декодер, которым я обычно пользовалась в отношении приходящих в мой адиум кракозябр, выдал такие варианты раскодировки предполагаемого "Привет!":
1. •ХкТбз! ...
•ХкТбз!
2. уЙрАГ! ...
уЙрАГ!
3. .иЛфВЪ! ...
.иЛфВЪ!
4. .ЕЪВСЧ! ...
.ЕЪВСЧ!
5. ЕЯЧУЮ! ...
ЕЯЧУЮ!
6. еъвсч! ...
еъвсч!
7. ‰ЙмЖчя! ...
‰ЙмЖчя!
8. иЛфВЪ! ...
иЛфВЪ!

Видимо, принципиально алгоритмы у них схожие.

vladboroda.livejournal.com

Есть такой очень приличный декодер, которым я обычно пользуюсь для расшифровки подобных сообщений: http://2cyr.com/decode/?lang=en
Но и он "приветом" не разродился.

Зато когда я ввел в исходное окно "Привет!", выбрал в этом декодере koi-8r displayed as windows-1251, в окне результата получилось оПХБЕР! Если не выбирать уникодный пост-фильтр, а просто взять и скопировать результат, и сделать paste в любое окно ввода в Firefox, получится это: è•Ë’ÂÚ! Т.е. автор, вероятно, написал письмо в кодировке koi-8r, потом почему-то скопировал его в 1251, а потом уже в уникодное окно ввода. Сделать конвертацию назад, из è•Ë’ÂÚ! в оПХБЕР!, мне не удалось, хотя это наверняка возможно. :)

У меня так не получилось - все равно оПХБЕР! показывает. Может, от версии зависит; может, от установок каких или от сочетания кодировок окна (таба) с декодером и окна (таба), куда копируется текст. Какие именно закулисные преобразования сделал FF, неясно.

А у меня, кстати, тоже. :) Может быть в первый раз забыл copy сделать... Но похоже, что здесь какой-то двойной энкодинг. Только не знаю, что. Попробуйте несколько слов в конвертер запихнуть, или целое предложение... Может быть он дальше продвинется (он вроде бы 4725 вариантов пробует...)

Я, конечно, попробовал - увы.

kdv2005.livejournal.com

I do not know how to answer your question, but you may find the introduction in the following article entertaining.
http://www.ams.org/bull/2009-46-02/S0273-0979-08-01238-X/S0273-0979-08-01238-X.pdf
The technique described there is probably useless for such short messages as in your example, but still I was amused reading it.

Thank you, it was fun!
Bible scolars should try deciphering DNA into Hebrew this way. :)

Decoding the message would not have been a big problem even if I did not have the full cleartext. The question is how to find a sequence of permutations leading to this result, given a set of possible permutations (or their inverse).

Утвеждение 1: Ни в одной распространённой кириллической кодировке (KOI8R, CP1251, CP866, ISO-8895-5, MacCyrillic) русские буквы не встречаются однвременно в рядах E-/C-/D- и 9-.

Следствие 1: Предполагая, что "Привет" был правильно перекодирован из UTF-8 в одну из восьмибитных кодировок, è•Ë’ÂÚ не является суперпозицией перекодировок из одной кириллической кодировки в другую.

Утверждение 2: Судя по тому, что количество букв при перекодировке из UTF-8 в 8 бит сохранилось, перекодировка была произведена правильно.

Следствие 2: Исходное сообщение гдк-то по пути побывало в некириллической кодировке.

Спасибо. Это объясняет, почему автоматические перекодировщики постигла неудача. Мне удалось выяснить, что перекодировок между восьмибитными кодировками было более одной.
Я проверил, каким восьмибитным кодам может в принципе соответствовать буква П, каким символам юникода могут эти коды соответствовать во всех известных (программе iconv) кодировках, в какие восьмибитные коды они могут отображаться, и выбрал преобразования, приводящие к E8. Ни одно из них не перекодирует всю строку "Привет" ожидаемым образом.

S	M	T	W	T	F	S
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28

Playing poohsticks in the Styx

For entertainment purposes only

Нам пишут из прошлого, программистское

Нам пишут из прошлого, программистское

no subject

no subject

оказался в силах

Re: оказался в силах

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

Profile

February 2026

Most Popular Tags

Page Summary

Active Entries

Style Credit

Expand Cut Tags