Нам пишут из прошлого, программистское
Jun. 4th, 2009 11:01 amДнесь пришло мне письмо (в ответ на моё, посланное в кодировке UTF-8, как ныне принято у приличных людей), в нем три строчки всего, не считая процитированного моего, на которое адресат отвечал.
Начинается письмо так:
è•Ë’ÂÚ!
Это значит "Привет!" (потому что в процитированном моем, которое я начинал тем же словом, в начале стоят ровно те же значки). В виде quoted-printable: =E8=95=CB=92=C2=DA
Лебедевский декодер оказался НЕ в силах справиться с расшифровкой. Мне пришлось перенести сообщение в редактор и, глядя на мой оригинал, заменять крокозябры на буквы по одной.
Как наиболее простым способом выяснить, какие перекодировки претерпело это сообщение?
Начинается письмо так:
è•Ë’ÂÚ!
Это значит "Привет!" (потому что в процитированном моем, которое я начинал тем же словом, в начале стоят ровно те же значки). В виде quoted-printable: =E8=95=CB=92=C2=DA
Лебедевский декодер оказался НЕ в силах справиться с расшифровкой. Мне пришлось перенести сообщение в редактор и, глядя на мой оригинал, заменять крокозябры на буквы по одной.
Как наиболее простым способом выяснить, какие перекодировки претерпело это сообщение?
no subject
Date: 2009-06-04 06:09 pm (UTC)no subject
Date: 2009-06-04 06:14 pm (UTC)оказался в силах
Date: 2009-06-04 06:11 pm (UTC)Re: оказался в силах
Date: 2009-06-04 06:14 pm (UTC)no subject
Date: 2009-06-04 06:53 pm (UTC)1. •ХкТбз! ...
•ХкТбз!
2. уЙрАГ! ...
уЙрАГ!
3. .иЛфВЪ! ...
.иЛфВЪ!
4. .ЕЪВСЧ! ...
.ЕЪВСЧ!
5. ЕЯЧУЮ! ...
ЕЯЧУЮ!
6. еъвсч! ...
еъвсч!
7. ‰ЙмЖчя! ...
‰ЙмЖчя!
8. иЛфВЪ! ...
иЛфВЪ!
no subject
Date: 2009-06-04 07:15 pm (UTC)no subject
Date: 2009-06-04 07:18 pm (UTC)Но и он "приветом" не разродился.
Зато когда я ввел в исходное окно "Привет!", выбрал в этом декодере koi-8r displayed as windows-1251, в окне результата получилось оПХБЕР! Если не выбирать уникодный пост-фильтр, а просто взять и скопировать результат, и сделать paste в любое окно ввода в Firefox, получится это: è•Ë’ÂÚ! Т.е. автор, вероятно, написал письмо в кодировке koi-8r, потом почему-то скопировал его в 1251, а потом уже в уникодное окно ввода. Сделать конвертацию назад, из è•Ë’ÂÚ! в оПХБЕР!, мне не удалось, хотя это наверняка возможно. :)
no subject
Date: 2009-06-04 07:43 pm (UTC)no subject
Date: 2009-06-04 07:58 pm (UTC)no subject
Date: 2009-06-04 08:20 pm (UTC)no subject
Date: 2009-06-04 07:29 pm (UTC)http://www.ams.org/bull/2009-46-02/S0273-0979-08-01238-X/S0273-0979-08-01238-X.pdf
The technique described there is probably useless for such short messages as in your example, but still I was amused reading it.
no subject
Date: 2009-06-04 08:28 pm (UTC)Bible scolars should try deciphering DNA into Hebrew this way. :)
Decoding the message would not have been a big problem even if I did not have the full cleartext. The question is how to find a sequence of permutations leading to this result, given a set of possible permutations (or their inverse).
no subject
Date: 2009-06-04 11:52 pm (UTC)Следствие 1: Предполагая, что "Привет" был правильно перекодирован из UTF-8 в одну из восьмибитных кодировок, è•Ë’ÂÚ не является суперпозицией перекодировок из одной кириллической кодировки в другую.
Утверждение 2: Судя по тому, что количество букв при перекодировке из UTF-8 в 8 бит сохранилось, перекодировка была произведена правильно.
Следствие 2: Исходное сообщение гдк-то по пути побывало в некириллической кодировке.
no subject
Date: 2009-06-05 12:15 am (UTC)Я проверил, каким восьмибитным кодам может в принципе соответствовать буква П, каким символам юникода могут эти коды соответствовать во всех известных (программе iconv) кодировках, в какие восьмибитные коды они могут отображаться, и выбрал преобразования, приводящие к E8. Ни одно из них не перекодирует всю строку "Привет" ожидаемым образом.