spamsink: (Default)
[personal profile] spamsink
Днесь пришло мне письмо (в ответ на моё, посланное в кодировке UTF-8, как ныне принято у приличных людей), в нем три строчки всего, не считая процитированного моего, на которое адресат отвечал.

Начинается письмо так:

è•Ë’ÂÚ!

Это значит "Привет!" (потому что в процитированном моем, которое я начинал тем же словом, в начале стоят ровно те же значки). В виде quoted-printable: =E8=95=CB=92=C2=DA

Лебедевский декодер оказался НЕ в силах справиться с расшифровкой. Мне пришлось перенести сообщение в редактор и, глядя на мой оригинал, заменять крокозябры на буквы по одной.

Как наиболее простым способом выяснить, какие перекодировки претерпело это сообщение?

Date: 2009-06-04 06:09 pm (UTC)
From: [identity profile] vadim-i-z.livejournal.com
Не понял: оказался декодер в силах или не оказался?

оказался в силах

Date: 2009-06-04 06:11 pm (UTC)
From: [identity profile] parovoz.livejournal.com
В смысле "НЕ в силах"?

Date: 2009-06-04 06:53 pm (UTC)
From: [identity profile] hazel-dormouse.livejournal.com
тот декодер, которым я обычно пользовалась в отношении приходящих в мой адиум кракозябр, выдал такие варианты раскодировки предполагаемого "Привет!":
1. •ХкТбз! ...
•ХкТбз!
2. уЙрАГ! ...
уЙрАГ!
3. .иЛфВЪ! ...
.иЛфВЪ!
4. .ЕЪВСЧ! ...
.ЕЪВСЧ!
5. ЕЯЧУЮ! ...
ЕЯЧУЮ!
6. еъвсч! ...
еъвсч!
7. ‰ЙмЖчя! ...
‰ЙмЖчя!
8. иЛфВЪ! ...
иЛфВЪ!

Date: 2009-06-04 07:18 pm (UTC)
From: [identity profile] vladboroda.livejournal.com
Есть такой очень приличный декодер, которым я обычно пользуюсь для расшифровки подобных сообщений: http://2cyr.com/decode/?lang=en
Но и он "приветом" не разродился.

Зато когда я ввел в исходное окно "Привет!", выбрал в этом декодере koi-8r displayed as windows-1251, в окне результата получилось оПХБЕР! Если не выбирать уникодный пост-фильтр, а просто взять и скопировать результат, и сделать paste в любое окно ввода в Firefox, получится это: è•Ë’ÂÚ! Т.е. автор, вероятно, написал письмо в кодировке koi-8r, потом почему-то скопировал его в 1251, а потом уже в уникодное окно ввода. Сделать конвертацию назад, из è•Ë’ÂÚ! в оПХБЕР!, мне не удалось, хотя это наверняка возможно. :)

Date: 2009-06-04 07:58 pm (UTC)
From: [identity profile] vladboroda.livejournal.com
А у меня, кстати, тоже. :) Может быть в первый раз забыл copy сделать... Но похоже, что здесь какой-то двойной энкодинг. Только не знаю, что. Попробуйте несколько слов в конвертер запихнуть, или целое предложение... Может быть он дальше продвинется (он вроде бы 4725 вариантов пробует...)

Date: 2009-06-04 07:29 pm (UTC)
From: [identity profile] kdv2005.livejournal.com
I do not know how to answer your question, but you may find the introduction in the following article entertaining.
http://www.ams.org/bull/2009-46-02/S0273-0979-08-01238-X/S0273-0979-08-01238-X.pdf
The technique described there is probably useless for such short messages as in your example, but still I was amused reading it.

Date: 2009-06-04 11:52 pm (UTC)
From: [identity profile] parovoz.livejournal.com
Утвеждение 1: Ни в одной распространённой кириллической кодировке (KOI8R, CP1251, CP866, ISO-8895-5, MacCyrillic) русские буквы не встречаются однвременно в рядах E-/C-/D- и 9-.

Следствие 1: Предполагая, что "Привет" был правильно перекодирован из UTF-8 в одну из восьмибитных кодировок, è•Ë’ÂÚ не является суперпозицией перекодировок из одной кириллической кодировки в другую.

Утверждение 2: Судя по тому, что количество букв при перекодировке из UTF-8 в 8 бит сохранилось, перекодировка была произведена правильно.

Следствие 2: Исходное сообщение гдк-то по пути побывало в некириллической кодировке.

Profile

spamsink: (Default)
spamsink

February 2026

S M T W T F S
12345 67
8 91011 121314
15161718 192021
22 2324 25262728

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Mar. 5th, 2026 02:43 am
Powered by Dreamwidth Studios