Мурло стандартизатора
Oct. 17th, 2009 03:35 pmЖили мы - не тужили, и вдруг захотелось нам в распределенном проекте файлов с русскими именами. С этим делом во всех уважающих себя операционных системах нынче порядок - имена хранятся в юникоде, чтобы всем было одинаково неудобно. Хоть китайскими иероглифами имена вводи.
Вот и ввели. На чрезвычайно уважающей себя операционной системе МакОС. Потом все эти файлы уехали на sourceforge.net, а оттуда - на машину с другой весьма уважаемой операционной системой. Да, впрочем, и с третьей тоже, несмотря на новизну.
Файл называется "слойка" (это не кондитерское, а... нет, лучше не начинать, да это и неважно).
Ожидали файл с именем слойка, а получилось - слойка. Видите разницу?
(Кто совсем не видит - назовитесь.)
Стандарт предписывает хранить имена файлов, используя канонические представления символов юникода. Для буквы "й" каноническое представление - U+0438 CYRILLIC SMALL LETTER I + U+0306 COMBINING BREVE. Этой, пардон за каламбур, буквы стандарта, судя по всему, пока строго придерживается только МакОС. Вот так и живем.
Вот и ввели. На чрезвычайно уважающей себя операционной системе МакОС. Потом все эти файлы уехали на sourceforge.net, а оттуда - на машину с другой весьма уважаемой операционной системой. Да, впрочем, и с третьей тоже, несмотря на новизну.
Файл называется "слойка" (это не кондитерское, а... нет, лучше не начинать, да это и неважно).
Ожидали файл с именем слойка, а получилось - слойка. Видите разницу?
(Кто совсем не видит - назовитесь.)
Стандарт предписывает хранить имена файлов, используя канонические представления символов юникода. Для буквы "й" каноническое представление - U+0438 CYRILLIC SMALL LETTER I + U+0306 COMBINING BREVE. Этой, пардон за каламбур, буквы стандарта, судя по всему, пока строго придерживается только МакОС. Вот так и живем.
no subject
Date: 2009-10-17 11:18 pm (UTC)А вы не выпендривайтесь :-))
no subject
Date: 2009-10-17 11:48 pm (UTC)no subject
Date: 2009-10-18 01:18 am (UTC)no subject
Date: 2009-10-17 11:19 pm (UTC)no subject
Date: 2009-10-17 11:50 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2009-10-17 11:20 pm (UTC)no subject
Date: 2009-10-17 11:47 pm (UTC)Причем навскидку угадать, есть у буквы с диакритикой канонизация или нет, невозможно. Например, у Ç - есть, у Ł - нет, у Ľ - есть, а у Ŀ - нет.
(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2009-10-17 11:21 pm (UTC)бонусызряплаты, платежи за оффис и т.д. вывешивается на sourceforge.net?no subject
Date: 2009-10-17 11:41 pm (UTC)плохомсмысле платежей?(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2009-10-17 11:25 pm (UTC)no subject
Date: 2009-10-17 11:36 pm (UTC)Когда она видна (например, в эмуляторе терминала специально сделаны spacing diacritics), проблем нет; хуже, когда в одном каталоге может быть два разных файла с "одинаковыми" именами.
no subject
Date: 2009-10-17 11:30 pm (UTC)Скопировал, вставил в текстовый редактор - вышло так:
no subject
Date: 2009-10-17 11:38 pm (UTC)no subject
Date: 2009-10-17 11:38 pm (UTC)no subject
Date: 2009-10-17 11:39 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2009-10-18 12:11 am (UTC)Весело живём.
no subject
Date: 2009-10-18 12:27 am (UTC)Некоторые то ли шрифты, то ли рендереры выбирают компромиссное решение - они делают диакритику с нулевой шириной, отчего она налезает не на предыдущий символ, а на следующий.
(no subject)
From:no subject
Date: 2009-10-18 12:39 am (UTC)no subject
Date: 2009-10-18 03:34 am (UTC)no subject
Date: 2009-10-18 01:18 am (UTC)Кстати, большинство русских программ не умеют работать с кодировками, как это ни невероятно звучит. The Bat и Punto Switcher сплошь все состоят из одних вопросительных знаков (в одной версии, правда, одно! меню нормально читается — видно, кто-то начал экспериментировать и бросил). WinRar не умеет распаковать файлы, если в пути к директории, куда пытаешься распаковать, есть русские буквы. Вот это противоречие меня как-то больше всего озадачивает.
no subject
Date: 2009-10-18 01:23 am (UTC)no subject
Date: 2009-10-18 02:28 am (UTC)Mac OS X 10.4.11, FF 3.5.3
no subject
Date: 2009-10-18 03:01 am (UTC)no subject
Date: 2009-10-18 03:04 am (UTC)no subject
Date: 2009-10-18 03:29 am (UTC)no subject
Date: 2009-10-18 03:33 am (UTC)no subject
Date: 2009-10-18 03:35 am (UTC)Водородная бомба, что ли?
Вижу разницу. Firefox 3.5.3.
no subject
Date: 2009-10-18 04:11 am (UTC)no subject
Date: 2009-10-18 04:37 am (UTC)no subject
Date: 2009-10-18 04:51 am (UTC)Но пуант поста в том, что не браузеры, а файловые системы ведут себя по-разному.
(no subject)
From:no subject
Date: 2009-10-18 04:38 am (UTC)no subject
Date: 2009-10-18 05:03 am (UTC)no subject
Date: 2009-10-18 06:04 am (UTC)(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2009-10-18 06:35 am (UTC)XP + FF - брев съехал на середину между И и К
Скопировал в Notepad и поиграл с фонтами - в некоторых нет разницы, в других же второе И значительно меньше и тоньше остальных букв.
no subject
Date: 2009-10-18 06:43 am (UTC)XP SP2, FF 3.5.3
no subject
Date: 2009-10-18 06:46 am (UTC)no subject
Date: 2009-10-18 06:33 pm (UTC)MS Windows XP, IE 6
no subject
Date: 2009-10-19 12:51 am (UTC)no subject
Date: 2009-10-19 08:49 pm (UTC)no subject
Date: 2009-10-19 09:35 pm (UTC)А видимость или невидимость разницы упомянута лишь для того, чтобы показать, что в одних интерфейсах и при одних фонтах причина поведения ОС видна невооруженным глазом, а в других и при других - может вызвать резкое недоумение.
(no subject)
From: