spamsink: (Default)
[personal profile] spamsink
Вчера исполнилось 20 лет тому, что пробивало себе путь медленно и трудно, но сейчас используется сотнями миллионов людей во всем мире:
кодировке UTF-8

Она была изобретена, как это обычно бывает, на салфетке в столовой.

Date: 2012-09-07 01:12 am (UTC)
From: [identity profile] juan-gandhi.livejournal.com
Одна из тяжелейших задач по жизни - впарить менеджменту, что не нужно никаких других кодировок. В Гугле хотя бы это поняли с самого начала, всё легче. А то в Борланде меня затрахали с японскими, китайскими, вордовыми... в Японии до сих пор ещё жива железнодорожная семибитная, какая-то EUC-7, что ли. Ну Япония, там же тормоза живут.

Date: 2012-09-07 01:42 am (UTC)
From: [identity profile] ygam.livejournal.com
Ура!

Date: 2012-09-07 01:59 am (UTC)
From: [identity profile] archaicos.livejournal.com
И тем не менее народ периодически просит код для убирания диакритических знаков с буковок в тексте.

Date: 2012-09-07 03:08 am (UTC)
From: [identity profile] archaicos.livejournal.com
В прямом смысле. Не желают видеть во входных данных José и año, а хотят Jose и ano. Некоторые ещё ну очень сильно не дружат с унифицированным кодом.

Date: 2012-09-07 03:17 am (UTC)
vak: (Default)
From: [personal profile] vak
А я буквально недавно осознал, откуда истоки. Компьютеры и байт ни при чем. Телеграфные аппараты с середины 19-го века работали в коде Морзе/Вэйла. Кто-то решил для русских букв использовать те же коды, что для "похожих" латинских. Получилась таблица КОИ-7. Только одна буква с тех пор изменилась: Q переползло с Щ на Я.

Date: 2012-09-07 03:38 am (UTC)
From: [identity profile] archaicos.livejournal.com
В интернетах всплывают периодически, вот например:
http://stackoverflow.com/questions/1453171/n-n-n-or-remove-diacritical-marks-from-unicode-cha

Date: 2012-09-07 07:50 am (UTC)
From: [identity profile] janatem.livejournal.com
Глядя на ссылку, подумал, что юбилей у рекурсии. Что, очевидно, фактологически неверно.

Date: 2012-09-11 08:30 pm (UTC)
From: [identity profile] fatoff.livejournal.com
А мне все эти экспириенсы с кодировками одну головную боль напоминают. Действительно, ещё в конце 90-х - начале 2000-х столько межколхозных перекодировщиков паслось на безбрежных просторах! В те времена подзастрял в одной прикладной конторке. Чудище было обло, зело огромно и лаяй. Нет чтобы UTF-8, который тогда вполне зрелый был, всем использовать. Козлы. Это был рантъ.

Profile

spamsink: (Default)
spamsink

February 2026

S M T W T F S
12345 67
8 91011 121314
15161718 192021
22 2324 25262728

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Mar. 5th, 2026 07:53 am
Powered by Dreamwidth Studios