spamsink: (Default)
spamsink ([personal profile] spamsink) wrote2025-05-19 09:28 pm
Entry tags:

Видала мышку на ковре

Брат нашел в лабазах каменных папку-скоросшиватель примерно 40+летней давности и отсканировал из него несколько страниц.







Собственно текст представляет лишь слабый исторический интерес, а вот кому не лень будет написать (с помощью ИИ, например) программу, которая: поправляет потенциальный завал горизонта; делит изображение на знакоместа; классифицирует символы; усредняет их, делая на ходу поправку на возможный сдвиг глифа в знакоместе; и, наконец, выдает идеализированные глифы?
lxe: (Default)

[personal profile] lxe 2025-05-20 04:58 am (UTC)(link)
Насколько не справляется тессеракт (`unpaper` + `tesseract-ocr`)?
Edited 2025-05-20 04:58 (UTC)
lxe: (Default)

[personal profile] lxe 2025-05-20 05:20 am (UTC)(link)
Если не предполагать дрейф межсимвольных расстояний, почему не предполагать, что это решается OCR и в какой-то (небольшой) мере подбором шрифта?
vak: (Default)

[personal profile] vak 2025-05-20 07:11 am (UTC)(link)
Задача создать шрифт по имеющимся оттискам.
lxe: (Default)

[personal profile] lxe 2025-05-20 07:15 am (UTC)(link)
А. Обычная задача optical fusion.
lxe: (Default)

[personal profile] lxe 2025-05-20 07:46 am (UTC)(link)
Если вычесть fiber или вставить image (optical image fusion), работает.

Но простых вариантов ровно два, либо грубая сила, либо FFT/DCT (убирающие фазу и тем самым поправляющие на движение).
Edited 2025-05-20 07:47 (UTC)
lxe: (Default)

[personal profile] lxe 2025-05-20 03:46 pm (UTC)(link)
Случайное смещение — это, в конечном счете, и есть фаза.
sab123: (Default)

[personal profile] sab123 2025-05-20 06:04 am (UTC)(link)
Наверное самое простое решение - OCR и заново напечатать любым желаемым шрифтом. (+1)