spamsink | Музыка как текст

Вдруг захотелось странного, но для этого у меня не хватает знаний по предметной области.

С более или менее раннего детства мы знаем, что осмысленные тексты можно подвергать сжатию с потерями, после которого основной смысл (что бы это ни значило) текста всё же сохраняется. Этому нас учили чуть ли не с младшей школы, где мы начинали писать свои первые изложения, потом дело дошло до конспектов, рефератов, у кого-то даже авторефератов...

Раз у нас XXI век на дворе, то неудивительно, что существуют уже и автоматические системы выделения существенных деталей из текста (первое, что нашлось; говорит, что multilanguage, но русского не умеет; впрочем, видно, что их теперь как грибов после дождя).

С другой стороны, мы с того же детства знаем, что сжатию с потерями можно подвергать и сигналы. В частности, мало для кого секрет, что полоса пропускания проводной телефонной линии была от 300 до 3400 Гц (текст при этом остаётся разборчив для почти всех практических применений), ну и о разнообразных методах сжатия музыки с разным соотношением битрейта и качества тоже все наслышаны. Что можно "сжимать" музыку путем прослушивания её в ускоренном темпе, совсем уж очевидно, но для полноты надо и это упомянуть.

А теперь внимание, вопрос: можно ли скрестить эти два-три способа сжатия, и подвергать автоматизированному конспектированию музыкальные формы? И делалось ли это уже?

Навскидку кажется, что музыка, будучи записана как текст, а не как сигнал, должна гораздо более легко поддаваться сжатию, чем текст на естественном языке, поскольку в ней больше повторяемости. Так, может, если какую-нибудь полуторачасовую симфонию записать в нотации, пригодной для автоконспектировщика, и засунуть в него, от неё и останется минут 5-10, как от многостраничной болтологической статьи остается конспект на страничку-две?

В случае с песнями, многие из которых имеют структуру

куплет_со_вступлением - рефрен - [ ещё_куплет - рефрен ] x N раз - проигрыш - рефрен - кода

их можно в простейшем случае сжать до N = 1, или даже до N = 0, или, по максимуму, до

куплет_со_вступлением - рефрен - кода

но для этого уже нужен определенный интеллект.

А с музыкальными формами более сложной структуры неужели это никогда не пробовали? Хотя бы вручную.

Примечание для тех, кто понимает: я в очередной раз вспомнил про алгоритм, который по входной строке строит грамматику, порождающую данную строку.

Crossposts: https://spamsink.livejournal.com/838135.html

Flat | Top-Level Comments Only

From:

sobriquet9

В узких частных случаях вполне возможно, и скорее всего даже делалось. Например, вместо того, чтобы записывать звук пианино, можно записать моменты нажатия клавиш, со скоростью и временем (например, в виде MIDI файла). "Декомпрессия" будет заключаться в прогоне этого MIDI файла через какой-нибудь Vienna Instruments Pro или ещё какой-нибудь виртуальный рояль с сэмплами настоящего Стейнвея.

Наверняка точно так же можно взять звуковой файл, пропустить его через преобразование Фурье со всякой фильтрацией и сделать по нему MIDI.

Но если вместо пианино у нас саксофон или аккордеон, то выйдет конфуз.

From:

spamsink

Я спрашиваю, пробовал ли кто-нибудь КОНСПЕКТИРОВАТЬ музыку.

From:

sab123

Мы, наверное, все это делаем, когда узнаем песню по припеву, а остальное нифига не помним. Так что алгоритм должен быть примерно такой: пропустить проигрыш, взять немножко из начала, потом припев (т.е. часто повторяющаяся часть), и немножко конец.

А вот, кстати, еще такой момент: аранжировка для оркестра - это как бы "расширение" базовой мелодии. Соответственно, урезание оркестровки до нотации для одного инструмента - обратно сжатие.

From:

spamsink

Вот и хотелось бы увидеть это дело автоматизированным.

И да, "деаранжировка" - это конспектирование в одной размерности, а выделение ключевых мест - в другой.

From:

sobriquet9

Если говорить про конспектирование в смысле выделения главных кусков, то для музыки есть thumbnailing, причём народ научился это делать прямо по MP3, используя его сжатие в корыстных целях.

Для превращения музыки из аудио файла в ноты (AMT, Automatic Music Transcription) нонче используют CNN. Причём распознавалка умеет даже ошибки исправлять и менять аранжировку. Представление музыки внутри такой распознавалки можно было бы назвать конспектом, только нечеловеческим, поскольку читать его умеют только роботы.

From:

spamsink

По описанию это ровно то, что я хочу, но хотелось бы послушать примеры.

From:

juan_gandhi

А просто закодировать ноты маловато будет?

From:

spamsink

Просто напечатать статью мелким шрифтом и законспектировать её - две большие разницы.

From:

juan_gandhi

Ну как, вот целая нота ля, 440 герц, тянется сколько, секунду? 440 колебаний, оцифровано. Очень много бит. А закодировать ноту - ну сколько там, пара байт максимум.

From:

spamsink

Это всё так, но речь не об этом. Конспект текста - это текст меньшего размера (в лексемах), сохраняющий тезисы и общий смысл оригинала, но избавленный от длиннот, разжевываний "очевидного", лирических отступлений и т.п. Хотелось бы узнать, можно ли сделать что-то подобное с музыкой более сложной структуры, чем песня.

From:

sab123

Ну так сначала в ноты как текст, а потом напустить сжатие текста. Алгоритм по ссылке, кстати, очень напомниает классических Лемпел-Зива. Так что, наверное, и другие медоды сжатия можно использовтаь для эти целей.

From:

spamsink

Речь не просто о сжатии, а о summarizing. Алгоритм лишь позволяет определять ключевые последовательности, построив грамматику, а вот как из неё сделать "конспект" - задача пока нерешённая.

From:

sab123

В качестве простой идеи: взять того же Лемпел-Зива на нотной записи и вести учет, сколько раз повторился какой фрагмент. Потом выбрать из "достаточно длинных" фрагментов то, что чаще повторяется. Поскольку в музыке они любят повторять те же фрагменты со сдвигом вверх или вниз, то кодировать ноты не в абсолютном виде, а в дифференциальном от предыдущей ноты ("стартовый тон" каждого использования можно хранить вместе со счетчиком повторений).

Гм, а в виде "сырого звука" есть же сжатие МП3. Вот в нем и порыться тем же образом на предмет повторов.

From:

sobriquet9

Нет в MP3 ничего на предмет повторов. Его принцип больше похож на JPEG, чем на Лемпеля-Зива. Вместо того, чтобы смотреть назад, MP3 раскладывает звук в спектр и оцифровывает разные частоты с разным огрублением. Если в звуке громкая нота ля частотой 440 Гц, то она маскирует соседние частоты (439 и 441) и их можно передавать с огрублением или не передавать вообще.

From:

juan_gandhi

Ну вот ноты это и обеспечивают.

From:

sab123

Кстати, конспект - это такая запись, по которой мождет понять предмет человек, уже несколько с этим предметом знакомый. В отличие от полноценного учебника, который разжевывает незнакомому человеку.

From:

nicolas83

Популярную песню "Ветер с моря дул" можно ужать в 2 раза вообще без потери смысла.

From:

spamsink

Это да, известное дело. :)

From:

nicolas83

Равнозначен ли будет стейк с бокалом вина beef jerky с чайной ложкой винного порошка? Кому-то да.

From:

juan_gandhi

Вот.

Есть еще идея, что гугл стрит вью вполне заменяет прогулку по Монмартру или по Толедо.

From:

nicolas83

From:

juan_gandhi

Вот, органика.

From:

spamsink

Не заменяет, но даёт прекрасную ориентировку, если/когда туда попадёшь живьём. Так, например, использование гугл мапс (не помню, были ли уже тогда стрит вью) перед поездкой в Рим сэкономило мне немало денег и нервов при ночной поездке на такси от вокзала до гостиницы.

From:

spamsink

Нет повода для вопроса. О "равнозначности" никто не говорил. Опять же, издатели Cliff's Notes, как говорится, "дураки-дураки, а червонец в день имеют".

From:

fenikso

Тогда нужно ещё впридачу тестового манекена со среднестатистическим восприятием музыки, чтобы законспектированная музыка воспринималась так же (вызывала те же эмоции, etc. - definition required).

From:

spamsink

Сначала нужно хоть какую научиться получать, а уж оцениватели найдутся.

From:

dijifi

Па-па-па-пам!

From:

nicolas83

- Па-бам! Пара-па-ба-бам!
- Тата-рам да-рам дам!

From:

dijifi

Осталось придумать игру, набрать данных, надрессировать модель и всё

From:

dememax

Очень интересная тема, но музыка тут, конечно, лишь приложение.
Мне кажется, наибольший рассвет в этих алгоритмах должен наблюдаться сейчас в области анализа генетических последовательностей.

Но жизнь, конечно, намного сложнее оказывается, насколько я понимаю.
Вспомнить тот же анекдот, когда Вовочку заставляют извиниться и три раза повторить одну и ту же фразу. (точнее, наоборот)
:-)

В общем, как уже указали, если есть ноты, то я не вижу особой разницы с анализом других последовательностей.

From:

dememax

Кстати, а чего в музыку-то ударяться!?
Будто в нашей области люди мало копи-пастят, ведь актуальная проблема!
Много кто пользуется утилитами, которые бы сказали: вот тут у вас, молодой человек, три функции, а отличаются - одной переменной, вот вам текст, как их объединить в одну!

Edited Date: 2021-02-22 10:59 am (UTC)

From:

spamsink

Ну да, этой штукой я уже давно пользуюсь для прищучивания:
https://pmd.github.io/latest/pmd_userdocs_cpd.html

From:

dememax

О, спасибо!
А то я был в курсе только одного проекта, который даже в дебиане в виде пакета присутствует:

https://www.dickgrune.com/Programs/similarity_tester/

Забавно, что в моём дистрибутиве есть dev-php/phpmd, но нет самого PMD, от которого он зависит.

From:

spamsink

Я тоже особой разницы не вижу. Хочется для развлечения послушать результаты применения этих алгоритмов.

Flat | Top-Level Comments Only

Profile

spamsink

April 2026

S	M	T	W	T	F	S
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30

Page Summary

Active Entries

Style Credit

Style: Early Edition for Five AM by winterfish

Expand Cut Tags

No cut tags

Page generated Apr. 16th, 2026 04:08 am

For entertainment purposes only

Музыка как текст

Page Summary

Active Entries

Style Credit

Expand Cut Tags