spamsink: (Default)
[personal profile] spamsink
Сподобился я в последнее время смотреть лингвистические ролики ПостНауки (на скорости 1.5x или выше, разумеется, как и любые другие по-русски, а то беда).

В частности, один из роликов назывался Машинный перевод, корпус эротических рассказов и феминитивы // Интервью с Александром Пиперски (замечу кстати, что Пиперски — голова, ему палец в рот не клади).

Так вот, в части, посвященной компьютерному анализу частотности слов в корпусе эротических рассказов (начиная с 25:00), Пиперски анализирует особенности частотности общей лексики в зависимости от категории рассказа (потому что частотность специфической лексики будет варьироваться однозначно), выясняя, какие обычные слова языка значимо чаще встречаются в той или иной категории (26:10).

(26:30) Например, если посмотреть на категорию рассказов про гомосексуальность, то там очень высоко стоит слово "невольно".


Дальше он делает из этого наблюдения некоторые выводы, и их, наверное, можно сделать несколько разных, но, оказывается, из какого сора растут социокультурные наблюдения, не ведая стыда!

Date: 2020-02-22 05:24 pm (UTC)
erin_karsa: (Default)
From: [personal profile] erin_karsa
На одной социолингвистической конференции была презентация о семантике на материале dickpics. Наивные организаторы поставили ее в крошечную комнату с двумя другими выступлениями о чем-то там в транскриптах исландского парламента и смехе в британском. На первых двух презентациях это была обычная комната секции "а тут у нас то, что больше никуда не приткнулось," но на разговор о семантике народ только что на люстре не сидел.
Page generated May. 3rd, 2026 02:20 am
Powered by Dreamwidth Studios