Entry tags:
Программистский вопрос; возможно, тупой
Вопрос про регулярные выражения.
Приглашаются также продвинутые пользователи текстовых редакторов, ворд-процессоров и т. п., знающие магический смысл сочетания .* в строке поиска по тексту.
Легко написать регулярное выражение, которое находит строки, содержащие "foo" слева от "bar", и чтобы "qux" было между ними: foo.*qux.*bar (не будем сейчас вдаваться в подробности, как именно распределятся символы строки по этим ".*", если вхождений "foo", "bar" или "qux" в строке несколько).
Вопрос вот в чём: есть ли где-нибудь такое расширение языка регулярных выражений, которое позволило бы компактно записать условие найти строки, содержащие "foo" слева от "bar", и чтобы между ними не было "qux"?
UPD: На самом деле здесь две задачи. Первая: паттерну должны удовлетворять строки /foo(.*)bar/ (т.е. .* захватывает всё между первым вхождением foo и последним вхождением bar в строке), такие, что в захваченной строке не содержится qux; вторая: паттерну должны удовлетворять строки, в которых найдутся такие вхождения foo и bar, между которыми нет qux.
Строка "foo qux foo xxx bar qux bar" не удовлетворяет первому паттерну, но удовлетворяет второму.
Похоже, negative lookahead assertions решают одну из двух задач
Приглашаются также продвинутые пользователи текстовых редакторов, ворд-процессоров и т. п., знающие магический смысл сочетания .* в строке поиска по тексту.
Легко написать регулярное выражение, которое находит строки, содержащие "foo" слева от "bar", и чтобы "qux" было между ними: foo.*qux.*bar (не будем сейчас вдаваться в подробности, как именно распределятся символы строки по этим ".*", если вхождений "foo", "bar" или "qux" в строке несколько).
Вопрос вот в чём: есть ли где-нибудь такое расширение языка регулярных выражений, которое позволило бы компактно записать условие найти строки, содержащие "foo" слева от "bar", и чтобы между ними не было "qux"?
UPD: На самом деле здесь две задачи. Первая: паттерну должны удовлетворять строки /foo(.*)bar/ (т.е. .* захватывает всё между первым вхождением foo и последним вхождением bar в строке), такие, что в захваченной строке не содержится qux; вторая: паттерну должны удовлетворять строки, в которых найдутся такие вхождения foo и bar, между которыми нет qux.
Строка "foo qux foo xxx bar qux bar" не удовлетворяет первому паттерну, но удовлетворяет второму.
Похоже, negative lookahead assertions решают одну из двух задач
no subject
.* придется убрать.
foo[^q](q[^u](qu[^x]*)?)?bar
Ну, может, скобок убавить.
no subject
И что, ни одна сука до сих не придумала нормального макроса для сокращённой/безошибочной записи этого уродства? Мало ли, может, у меня вместо qux слово из пятнадцати букв.
no subject
О блин. Ну да, после закрывающей квадратной скобки.
А что делать, что делать. Мы ж изготовляем конечный автомат.
no subject
А если надо написать, чтобы не было ни qux, ни yabba, то это же сдохнуть можно будет руками писать.
no subject
no subject
no subject
might work (haven't tested).
no subject
no subject
foo xxx bar qux bar
а должно.
no subject
no subject
Вообще у меня что-то из такого таки работало, но не помню, что, где и в насколько частном случае https://stackoverflow.com/q/2404010/539470
Тред не читал @ сразу отвечал
no subject
no subject
Is there a reason, like a specification for regex with negative lookahead? Javascript and python work just fine for foo xxx bar qux bar.
no subject
no subject
В апдейте я уточнил про две разные задачи, и хочется чего-то вроде foo(*!qux)bar в первом случае (просто звёздочка захватывает максимальную длину) и foo(*?!qux)bar во втором (звёздочка-вопрос захватывает минимальную длину). Именно с захватом, а не assertion. Такого я не видел.
no subject
Вместо ß можно использовть что-нибудь более экзотическое, если текст на немецком.
no subject