1. Начата процедура восстановления социальных групп. Лидерам старых и новых групп обязательно ознакомиться с регламентом проведения работ.

Любой символ включая перенос

Тема в разделе 'Регулярные выражения', создана пользователем TrastMan, 26 дек 2011.

  1. Как раз наоборот, это правильный вариант в данном случае, так как комбинация [^>]+ как раз таки и гарантирует, что между а и href= может быть не только пробел, а и класс, и стили и всё что угодно кроме закрывающей угловой скобки .

    А вот этого вопроса я не понял, какие слова из списка? Приведите лучше пример что есть и что хотите получить, так проще понять что вам нужно.
  2. Есть допустим 'хttp://domain.com/slovo1/' и xttp://domain.com/slovo2/ и далее. Нужно проигнорировать ссылку в теле которой есть слово2, а остальные собрать.
    На счет a[^>]+href=' . Как только использую эту конструкцию, не работает. х.з. почему.
  3. ИМХО я бы сначало собрал все ссылки а потом рассортировывал по тому что надо исключал со словами, собирал с картинками и тд.
  4. А что меняется?
  5. меняется последовательность и процесс раскладывается на этапы а найти универсальную регулярку не всегда возможно особенно если контент на страницах переменный