Тогда ближе к теме. Вопрос касался парсинга ХТМЛ с целью перевода его в текст.
Имеется ХТМЛ код
Код:
<script>
a = 'a';
b = 'b';
document.write (a + b);
</script>
<b>Some bold text</b>
<script>
c = 'c';
d = 'd';
alert (c + d);
</script>
Изнего нужно сделать текст.
strip_tags() не вырезает скрипты как известно (а так же тэги с ">" в параметрах, кстати). Так что приходится писать регэкспы. По поводу удаления тэга </script> в сети наше только вот такое: "/\<script[^\>]*\>[\s\S]*\<\/script\>/". А исходя из того, что механизм сравнения с рег. выражением пытается получить максимально большую строку получаем, что от исходного ХТМЛ кода ничего не остается, так как preg_replace () находит открывающий "<script>" в начале и закрывающий "</script>" в конце кода. И строка "Some bold text" теряется.
От того и спрашивал как описать что строка не содержит подстроки. Короче как написать, что между тэгами "<script>" и "</script>" нету "</script>". Одним символом ">" или "<" тут не ограничешься, ибо в скриптах они встречаются довольно часто.
Может у кого есть готовое решение?