Предлагаю устроить конкурс между Pyro и @Rafa3L и RegExp.
На входе любой HTML желательно большой длинны.
Задача как в теме вытащить необходимые данные с HTML, параметры поиска задаются динамически.
Оценка по 3-м параметрам скорость, объем занимаемой оперативки и результат.
__________________
Код сырец
|