|
|
Регистрация | << Правила форума >> | FAQ | Пользователи | Календарь | Поиск | Сообщения за сегодня | Все разделы прочитаны |
|
Опции темы | Поиск в этой теме | Опции просмотра |
#1
|
|||
|
|||
Парсинг регулярками
Всем привет, не как не могу врубиться в эти регулярки, помогите пожалуйста разобраться.
На странице сайта имеется: ...<img src='/images/icon/race/1.png' alt=''/> Вася<br/> ... ... ...<span class='white'>1000</span> Как я понял нужно пользоваться этим Код:
RegExp.Expression := '(.*?)'; Но как записать от куда, до куда парсить? если записать начало class='white'>, то из-за кавычек ошибка В первом случае вообще ссылка меняется Читал по обратные слэши и квадр. скобки, пытаюсь уже целый день и не выходит. По скобкам ещё: вот надо спарсить только цифры, это ведь [0-9], но в какое место его записать? |
#2
|
||||
|
||||
Цитата:
|
#3
|
||||
|
||||
Чего вы хотите-то? Значения из HTM документа получать? Можно конечно регулярками, ну а можно и через WebBrowser. Можно вообще ограничится стандартными функциями Copy, Pos и т.д. Все зависит от поставленной задачи.
Жизнь такова какова она есть и больше никакова. Помогаю за спасибо. |
#4
|
|||
|
|||
Отправляю гет, получаю исходник страницы, вот из этого исходника, из строчки
Код:
<img src='/images/icon/race/1.png' alt=''/> Вася<br/> |
#5
|
||||
|
||||
Вот вам вариант без регулярок:
Код:
Var Htm: String; SL: TStringList; begin Htm := '<img src=''/images/icon/race/1.png'' alt=''''/> Вася<br/>'; SL := TStringList.Create; SL.Text := WrapText(Htm, #13, ['>','<'], 1); ShowMessage(Copy(SL.Strings[1], 1, Length(SL.Strings[1])-1)); SL.Free; Жизнь такова какова она есть и больше никакова. Помогаю за спасибо. |
#6
|
|||
|
|||
Спасибо, бро) Всё, что нужно было мне узнать, это то, что одинарные кавычки нужно взять ещё раз в кавычки.
Вот как я сделал с регуляркой по твоему примеру Код:
cop.Expression := 'alt=''mp''/>(.*?)</span>'; |