Форум по Delphi программированию

Delphi Sources



Вернуться   Форум по Delphi программированию > Все о Delphi > [ "Начинающим" ]
Ник
Пароль
Регистрация <<         Правила форума         >> FAQ Пользователи Календарь Поиск Сообщения за сегодня Все разделы прочитаны

Ответ
 
Опции темы Поиск в этой теме Опции просмотра
  #1  
Старый 16.11.2017, 09:20
NovaC NovaC вне форума
Прохожий
 
Регистрация: 13.11.2006
Сообщения: 24
Репутация: 10
По умолчанию Сохранение страниц в web.archive.org

Программа по списку сохраняет страницы сайта cian.ru на ресурсе web.archive.org путем выполнения GET запроса:
http://web.archive.org/save/ссылка_н...яемую_страницу

После n-ой страницы cian.ru предлагает ввести рекапчу.
Капчу можно разгадать через сервис антикапчи.
На cian.ru ответ на капчу нужно отправить POST запросом:
https://www.cian.ru/captcha/?redirec...//www.cian.ru/
g-recaptcha-response=[расшифровка капчи]&redirect_url=https://www.cian.ru/

Вопрос в том как отправить расшифровку капчи на cian.ru через web.archive.org, чтобы программа могла дальше продолжить сохранение страниц?

Спасибо!
Ответить с цитированием
  #2  
Старый 16.11.2017, 13:54
Аватар для Alegun
Alegun Alegun вне форума
LMD-DML
 
Регистрация: 12.07.2009
Адрес: Богородское
Сообщения: 3,025
Версия Delphi: D7E
Репутация: 1834
По умолчанию

Нужен алгоритм того, как это всё "ручками" делается, а во время выполнения ловится момент "После n-ой страницы" посредством парсинга ответов на запросы и по шаблону алгола делается всё остальное. Слишком общая задача, без конкретики, желательно разбить её на этапы
Ответить с цитированием
  #3  
Старый 16.11.2017, 17:25
NovaC NovaC вне форума
Прохожий
 
Регистрация: 13.11.2006
Сообщения: 24
Репутация: 10
По умолчанию

Цитата:
Сообщение от Alegun
Нужен алгоритм того, как это всё "ручками" делается

Руками это сделать не получается, т.е. при появлении капчи cian возвращает HTTP 302... и web.archive.org переходит с требуемой страницы на страницу с капчей вот такого вида
https://www.cian.ru/captcha/?redirec...//www.cian.ru/
но руками вести эту капчу когда она открывается через web.archive.org не получается т.к. она в этом случае отображается не корректно, вот так:
http://web.archive.org/save/https://...//www.cian.ru/

Цитата:
Сообщение от Alegun
ловится момент "После n-ой страницы" посредством парсинга ответов на запросы
поймать момент и отгадать капчу не проблема. Вопрос в том как отправить разгаданную капчу в cian.ru через web.archive.org?
Проблема в том что web.archive.org работает с сохраняемыми сайтами через GET запросы а капча отправляется на cian.ru POST запросом.
Т.е. возможно есть способ искуственно передать POST запрос в GET запросе т.е. так чтобы cian.ru "поверил" что web.archive.org разгадал капчу

Последний раз редактировалось NovaC, 16.11.2017 в 17:29.
Ответить с цитированием
Ответ


Delphi Sources

Опции темы Поиск в этой теме
Поиск в этой теме:

Расширенный поиск
Опции просмотра

Ваши права в разделе
Вы не можете создавать темы
Вы не можете отвечать на сообщения
Вы не можете прикреплять файлы
Вы не можете редактировать сообщения

BB-коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.
Быстрый переход


Часовой пояс GMT +3, время: 16:32.


 

Сайт

Форум

FAQ

RSS лента

Прочее

 

Copyright © Форум "Delphi Sources" by BrokenByte Software, 2004-2023

ВКонтакте   Facebook   Twitter