Перейти к основному содержимому

Examples

📄️ Обход карты сайта

В этом примере мы рассмотрим, как работать с картой сайта (sitemap) - файлом, который помогает поисковым системам определить важные страницы и файлы на веб-сайте. Мы создадим краулер, который загружает и обрабатывает URL-адреса из карты сайта, используя утилиту Sitemap из модуля @crawlee/utils.

📄️ Использование плагина Puppeteer Stealth (puppeteer-extra) и playwright-extra

puppeteer-extra и playwright-extra - это библиотеки, разработанные сообществом, которые добавляют систему плагинов для расширения функциональности puppeteer и playwright соответственно (например, улучшение маскировки бота с помощью плагина Puppeteer Stealth (puppeteer-extra-plugin-stealth)).

📄️ Скачивание файлов

При веб-скрапинге часто возникает необходимость загружать различные файлы, такие как изображения, PDF-документы или другие бинарные файлы. В этом примере мы рассмотрим, как скачивать файлы с помощью Crawlee и сохранять их в хранилище ключ-значение по умолчанию.