Использование браузера Firefox с Playwright crawler
В этом примере показано, как использовать PlaywrightCrawler
с браузером Firefox в безголовом режиме.
подсказка
Чтобы запустить этот пример на платформе Apify, выберите образ apify/actor-node-playwright-firefox
для вашего Dockerfile.
Run on
import { PlaywrightCrawler } from 'crawlee';
import { firefox } from 'playwright';
// Создаем экземпляр класса PlaywrightCrawler.
const crawler = new PlaywrightCrawler({
launchContext: {
// Указываем браузер Firefox для использования краулером.
// Если опция launcher не указана здесь,
// по умолчанию будет использоваться браузер Chromium.
launcher: firefox,
},
async requestHandler({ request, page, log }) {
const pageTitle = await page.title();
log.info(`URL: ${request.loadedUrl} | Page title: ${pageTitle}`);
},
});
await crawler.addRequests(['https://example.com']);
// Запускаем краулер и ждем, пока он закончит работу.
await crawler.run();
Чтобы увидеть реальный пример использования PlaywrightCrawler
в сочетании с RequestQueue
для рекурсивного сбора данных с сайта Hacker News, ознакомьтесь с примером Playwright crawler
.