본문으로 건너뛰기

Puppeteer를 사용한 재귀적 크롤링

PuppeteerCrawler를 사용하여 웹사이트를 재귀적으로 크롤링하는 예제를 실행해보세요.

Apify 플랫폼에서 이 예제를 실행하려면 Dockerfile에서 apify/actor-node-puppeteer-chrome 이미지를 선택하세요.

Run on
import { PuppeteerCrawler } from 'crawlee';

const crawler = new PuppeteerCrawler({
async requestHandler({ request, page, enqueueLinks, log }) {
const title = await page.title();
log.info(`Title of ${request.url}: ${title}`);

await enqueueLinks({
globs: ['http?(s)://www.iana.org/**'],
});
},
maxRequestsPerCrawl: 10,
});

await crawler.addRequests(['https://www.iana.org/']);

await crawler.run();