ealmeida/scripts

Files

T

History

ealmeida 6ac6f4be2a init: scripts diversos (crawlers, conversores, scrapers)

2026-03-05 20:38:36 +00:00

..

.gitignore

init: scripts diversos (crawlers, conversores, scrapers)

2026-03-05 20:38:36 +00:00

4ai.py

init: scripts diversos (crawlers, conversores, scrapers)

2026-03-05 20:38:36 +00:00

config.py

init: scripts diversos (crawlers, conversores, scrapers)

2026-03-05 20:38:36 +00:00

r1.py

init: scripts diversos (crawlers, conversores, scrapers)

2026-03-05 20:38:36 +00:00

README.md

init: scripts diversos (crawlers, conversores, scrapers)

2026-03-05 20:38:36 +00:00

requirements.txt

init: scripts diversos (crawlers, conversores, scrapers)

2026-03-05 20:38:36 +00:00

README.md

crawl4all - Async Web Crawler

Crawler assincrono baseado em crawl4ai com profundidade configuravel.

Setup

python3 -m venv venv
source venv/bin/activate
pip install -r requirements.txt

Uso

# Editar config.py com URL alvo
python r1.py

Configuracao

Editar config.py:

BASE_URL - URL alvo
MAX_DEPTH - Profundidade maxima (default: 2)
MAX_CONCURRENCY - Workers paralelos (default: 10)
OUTPUT_DIR - Pasta de output (default: "output")