반응형
2022년 현재, 최고의 웹 스크래핑 도구는 무엇인가요? 라고 질문을 했고요..
아래는 HN의 질문에 대한 답변들입니다.
- Playwright : JS실행이 필요한 웹페이지가 많아져서, 브라우저 자동화 도구가 편함
- Beautiful Soup : 다양한 스크래핑 앱 만들기 편한 파이썬 패키지
- 쉘에서 cURL + pup(마크업)/cskit(CSV)/jq(JSON)/psql(DB)
- Browserflow : 웹 브라우저 기반의 작업 자동화 도구
- curl-impersonate : 브라우저 처럼 웹사이트를 가져오는 포크버전
- Helium : 더 사용하기 편한 Selenium-Python
- undetected_chromedriver : CloudFlare 봇 체크를 통과하는 커스텀 Selenium Chromedriver
- estela : 쿠버네티스에서 동작하는 elastic web scraping cluster
웹 스크래핑 도구를 사용하실때 참고하시면 좋을것 같아서 공유합니다.
오늘의 블로그는 여기까지고요..
항상믿고 봐주셔서 감사합니다.
300x250
'좋아하는 것_매직IT > 96.IT 핫이슈' 카테고리의 다른 글
Discord가 네트웍 디스크의 지연시간을 최소화한 방법 (discord.com) (0) | 2022.08.17 |
---|---|
Tour de Source - 오픈소스 코드를 설명하는 뉴스레터 (tourdesource.substack.com) (0) | 2022.08.16 |
Learning Patterns - 웹 앱 설계를 위한 패턴들 (patterns.dev) (0) | 2022.08.16 |
StemRoller - 노래에서 보컬과 악기를 분리해주는 무료 앱 오픈소스 (github.com/stemrollerapp) (0) | 2022.08.16 |
Deno 큰 변화 예정 (deno.com) (0) | 2022.08.16 |