[python] URL에서 원하는 부분만 예쁘게 추출하기 - urllib

Python 2020. 8. 14. 11:13

URL 관련한 작업을 하고 있다면, 원하는 부분만 추출하고 싶을 때가 있다. 아래의 예시를 살펴보자. https://docs.python.org/3.5/search.html?q=urllib&check_keywords=yes 요녀석은 대략 4가지 부분으로 이루어져 있는데, scheme: https netloc: docs.python.org path: /3.5/search.html query: q=urllib&check_keywords=yes 라고 부분별 명칭이 있다. 이걸 re 를 써서 정규식으로 추출하려고 하면 머리가 아파질텐데, 다행히 built-in 라이브러리 중에 이걸 자동으로 해주는 녀석이 있다. from urllib.parse import urlparse url = 'https://docs.py..

Article Thumbnail