02 HTML을 파싱하기 위해 BeatifulSoup 클레스를 가져옵니다.
03 데이터를 가져오기위해 requests 모듈을 가져옵니다.
04 데이터가 있는 URL을 지정합니다.
05 requsts.get(URL)을 통해 데이터를 가져옵니다.
requests.get(URL).text 로 가져온 데이터 중 필요 데이터만 꺼내옵니다.
06 BeatifulSoup에 받아온 데이터를 넣고 html.parser 일을 시킵니다.
위 코드를 실행하면 페이지의 모든 텍스트가 출력됩니다.
우리가 필요한 데이터는 class nm, temp, rain 에 있습니다.
이제 필요한 데이터를 하나식 가져오겠습니다.
미세먼지 또 한 위와 같은 과정을 통해 tag, class, id를 찾아 접근하는 방법을 사용하면 쉽게 구 할 수 있습니다.
미세먼지
# -*- coding: UTF-8 -*-
from bs4 import BeautifulSoup
import requests
URL = "https://weather.naver.com/air/airFcast.nhn" #미세먼지
html = requests.get(URL).text
soup = BeautifulSoup(html, 'html.parser')
airTable = soup.find_all("div", class_="list_air_inn")
for air in airTable:
today = air.find_all("li")
for data in today:
print(data.text)