Python basic
  • Python 기초 수업
  • Python 설치
  • Python의 기본
    • Python 시작하기
    • 변수(Variable)
    • 산술 연산자
    • 문자열(String) 출력
    • 문장(Statement)
  • 자료형
    • 정수형(Integer)
    • 실수형(Float)
    • 부울형(Bool)
    • 복소수형(Complex)
    • 문자열형(String)
  • 조건문
  • 자료구조
    • List
    • Set
    • 튜플(Tuple)
    • 딕셔너리(Dictionary)
  • 반복문
  • 문제 타임
  • 함수(Function)
    • 기본형 함수
    • 매개변수(Parameter)와 반환값(Return Value)
    • 가변매개변수 함수
    • 함수 설명 표시
    • 변수의 범위
  • 모듈(Module)
    • 모듈의 이용
    • __name__ 그리고 '__main__'
  • 예외처리(Exception Handling)
    • try, except, else, finally
  • 클래스(Class)
    • Class 심화
  • PyQt
    • PyQt 설치
    • PyQt Widget
      • QWidget
      • QLabel
      • QLineEdit
      • QTextEdit
      • QPushButton
      • QCheckBox
      • Application Make
        • Widget의 배치 #1
        • Widget의 배치 #2
        • 숫자 맞추기 게임
        • 야구게임
  • OPEN API(공공데이터 포탈)
    • 공공데이터 사용하기
  • 크롤링 (Crawling)
    • Crawling Library 설치
    • 날씨, 미세먼지 농도
  • SQLlite
    • DB의 작성
  • Dic 참고
  • 함수 참고 코드
  • Widget 배치 시작 코드
  • 야구게임
Powered by GitBook
On this page

크롤링 (Crawling)

웹 페이지 내용을 가져옵시다.

Previous공공데이터 사용하기NextCrawling Library 설치

Last updated 6 years ago

우리가 브라우저에서 보는 웹 페이지는 이쁘게 정렬되어있습니다. 이들의 기본은 텍스트입니다. HTML, CSS, Javascript 로 구성된 텍스트는 Chrome, Internet Explorer, Safari, FireFox 등의 브라우저를 통해 GUI형태로 변경됩니다. 크롤링은 HTML, CSS, Javascript로 구성된 텍스트에서 원하는 데이터를 찾고 이를 가져오는 방법입니다.

HTML 문법을 알고 있다면 조금 더 쉽게 사용할 수 있지만 모르셔도 여러 페이지를 이용하다보면 원활히 사용할 수 있을거라 생각합니다.

네이버 화면으로 추가 설명을 하겠습니다.

코드의 Tag, class, id 를 이용해 원하는 데이터에 접근하게 됩니다. Html Tag, Html Class, Html Id <<< 구글 검색 후 어떤 애들인지 확인 해보세요.

이런 코드가 브라우저를 통해 우리가 보는 화면이 됩니다.
왼쪽 위의 메뉴 코드