안녕하세요. 게임개발자 놀이터 입니다.
웹크롤링에 대해서 포스팅 하고자 합니다
웹 크롤러
우리가 어떤 정보를 웹 브라우저로만 보는 것이 아니라, 그 정보 들을 내가 이용하기 편한 방식(XML, JSON) 등으로 DB에 쌓아두고 싶을 때가 있습니다.
웹 데이터를 원하는 방식으로 가공하여 저장하는 기능을 웹크롤링 한다고 합니다.
웹에서 정보 가져오기 - 1
php 의 requests 라는 라이브러리를 이용해서 웹의 정보를 가져옵니다.
설치하기 위해선 pip를 이용합니다.
[Window+R] + cmd 를 이용해 명령 프롬프트를 엽니다.
사용자 PC에 php가 설치되어 있는 폴더로 이동합니다.
폴더 안에 Scripts 폴더까지 이동합니다.
저의 경우는 C:\Python27\Scripts 입니다.
그후, pip install requests를 입력합니다. 아래 화면 처럼 뜬다면 성공입니다.
(pip 업그레이드 문구는 무시해주세요 )
제대로 설치 되었는지 확인을 위해 ATOM 에디터로 넘어와 임포트 해봅니다.
ATOM Python 모듈 설정
ATOM에서 pip로 설치한 모듈을 사용하려면 추가로 설정해줘야 합니다.
우리는 '파이썬 프로그래밍 -01 ATOM 설치 (Python)' 에서 ATOM 플러그인으로 'script'를 설치 했습니다.
모듈을 내장하여 빌드 하기 위해선 'script'플러그인은 조금 수정 해줘야 합니다.
우선 [컨트롤 + ,]을 눌러 settings 창을 엽니다.
그후, 좌측 Packages 메뉴를 누른후 Installed Packages 에서 'script'를 검색한 후 Settings를 눌러 줍니다.
그러면 'script'의 설정 창이 열리게 되는데, [View Code]를 눌러 줍니다.
ViewCode를 누르면 아톰창이 새로 열리게 됩니다.
그후 왼쪽 프로젝트 목록에서
[ script / lib / grammars / python.coffee ]를 열어 줍니다.
python 으로 되어있는 경로를 각각 파이썬 경로로 수정해줍니다.
저의 경우는 [ C:/Python27/python ] 입니다.
이후 창을 닫은 후, 메인 소스에 requests를 임포트 하는 코드를 작성 한 후 빌드 해보면
아무런 에러 없이 완료 된다면 성공입니다.
감사합니다.
이후 내용은 다음 포스팅에서 진행 하겠습니다.
'프로그래밍 > Language' 카테고리의 다른 글
[Python] 파이썬 프로그래밍 - 03 웹크롤링 / Request 및 BeautifulSoup 활용 [Python Web Crewling] (1) | 2019.10.04 |
---|---|
[Python] UnicodeEncodeError: 'cp949' 에러 (1) | 2019.10.04 |
[Python] 파이썬 프로그래밍 -01 ATOM 설치 (Python) (0) | 2019.10.04 |
[C++] 이벤트 콜백 함수(Button)만들기! (1) | 2017.04.06 |
[C언어] 변수 선언시 저장 공간에 대하여 (0) | 2017.03.29 |