Hyojin :-)

Web Crawling: 1.개발환경 설정

Apr 4, 2020

     ※ 해당 포스트는 “자바스크립트와 Node.js를 이용한 웹 크롤링 테크닉” 도서를 기반으로 하고 있습니다.
         문제가 될 경우 삭제하도록 하겠습니다.
     ※ 글 내용 중에 미흡한 부분이 있을 수 있습니다. ^^ 댓글로 남겨주세요!

yes24에서 열정적으로 책을 골라 구매한 뒤… 책장에 고이 모셔두었던 “자바스크립트와 Node.js를 이용한 웹 크롤링 테크닉(쿠지라 히코우즈쿠에 지음/이동규 옮김)”를 기초로 해서 웹 크롤링을 통한 데이터 수집-저장-분석에 대한 공부를 이어나가보려한다.

우선 본격적으로 프로젝트를 진행하기 전에 “개발환경 설정”부터 진행해보자!

다음의 링크를 활용하여 컴퓨터의 운영체제에 맞는 VirtualBox와 Vagrant를 다운로드한다.

가상머신 생성을 위해 vagrant init 명령어를 사용한다. CentOS 설치를 위해 생성된 Vagrantfile에 아래와 같이 코드를 수정한다.

#config.vm.box = "base" 주석처리
config.vm.box = "puphpet/centos65-x64" #추가

다음 포스트(Node.js 설치방법)에서 친절한 설명과 함께 다루고 있다.

다음 글에서는 본격적으로 Node.js를 활용한 웹 데이터 수집을 진행할 것이다.