본문 바로가기

Programming/AI17

아나콘다에 scikit learn + pandas 기본 구성 먼저 머신러닝의 맛을 보기위해 scikit-learn을 구성하고 XOR 연산을 한번 진행해보도록 하겠습니다. docker run -i -t -v $HOME/ai:/ai mlearn:init /bin/bash로 들어가겠습니다 전에 설치하였던 이미지(아나콘다)를 실행해서 설치를 하는거구요. >> 아나콘다 설치 바로가기 2018. 6. 25.
도커에 우분투+파이썬3+beautifulsoup+PhantomJS + Selenium 환경 설치하기 파이썬으로 웹 데이터 크롤링을 위한 환경 세팅을 위해 웹페이지 없는 브라우저 PhantomJS와 Selenium 설치를 하겠습니다. 도커 설치는 기존 포스팅을 참조부탁드리며 이번 포스팅의 순서는 대략 다음과 같습니다. 1. 우분투 이미지 다운로드2. 파이썬3, 파이썬3-pip 설치3. 셀레니움 설치4. beautifulsoup4 설치5. PhantomJS 설치6. 도커 콘테이너 commit 먼저 도커를 실행하여 Docker pull ubuntu:16.04 버전을 내려받습니다. 내려받기를 완료하였으면 이제 방금 다운받은 이미지에 들어갑니다. $ docker run -it ubuntu:16.04 이제 apt-get update를 하여 업데이트를 해주고 파이썬3와 파이썬3-pip을 설치 하겠습니다. 먼저 ap.. 2018. 6. 24.
파이썬 BeautifulSoup4를 활용하여 css 추출하기 파이썬으로 크롤링을 할 때 BeautifulSoup4을 활용하면 아주 편합니다. BeautifulSoup4를 활용하면 html 소스를 분석하여 필요한 것만 뽑아낼 수 가 있는데요. 그 중에서 select와 select_one을 활용하여 태그를 추출해보겠습니다. 예제 코드는 다음과 같습니다. from bs4 import BeautifulSoup # 예제 HTMLhtml = """ h1 태그입니다 1번째 li 태그입니다 2번째 li 태그입니다 3번째 li 태그입니다 """# HTML 파싱soup = BeautifulSoup(html, 'html.parser')# select_one은 하나만 추출h1 = soup.select_one("div#meigen > h1").stringprint("h1 =", h1)#.. 2018. 6. 21.
도커에 파이썬 + Anaconda 환경 구축하기 가상화 기술에는 하이퍼바이저 기반과 컨테이너 기반이 있는데 도커는 컨테이너 기반입니다. 컨테이너의 개념에 대해서는 다른 포스팅에 자세히 설명해보도록 하겠습니다. 일단 저희는 환경 구축을 위해서 파이썬 + Anaconda 환경을 세팅하겠습니다. 다른 사람이 우분투에 아나콘다의 기본적인 패키지만 설치해놓은 미니콘다 이미지를 다운받아서 사용할 예정입니다. 도커에서 이미지를 가져오는 명령어는 pull 입니다. 그럼 다음처럼 docker pull continuumio/miniconda3으로 가져오도록 하겠습니다. 다운이 다 되고 이미지를 실행하겠습니다. docker run -i -t continuumio/miniconda3 /bin/bash를 입력하여 실행하도록 하겠습니다. 그럼 리눅스 환경이 되고 간단하게 파이.. 2018. 6. 21.