본문 바로가기

Programming147

Windows 10에 Docker(도커) 설치하기 도커는 간단하게 가상환경을 구축하는 컨테이너라고 보시면 됩니다. 윈도우만 하는 분들에게는 생소한 개념인데 보통 윈도우에서는 vm을 올려서 그 안에 리눅스를 설치하거나 그랬습니다. 하지만 도커라는게 나왔고 개발환경을 구축하기에 엄청 빠르고 편하네요. 그럼 도커를 설치해보겠습니다. 현재 PC의 운영체제는 Windows 7 Home 입니다. 먼저 가상화 모드가 가능하도록 옵션을 on 시켜줍니다. 저같은 경우는 작업 관리자에서 확인해보니 켜져있네요. 가상화 옵션이 켜져있으면 이제 도커를 설치할 것인데요 Windows 10 Pro 버전 이하까지는 도커 툴박스를 설치해야한다고 하네요. > 도커 툴박스 다운로드 링크 바로가기 2018. 6. 20.
셀레니움 네이버 메일 제목 크롤링하기 파이썬 셀레니움(selenium)으로 네이버 메일 제목만 읽어오는 방법이다.특히 웹게임같은 경우는 셀레니움으로 매크로를 만들어본적이 있는데 거의 복붙 수준이었지만이 참에 제대로 이해하고 알아놔야겠다.셀레니움, 크롤링 등 공부하면 응용할 것이 참 많은 것 같다. from selenium import webdriver url= "https://nid.naver.com/nidlogin.login"#phantomjs 드라이버 실행browser = webdriver.PhantomJS()browser.implicitly_wait(3) #url 읽어들이고 로그인browser.get(url)element_id = browser.find_element_by_id("id") # id 텍스트 입력 상자element_id.c.. 2018. 6. 16.
HTTP 통신, 쿠키, 세션 이란? HTTP 프로토콜이란?웹 브라우저와 웹 서버는 HTTP 프로토콜을 사용하여 통신한다.HTTP통신은 브라우저에서 서버로 요청(request)하고, 서버에서 브라우저로 응답(response)할 때의 규칙이라고 보면 된다. 예를 들어서 웹 브라우저에서 구글 메인 url을 치면 웹 브라우저는 그 주소의 웹 서버를 찾는다.그리고 웹 서버가 발견되면 index.html이라는 파일을 보고 보겠다는 요청을 보내면 구글에서는 index.html의 내용을 응답해준다. 즉 HTTP 통신은 요청과 응답이고 특이 사항이 있다면 stateless 통신이다.서버에서 클라이언트의 상태를 저장하고 있지 않기 때문에 같은 요청을 받아도 같은 응답을 주는 것이다. 쿠키웹 브라우저에 쿠키라는 구조가 추가되고 일시적으로 상태를 저장할 수 있.. 2018. 6. 11.
파이썬 BeautifulSoup으로 간단하게 html 분석하는 방법 스크랩핑이란 웹에서 데이터를 추출하고 원하는 정보를 추출하는 것이다.스크랩핑을 잘하면 데이터를 잘 수집할 수 있다. 그 중에서 BeautifulSoup이라는 라이브러리를 이용하면 HTML과 XML에서 간단하게 정보를 추출할 수 있다.최근 스크랩핑 라이브러리에는 다운로드부터 HTML 분석까지 되는 경우가 많은데 BeautifulSoup는 자체 다운로드 기능이 없다. 먼저 cmd 창으로 C:\WINDOWS\system32>pip install beautifulsoup4 를 설치했다. 그리고 파이썬 코드로 간단하게 html형태의 변수를 만들었다. from bs4 import BeautifulSoup html = """ h1입니다 첫번째 p태그 두번째 p태그 세번째 p태그"""soup = BeautifulSou.. 2018. 6. 11.