본문 바로가기

파이썬12

파이썬으로 이미지 크롤링하기(urlopen()으로 이미지 파일 다운로드 방법) AI(머신러닝, 딥러닝)의 기초 이미지 크롤링 하는 방법이다.파이썬으로 크롤링(스크래핑) 하는 방법이고 urllib를 사용하면 코드가 정말 간단하다. urllib.request 라이브러리를 import하고 url과 저장경로를 지정하고 다운로드 하면 된다. 1. urlretrieve() 사용import urllib.requesturl = "이미지주소..........."savename = "downloadImg.png"urllib.request.urlretrieve(url, savename)print("saved") 위의 코드는 이미지를 바로 다운로드하는 방법이다. 2. urlopen() 사용import urllib.request url = "이미지주소..........."savename = "downlo.. 2018. 6. 10.
파이썬 2.x 버전과 3.x 버전 차이 수 많은 파이썬 프로그램들이 아직 2.x 버전으로 남아있다. 그런데 버전이 3으로 오르면서 2.x 버전들과 하위 호환성을 전혀 유지않고 있다.따라서 아직 2.x을 쓰는 사람들일지라도 이제는 3버전을 이제라도 써야한다.필자는 요즘 핫한 AI, 머신러닝, 딥러닝 쪽을 공부하려고 파이썬을 하는 것이 아니라 sql server 2017부터 파이썬을 코드에 섞어쓸 수 있기 때문에 파이썬을 공부하려고 했다. ms data open day에 참석하고 앗 이제는 mssql에서도 파이썬을 쓸 수 있고 이것이 대세가 될 것이다!라고 생각해서 바로 책을 사놨지만 제대로 공부를 하지는 못하고 있는 것이 아무래도 업무 시에 파이썬을 직접적으로 사용을 안하니까 공부를 안하게 된다. 필자는 현재 sql server 2016을 사용.. 2018. 4. 22.
파이썬 정규 표현식(re) 모듈 파이썬은 정규표현식을 위해서 re 모듈에 문자열 검색, 치환, 분리 등의 기능을 갖고 있다. 정규표현식에서 문자나 패턴을 나타내기 위한 특수문자들 특수문자 의미. 개행문자를 제외한 문자 1개를 나타냄. re.DOTALL이 설정돼있으면 개행도 포함^ 문자열의 시작. re.MULTILINE이 설정돼있으면 매 라인마다 매치됨$ 문자열의 종료. re.MULTILINE이 설정돼있으면 매 라인마다 매치됨[] 문자열의 집합을 나타냄. 가령 [abcd]면 a b c d 중에 한 문자와 매치되고 [a-d]로 쓸 수도 있다. [^a]는 a를 제외한 모든 문자이다| a|b. a 또는 b() 괄호 안의 정규식을 그룹으로 만듦. 괄호 자체를 매칭시킬려면 '\(', '\)'나 '[(]', '[)]'로 나타내면 됨* 문자가 0번 .. 2018. 3. 21.
파이썬 문자열 메서드 종류 파이썬 문자열 메서드 종류sql server 최근 버전부터 파이썬을 지원하기 시작했다.쿼리로 구현하기 힘든 것들은 파이썬 코드로 구현하면 훨씬 편할 것이다. 1. capitalize()첫문자를 대문자로, 나머지 문자는 소문자로 바꿔줌>>> "PYTHON".capitalize()'Python' 2.count(keyword,[start,[end]]keyword가 몇번 포함되어있는지 알려줌. start와 end를 지정해서 검색범위 지정가능.2. >>> "ppython".count('p')2 3.encode([encodeing,[errors]])파이썬3에서 str 클래스는 유니코드. encode를 통해 인코딩이 있는 바이너리로 변환가능.>>> "가나다".encode('cp949')b'\xb0\xa1\xb3\xa.. 2018. 3. 21.