All
-
파이썬을 활용한 엑셀 데이터 분석(1) - 막대그래프Develope/Python 2019. 6. 5. 16:22
import pandas as pd import xlwings as xw import matplotlib.pyplot as plt from matplotlib import font_manager, rc, style import numpy as np style.use('ggplot') def KBpriceindex_preprocessing(path, data_type): # path : KB 데이터 엑셀 파일의 디렉토리 (문자열) # data_type : '매매종합', '매매APT', '매매연립', '매매단독', '전세종합', '전세APT', '전세연립', '전세단독' 중 하나 # xlwings 모듈로 엑셀 읽기 wb = xw.Book(path) # sheet 선택 sheet = wb.sheets[data..
-
파이썬을 활용한 미니 웹 크롤러 분석(1)Develope/Python 2019. 5. 28. 00:30
from urllib.request import urlopen, urlparse from bs4 import BeautifulSoup import re import datetime import random pages = set() random.seed(datetime.datetime.now()) # 페이지에서 발견된 내부 링크를 모두 목록으로 만듭니다. def getInternalLinks(bs, includeUrl): includeUrl = '{}://{}'.format(urlparse(includeUrl).scheme, urlparse(includeUrl).netloc) internalLinks = [] # /로 시작하는 링크를 모두 찾습니다. for link in bs.findAll('a', hre..
-
파이썬을 활용한 엑셀 데이터 정제 - KB 가격지수 데이터 기반Develope/Python 2019. 5. 24. 11:36
import pandas as pd import xlwings as xw def KBpriceindex_preprocessing(path, data_type): # path : KB 데이터 엑셀 파일의 디렉토리 (문자열) # data_type : '매매종합', '매매APT', '매매연립', '매매단독', '전세종합', '전세APT', '전세연립', '전세단독' 중 하나 # xlwings 모듈로 엑셀 읽기 wb = xw.Book(path) # sheet 선택 sheet = wb.sheets[data_type] # 시트 행의 개수 계산 row_num = sheet.range(1,1).end('down').end('down').end('down').row # 읽어올 데이터 범위 설정(엑셀 열+행) data_r..
-
파이썬을 활용한 URL 인코딩/디코딩 예제Develope/Python 2019. 4. 18. 10:15
버프 프록시를 이용하여 URL 디코딩 시 한글일 경우 정확히 보기 힘든 경우가 있다. 따라서, 파이썬 urllib 모듈을 이용하여 아래와 같이 URL 인코딩/디코딩 할 수 있다. Python 3.7.3 테스트 >>> from urllib import parse >>> parse.quote('한글') // URL 인코딩 '%ED%95%9C%EA%B8%80' >>> parse.unquote('(%EA%B5%AC)%EA%B0%80%EC%9E%85%EC%9E%90%EB%B2%88%ED%98%B8') // URL 디코딩 '(구)가입자번호' >>> 내부망 진단 시 이용이 필요하다.