Function
2020. 4. 19.
국토교통부 실거래가 데이터 전처리
이 글에서는 국토교통부에서 공개중인 실거래가 데이터를 지도에 표시하기 위해 주로 좌표값을 연결하는 과정을 설명한다. 간단히 말해 '지오코딩'하는 과정 + 알파 정도가 되겠다. 형식적으로는 다음의 내용을 담고 있으며 실거래가 데이터를 예로 들어서 설명한다고 보면 된다. - 법정동 주소 형식을 PNU 코드로 바꾸기 - PNU 코드의 좌표값 얻기 - 현재 존재하지 않는 과거 주소의 좌표값 얻기 - 한 좌표점으로 겹치는 좌표값 처리하기 - 전월세 전환율 적용시켜 월세를 전세가로 만들기 이 데이터를 처리하기 위해서는 어떤 파이썬이든 R이든 자바든 파일 입출력과 문자열 처리 정도는 할 수 있어야 한다. 세세한 디테일은 설명하지 않으므로, 혹시 설명이 부족한 부분이 있다면 각자 익숙한 언어와 도구에서 검색하기를 권한..