본문 바로가기

Content

KT 휴대폰 위치데이터로 본 현지인과 외지인

2020년 5월 11일 오후 2시의 명동에는 누가 얼만큼 있을까? 그 동네에 집이나 직장이 있는 20대는 얼마나 있을까? 외지에서 온 30대는 몇 명이나 있을까?

 

우리가 들고 다니는 휴대폰은 기지국과 신호를 주고 받으며 대략적인 위치를 남긴다. 그래서 GPS처럼 정밀하지는 않더라도 몇십미터나 몇백미터 정도의 오차로 대략적인 위치를 알 수 있다. 그래서 충분히 넓은 범위로, 예를 들어 전국을 1km x 1km의 격자로 나누어 사람들을 세어본다면 꽤 높은 정확도로 언제 어디에 몇 명이 있는지 알 수 있다.

 

데이터는 세분화할 수록 대체로 활용가치가 높아진다. "언제 어디에 몇명이 있는가?"라는 물음에 한 가지를 더 붙여보자. "언제 어디에 어떤 연령대의 사람들이 몇명 있는가?" 서울로 보자면 홍대 쪽은 20대가 많고, 청량리나 회기역 쪽은 60대가 많다. 젊은 사람들이 많은 이유는 대학이나 직장 때문일 수 있다. 고령층이 많은 곳들은 대체로 건물들도 노후화되고 거주비용도 적은 곳이 많다. 뭐, 꼭 그렇지는 않다. 어쨌든 연령 정보를 붙여 봄으로써 도시 안의 각기 다른 상황들이 파악되기 시작한다.

 

 

이제 마지막으로 한 가지를 더 붙여보자. 전국을 250개 시군구로 구분한 후, 예를 들어 송파구에 집이나 직장이 있으면 그 사람은 송파구에 정기적으로 나타난다. 밤에 잠을 자거나. 이 사람을 '현지인'으로 정의해보자. 그리고 그렇지 않은 사람들을 외지인으로 정의하자. 물론 집이나 직장 역시 알고 있지 못하므로 정확하지는 않을테지만, 낮 시간에 얼마나 많이 머무르는지, 밤 시간에 얼마나 많이 머무르는지 집계해보면 꽤 높은 확률로 집과 직장(혹은 학교)를 추정해볼 수 있다.

그렇게 250개 시군구에 대해 현지인을 정의할 수 있다. 어떤 사람이 집은 영등포구에 있고 직장은 종로구에 있다면, 이 사람은 2개 시군구에서 현지인이 된다. 그 밖에 248개 시군구에 갈 때는 외지인으로 분류된다. 물론 거주지가 있는 시군구에서만 현지인으로 분류할 수도 있다. '무엇이 옳은가?'라는 질문은 적절하지 않고, 단지 분석 목적에 따라 "어떻게 분류하는 것이 이번 경우에는 유용한가?" 라는 질문이 적절한 듯 싶다.

 

 

그리는 방식의 정의

 

 

그럼 다시 처음에 던졌던 질문으로 돌아가보자.

2020년 5월 11일 오후 2시의 명동에는 누가 얼만큼 있을까? 일단 그림을 보자.

 

지도에는 격자가 보이지 않지만, 모든 곳을 1km 격자로 나누고 현지/외지인, 그리고 아래 그림처럼 연령별로 구분하여 추정된 사람 수 만큼 막대를 올렸다.

격자는 (좌하단)외지인 10대부터 (우상단)현지인 70대까지가 한 묶음이 된다.

 

그리하여, 4호선 명동역을 한가운데 품고 있는 1km x 1km 격자를 보면 현지인 30대가 13,526명으로 가장 많은데, 현지인이나 외지인이나 30대가 가장 많다. 다른 지역과 비교했을 때 외지인, 그러니까 집이나 직장이 이 격자에 없는 사람들이 2020년 5월 11일 월요일 14시에는 꽤 많다.

 

여기에 보이는 인구는 흔히 말하는 '유동인구'와는 개념이 약간 다르다. 유동인구가 보통 거리에서 보행하는 사람들을 가리키는데 반해, 여기에서 집계한 인구는 건물에 있거나 거리에서 움직이거나 상관없이 신호가 잡힌 모든 사람들을 모두 포함한 수치다. KT는 이러한 인구를 '생활인구'라고 부르고 SKT는 '서비스인구'라고 부르는데, 여기서는 KT의 데이터를 시각화했다. 각각의 시장점유율이 다르고, 둘 다 모두 전수데이터가 아니지만 전수를 추정하기에 통계적으로 충분한 정도이므로 양 사 모두 각자 가진 데이터를 전수화시켜서 데이터를 만든다. 

 

그럼 정말로 명동 격자에 있는 30대가 13,526명인가? 물론 좀 차이는 나겠지. 그런데 사람 수 만큼 아주 정확히 수저와 밥그릇을 준비해야 하는 사람이 아니라면 많고 적음이 변하는 정도, 혹은 다른 지역과 비교해서 그 차이를 보는 것 만으로도 할 수 있는 일들이 충분히 많다.

정확한 통계치 추정이 목적인 사람들에게는 지역별로 얼마만큼 보정하는가, 시간대에 따라서 다르게 보정치를 적용해야 하는가의 문제가 중요할 수도 있지만, 사실 내 관심이 그것은 아닌지라, 데이터의 한계를 명확하게 인식하고 그것을 무리없이 적용할 수 있는 분야를 찾는 것에 더 시간과 노력을 쏟아야 한다고 생각하는 편이다.

 

 

딱딱한 이야기는 이 정도로 해두고, 이제 전국을 누비며 데이터를 탐색해보자.

 

 

 

토요일 저녁, 서울 곳곳의 현지인과 외지인

 

2020년 5월은 코로나가 터진지 두 달이 약간 넘은 시기다. 석가탄신일인 4월 30일부터 5월 5일까지 징검다리 연휴였던 사람들이 꽤 있었고, 그래서 코로나 시기임에도 불구하고 꽤 많은 사람들이 돌아다닌 때이기도 하다. 여기서는 코로나라는 특수성보다는 그냥 한 시점을 보고 할 수 있는 이야기들을 해보겠다.

 

서울에서 시작했으니 서울부터 볼까.

 

홍대는 젊다. 20대가 가장 많다.  평일 낮에도 20대가 많은데, 외지인이 가장 많아지는건 토요일 저녁이다.

 

토요일 저녁 7시에는 외지인이 거의 절반이 되는 것 같다. 외지인은 특히 20대에 많이 집중되어 있다.

 

같은 시간의 강남으로 가보자.

 

강남역 주변도 20대가 많다. 이 데이터는 동일크기의 격자 기준으로 만들었으므로 막대의 높이가 곧 '밀도'가 된다.

2020년 5월 9일 오후 7시에는 강남역 사거리 격자에 20대의 집중도가 가장 높았다. 동쪽으로 격자 두개를 옮겨가보면 현지인 10대와 40대가 가장 많은 격자가 보인다. 바닥에 '강남구'라고 보일락말락한 곳들이다. 

 

웬 강남 한복판에 10대가 현지인 10대가 이리도 많은지, 혹은 외지인도 무슨 일인데 10대가 가장 많을까 하니, 여기는 대치동이다. 학원에 있겠지. 10대와 40대는 한 세대 차이이므로 40대 부모가 10대 자식을 데리고 사는 것 같다.

 

 

이번에는 강북으로.

같은 시간에  종로구와 중구를 보면 외지인이 많지만 집중도는 강남역에 미치지 못한다.

약간 동쪽을 보면 30, 40, 50대가 많아지는 곳들이 보인다.  을지로와 동대문 정도다.

 

약간 겹친채로 조금 동쪽으로 가보자.

현지인 20대가 8305명으로 불쑥 올라온 격자는 한양대를 포함하는 격자다. 

'청량리역'글자 바로 밑에 현지인 20대 9326명 막대가 올라온 곳은 경희대를 포함하는 격자다. 젊은 인구가 많고, 20대 막대들이 불쑥불쑥 튀어 올라오는 현상은 대학이 많은 서울만이 누리는 '특권'이기도 하다.

 

 

 

 

새벽 4시의 거주 인구, 서울

 

그럼 이제 평일 새벽 4시로 가보자.

새벽 4시는 사람이 가장... 아니, 거주 인구에 가까운 분포를 볼 수 있는 시간이다. 파란색으로 표현된 외지인들이 거의 안보이고 대부분 현지인만 보인다.

 

목동은 10대와 40대가 많다.

 

 

 

 

홍대와 신촌 이대쪽은 20대가 월등히 많다. 이쪽에는 이 시간에도 외지인들이 다른 곳보다 다소 많다.

 

 

 

 

송파구쪽은 30대 중심이다. 바닥의 지도가 그리 친절하지는 않지만 방이역 근처는 50대가 가장 많다. 바닥 글씨 '송파구'의 '구' 글자 부근이다.

 

 

 

 

도봉구나 노원구쪽으로 가면 연령대가 다소 올라간다. 20대~60대가 비슷한데 굳이 비교하자면 50대가 많은 곳들이 좀 더 많이 보인다. 단, 중계동 학원가쪽은 다소 예외다. 역시 10대+40대의 구성이다.

 

 

 

 

새벽 4시의 거주 인구, 수도권

 

이제 서울 주변으로 가보자.

 

구리. 30~50대 중심

 

 

 

하남 일부. 미사강변쪽은 30-40대 중심. 조금 더 오래된 곳은 50대 중심

 

 

 

 

판교 분당. 30대-40대 중심인데 곳곳에 10대+40대의 구성도 보인다.

 

 

1기 신도시 중심의 안양. 40대~50대 중심

 

 

 

 

부천. 20대~50대가 지역에 따라 조금씩 차이난다.

 

 

 

일산. 40대~50대 중심인데, 10대+40대의 구성도 한 곳 보인다.

 

 

 

 

김포. 신도시 지역이라 그런지 10대+40대의 구성이 보인다.

 

 

관심 있는 사람들은 알겠지만, 대학이 많은 서울에는 20대가 많은데, 결혼을 하고 가정을 이루면서 경기도로 많이 간다. 그런데 직장은 여전히 서울에 많다. 그래서 낮 시간에는 서울의 인구가 백만명쯤 더 많아진다. 이런 흐름은 서울시에서 개방하는 공공데이터인 '생활인구'데이터에서도 직접 확인해볼 수 있다. KT의 데이터다.

 

 

 

 

 

새벽 4시의 거주 인구, 수도권 아닌 지역

 

이제 수도권을 벗어나보자.

 

춘천. 의외로 20대가 많다?

대학도 있지만 군부대도 있다. 성별로 볼 수 있다면 20대가 어떤 사람들인지 좀 더 확실히 보일 것 같다.

그래도 춘천은 젊은편이다.

 

 

 

안동. 그래도 지방 도시의 도심지역에는 10대와 40대 인구 구성이 많다. 학교는 있으니까.

다만,  수도권에 비해 20대는 현저히 적어진다.

 

 

 

 

 

주말과 주중의 거제도 산업단지

 

거제시. 삼성 중공업 근처다.

여기는 산업도시답게 주력 일꾼인 40대와 50대가 많다.

 

 

 

그런데, 계속 한 시점의 새벽4시 데이터만 보다보니 문득, 주민등록인구를 보는것과 크게 다를 것 같지 않다는 생각이 들었다. 왜 이 생각을 이제서야 한걸까.

그럼 휴대폰 인구만의 특징을 좀 찾아보겠다.

 

같은 장소의 이틀 전으로 돌아가보자. 

거제시의 일요일 새벽. 바닥에 거제시 글자가 있는 곳에서 정북방향으로 올라가보면 인구들이 좀 올라온 격자가 보인다.

화요일 새벽과 비교해보자. 20대부터 50대까지 인구가 각각 500명정도씩 적다. 1km 격자에서 2천명 이상이 줄어들었다.

놀러갔을까? 일부는 그럴 수도 있지만, 아마도 우리가 아는 상식에 따르면 주말 부부들일 수도 있다. 서울이나 다른 대도시에 갔을 것 같다.

휴대폰 데이터를 이용하면 이 사람들이, 그러니까 거제시 삼성 중공업 근처에 직장이 있는 사람들이 주말에 어디로 갔는지도 물론 집계해볼 수 있지만, 여기서 소개하는 이 데이터로는 볼 수 없다. 눈에 띄게 줄어들었다는 것 정도만 확인할 수 있다.

 

 

 

 

 

 

 

연휴의 관광객

 

여름이 다가온다.

시원한 바다로 가보자.

 

강릉.

 

주민등록인구와 휴대폰인구와의 차이점 중 하나는, 낮 시간의 변하는 인구를 볼 수 있다는 점이다. 

2020년 5월 2일. 연휴 한가운데의 토요일 낮에는 안목해변 근처에 외지인이 많다. 바닷가가 그렇듯 20대가 가장 많고, 현지인보다도 외지인이 더 많다. 

 

 

 

저녁 8시로 가보자.

안목해변에는 사람들이 줄고 경포호 근처가 조금 더 많아진다.

 

 

 

다음날 새벽 4시.

안목해변에는 사람들이 거의 없다. 현지인들이 어디에선가 조금 더 돌아왔다.

멀리 경포호쪽에는 숙소가 많기 때문에 외지인 인구가 가장 많이 늘어났다.

 

 

 

 

 

평창리조트는 낮에는 사람이 별로 안보인다. 겨울이 아니라 눈도 안쌓였을테고 코로나로 인해 수영장도 못갈테니까.

 

 

 

밤에는 사람들이 와서 잔다. 새벽 4시가 대략 피크다.

강릉 해변가에는 20대가 많았는데, 여기에는 30,40대가 많다. 연령대별로 선호하는 관광지가 다른 것 같다.

 

 

 

 

 

젊은 현지인과 나이 많은 외지인이 만나는 곳은?

 

전주로 가보자.

한옥마을과 시네마타운이 있는 중앙동까지 외지인이 많다. 시네마타운쪽은 10대, 20대 현지인외지인이 많고,  한옥마을쪽은 20~40대가 많다.

아니 그런데 한옥마을도 아닌 영화제 시기도 아닌 시네마타운에 무슨 외지인이 저렇게 많을까? 경험에 의하면 저 지역은  대부분 로컬 중심이다.

사실 이유는 데이터를 어떻게 정의하고 만들었는가에 있다. 앞에서 살짝 언급했는데, 이 데이터에서의 외지인 기준은 시군구 기준이다. 전주시 완산구 기준으로 외지인이므로 덕진구의 10대와 20대가 저 곳에 외지인으로 잡혔을 가능성이 크다. 10대는 대부분 도시 멀리 가지 않기 때문에 40대와 함께하지 않는 한 거의 로컬이다. 혹은 완주같은 주변 지역에서 온 근거리 방문객일 가능성이 크다.  물론 데이터를 다르게 만들면 어디서 왔는지 알아낼 수는 있지만, 이 데이터에서는 더 이상 알 수 없다.

 

그럼 다시 한옥마을 중심에 대해 말해보자.

외지인은 20대, 30대 중심인데, 현지인은 그렇지 않다. 50,60대 중심이다. 여기서 다 보여줄 수는 없지만, 전주나 군산처럼 도심 관광 자원을 가진 대부분의 곳들이 '젊은 외지인과 나이 많은 현지인이 만나는 곳'이다. 젊은 현지인은 좀처럼 방문하지 않는 곳. 관광자원 위주의 도시재생을 거쳐갔지만 안타깝게도 현지인의 지속가능성은 잘 안보인다.

 

 

 

 

재작년에 약간 이슈가 되었던 목포역 부근

연휴의 한가운데에도 외지인이 별로 안보인다. 사실 코로나의 영향이 크다. 2019년 5월 연휴에는 이 정도는 아니었기 때이다. 파란색 외지인은 거의 보이지 않고 40대 이상의 현지인만 있다. 젊은 현지인들은 동쪽의 하당지구에 있다. 심지어 외지인도 거기에 더 많다. 물론 여기의 외지인은 바로 옆 무안군 남악신도시나 바다건너 남쪽의 영암에서 왔을 가능성도 크다.

 

 

 

군산

 

원도심 부근은 60대와 70대 중심이고 외지인이 거의 안보인다. 현지인 10대가 불쑥 올라온 곳은 롯데마트를 포함한 수송동 블록이다.

 

 

 

 

 

젊은 사람들은 도시 밖의 신도시로

 

다시 전주로 가보자.

거주인구에 가까운 평일 새벽을 보면,

한옥 마을 근처에는 사람도 별로 없고 60대 중심이다.

전라북도청 근처가 현지인 중심지인듯 하고, 여기서도 젊은 사람들, 그러니까 10대+40대의 조합은 새로 만든 아파트로 이사갔다. 서쪽의 전주완주혁신도시와 북쪽의 에코시티가 바로 그곳들이다. 도시 외곽에 신도시를 새로 만들다보니 대출 상환 능력이 있는 젊은 사람들은 새 아파트로 가고 상대적으로 원도심은 나이들어간다.

 

 

 

이런 특성은 목포에서도 뚜렷하다.

90년대에 조성한 하당지구에 10대와 40,50대가 보이고 2000년대 말에 조성한 전라남도청 근처가 조금 더 젊다. 목포역 근처의 원도심은 남겨진 지역이 될 수 밖에 없다.

 

 

 

 

내포 신도시는 베드타운

 

충남도청이 이전한 내포신도시와 홍성

화면에 가깝게 보이는 곳이 홍성이고 충남도청은 표시를 해 놓았다. 내포신도시가 만들어지고 홍성에서 10년동안 꽤 많은 사람들이 이주해갔는데, 그래서 홍성에는 젊은 인구가 별로 보이지 않고 내포신도시에는 10대+30,40대의 조합이 보인다.

 

 

내포신도시의 문제점이라면, 아직까지 베드타운이라는 점이다. 

 

밤에는 30-40대 인구가 각각 4000명 이상 있는데, 

 

 

 

 

낮에는 훅 줄어든다. 일하러 다른 도시로 간다.

10대는 학교에 가거나, 코로나로 등교를 안했을테니 지역을 벗어나지 않는다.

 

 

 

마치며

 

어찌어찌하다보니 2년 넘게 KT 휴대폰 인구를 많이 다루고 있다. 여기서 그려본 시간별 지역별 연령별 인구변화로 도시문제의 많은 부분들을 설명할 수 있다. 지역간 이동을 보면 원인이 좀 더 구체적으로 드러나고, 해결의 실마리도 어렴풋이 보이기도 한다. 물론 그 지역 사람들이라면 대략적으로는 알고 있겠지만, 데이터는 좀 더 구체적인 근거를 만들어줄 수 있다.

 

통신사나 금융사에서는 이런 인구나 신용카드 데이터들을 상권 분석, 관광 등 수익창출을 목적으로 상품을 만들어 많이 판매하지만, 데이터를 좀 뜯어보다보면 사람의 흐름은 도시의 문제들을 뜯어볼 수 있는 중요한 열쇠라는 점을 깨닫게 된다.

 

그런데 통신 데이터는 개인 수준에서 접근하기에는 고가이기도 하고, 덩치도 제법 크다보니 서울같은 경우 생활인구 데이터가 공개되고 있긴 하지만, 다양한 속성들을 잘 녹여내서 적용한 연구도 많이 찾아보기는 힘들다. 정체도 잘 모르는데 섣불리 구매예산을 잡기도 어려울 것 같다는 생각이 든다.

잘 몰랐을 때는 데이터는 쌓여있고 그냥 복사해주면 되는거 아닌가, 왜 그렇게 비쌀까 하고 생각했는데 막상 직접 만지는 입장이 되다 보니 결국 다 사람의 일이란걸 깨닫는다. 꼬박 붙어 앉아서 뽑아보고 보정해보고, 어디나 현실 데이터는 상당히 지저분하기 마련이라 그걸 쓸 수 있게 만드는 작업은 결국 다 사람의 몫이다.

 

다른 목적으로 만들고 그렸던 데이터들인데, 오늘은 KT측의 동의를 얻어 몇 개 올려보았다.

이런 데이터를 이용한 연구, 혹은 상업적 활용에 관심이 있는 분들은 이메일(sbkim427@gmail.com)로 연락주셔도 좋다.