공공데이터를 읽어주는 남과여 – 지도시리즈 1 : 서울 어린이집
1. 데이터의 추출과 가공
#. 사용 데이터와 출처
#. 데이터의 추출과 가공
프로젝트 진행에 있어서 가장 문제가 많이 발생한 부분은 데이터의 추출·수집이었다. 작업의 밑바탕이 되는 건 어린이집에 대한 데이터인데, 데이터 세트의 공개는 물론이고 API도 제공되지 않아 별도의 데이터 추출 작업이 필요했다. 어렵게 얻어낸 데이터이건만 세부적으로 누락되거나 진위가 의심되는 값들이 적잖았다. 실제로 몇몇 어린이집을 표본으로 해당 어린이집과 아이사랑보육포털 측에 문의한 결과, 데이터 갱신을 어린이집 자율에 맡겨놓은 상황이라 일부 오류가 있을 수 있으나 전 데이터를 검수하기는 어렵다는 대답을 들을 수 있었다.
또한 서울 서베이 최신판인 2012년판은 PDF 파일의 최종 보고서만 공개돼 있었다. 이에 대해 서울시는 서울서베이2012에 대한 데이터를 공개하기 위한 데이터 검수 작업을 진행 중이며, 지난 연도의 데이터 세트들은 이미 열린데이터광장에 공개돼 있다고 대답했다. 마지막으로 주민등록인구통계 데이터 또한 월 단위로 갱신되는 데이터는 데이터 세트나 API가 공개되지 않아, 하나하나 옮겨 적는 과정을 거쳐 가공했다.
2. 인포그래픽 제작
데이터를 조합하고 가공해서 얻어낸 이야기가 아무리 좋아도 어떻게 표현하느냐에 효과와 의미가 달라진다. 따라서 기획 단계부터 데이터 가공, 디자인 시안 제작까지의 전과정을 디자이너와 함께 진행했다. 이를 위해 데이터 저널리즘/인포그래픽에 대한 정의와 성격을 사전에 공감하는 데 노력을 쏟았다.시안에 대한 가이드도 사전 기획에서 확정하지 않고, 데이터를 조합·가공하면서 이에 걸맞는 디자인을 지속적으로 수립·수정했다. 이를 통해 데이터와 이야기에 가장 적합한 인포그래픽을 제작할 수 있었다. 다만, 데이터 시각화 자체에만 집중한 나머지 프로젝트 인원 외부의 피드백을 받는 과정이 부족했었고, 이는 최종 시안을 내놓은 뒤 가독성과 보는 이들의 이해도를 높이기 위한 수정 작업을 거치는 문제를 낳았다.
#. 사용한 도구
3. 내용 및 결과
지난 7월 기준 서울시에는 57만8080명의 영유아와 6713개의 어린이집이 있다. 숫자로만 보면 어린이집이 부족한 것인지 넉넉한 것인지 판단하기가 쉽지 않다. 그래서 우리는 언론 미디어에서 보도하는 ‘어린이집이 부족하다’란 문장에 갇힐 수밖에 없다. 뻔한 인터뷰와 기자의 논평이 아니라, 데이터만 갖고 살펴보았다. 그랬더니 일반적으로 이해하고 있는 상황과는 다른 이야기가 펼쳐졌다.
안전행정부의 인구 데이터와 서울시의 서울서베이2012의 보육형태 현황 데이터를 조합해 서울 영유아 중 어린이집에 대한 예상 수요를 추산해 서울 소재 어린이집 정원과 비교해 보았다. 그 결과 동남권(송파구, 강남구, 서초구, 강동구)을 제외한 모든 권역에서 어린이집은 결코 부족하지 않았다. 서울 소재 어린이집의 10% 가량은 정원의 절반 이상이 비어 있는 상태였으며, 전체 시설의 절반 가량만이 정원 대비 10% 미만의 여유가 있는 상황이었다. 즉, 공급이 수요보다 많은 상황 속에서 일부 시설에만 수요가 몰리는 현상이 확인됐고, 부모들이 선호하는 시설이 따로 있다는 것을 추정할 수 있었다. 심지어 도심권(용산구, 중구, 종로구)의 경우, 미충원율 10% 미만의 선호시설만으로도 해당 권역의 수요 인구를 모두 수용할 수 있었다.
물론 본 작업에 사용된 데이터들은 타지역·타권역에서 유입되는 수요와 서울시가 운영하는 ‘대기자 시스템’이 반영되지 않은 탓에, ‘어린이집이 넉넉한 상황’이라고 단정지을 순 없다. 하지만 문제가 되는 요소들을 모두 반영한 공공데이터가 개방되지 않았기 때문에 감수해야 하는 위험 요인이라고 판단한다.실제로 데이터 검증을 위해 몇몇 어린이집에 연락한 결과, 30~40명의 수용 여유가 있음에도 원생 등록을 위해서는 대기자 등록을 하고 기다리라는 답변을 들었다. 결국 개별 이용자가 처한 환경적 조건을 고려하지 못한 공공데이터 개방과 행정 서비스로 이용자들에게 오해와 또 다른 불편을 야기할 수 있다는 점에서 개선이 필요할 것으로 판단된다.