국립중앙도서관 오아시스 시스템, 국내 웹사이트 22만건 수집

국가 차원 웹사이트 보존 사업… 2017년 30만건 수집 예정

2017-01-07     이정윤 기자

[리더스뉴스/독서신문 이정윤 기자] ‘2011 디지털미디어 페어’, ‘로봇박물관’ 등 인터넷 공간에서 사라진 웹사이트를 찾아볼 수 있는 곳이 있다. 국립중앙도서관에서 운영하는 오아시스(OASIS, Online Archiving & Searching Internet Sources) 시스템이다.

오아시스 시스템은 보존대상으로 선정된 웹사이트를 국제표준규격의 웹 수집 로봇기를 통해 정기적으로 방문해, 방문 당시의 웹사이트를 수집·보존한다. 그를 통해 시간이 흘러 없어지거나, 변경된 우리나라 주요 웹사이트의 과거의 현재 모습을 보여준다.

웹사이트의 평균 수명은 44일에 불과하다. 따라서 적시에 수집하는 과정이 필요한데, 국립중앙도서관은 2004년 시범 수집을 거쳐 2005년부터 본격적으로 주요 사이트를 선별 수집해왔다. 그 결과 지난해까지 우리나라 도메인 100만여건 중 22만5,470건을 수집했다.

특히 2016년에는 오아시스 홈페이지 개편을 통해 국회의원 선거, 메르스(MERS) 사태 등 국가적인 이슈·재난·주제 분야에 대한 웹 자원 컬렉션을 구축했으며, 웹사이트의 대량 손실을 막기 위해 ‘.co.kr’ 도메인을 대상으로 ‘포괄적 웹사이트 수집’을 시범 추진했다.

포괄적 웹사이트 수집은 국가도메인(.kr 등) 단위로 대량 수집하는 것을 의미하며, 향후에는 국가도메인뿐 아니라 국내에서 운영되는 일반최상위도메인(.com, .net, .org)까지 확대 수집하고자 분석 작업도 진행했다.

따라서 2017년에는 포괄적 웹사이트 수집을 30만건으로 확대하고, 수집된 웹사이트 자료를 활용한 시각화 서비스도 개발할 계획이다.

국립중앙도서관은 “앞으로 웹사이트 아카이빙 범위를 점차 확대해 국가의 소중한 디지털 정보자원을 영구 보존해 후대에 전승할 수 있도록 노력하겠다”고 전했다.