국립중앙도서관 오아시스 시스템, 국내 웹사이트 22만건 수집
국립중앙도서관 오아시스 시스템, 국내 웹사이트 22만건 수집
  • 이정윤 기자
  • 승인 2017.01.07 16:16
  • 댓글 0
이 기사를 공유합니다

국가 차원 웹사이트 보존 사업… 2017년 30만건 수집 예정
국립중앙도서관 오아시스(OASIS) 시스템

[리더스뉴스/독서신문 이정윤 기자] ‘2011 디지털미디어 페어’, ‘로봇박물관’ 등 인터넷 공간에서 사라진 웹사이트를 찾아볼 수 있는 곳이 있다. 국립중앙도서관에서 운영하는 오아시스(OASIS, Online Archiving & Searching Internet Sources) 시스템이다.

오아시스 시스템은 보존대상으로 선정된 웹사이트를 국제표준규격의 웹 수집 로봇기를 통해 정기적으로 방문해, 방문 당시의 웹사이트를 수집·보존한다. 그를 통해 시간이 흘러 없어지거나, 변경된 우리나라 주요 웹사이트의 과거의 현재 모습을 보여준다.

웹사이트의 평균 수명은 44일에 불과하다. 따라서 적시에 수집하는 과정이 필요한데, 국립중앙도서관은 2004년 시범 수집을 거쳐 2005년부터 본격적으로 주요 사이트를 선별 수집해왔다. 그 결과 지난해까지 우리나라 도메인 100만여건 중 22만5,470건을 수집했다.

특히 2016년에는 오아시스 홈페이지 개편을 통해 국회의원 선거, 메르스(MERS) 사태 등 국가적인 이슈·재난·주제 분야에 대한 웹 자원 컬렉션을 구축했으며, 웹사이트의 대량 손실을 막기 위해 ‘.co.kr’ 도메인을 대상으로 ‘포괄적 웹사이트 수집’을 시범 추진했다.

포괄적 웹사이트 수집은 국가도메인(.kr 등) 단위로 대량 수집하는 것을 의미하며, 향후에는 국가도메인뿐 아니라 국내에서 운영되는 일반최상위도메인(.com, .net, .org)까지 확대 수집하고자 분석 작업도 진행했다.

따라서 2017년에는 포괄적 웹사이트 수집을 30만건으로 확대하고, 수집된 웹사이트 자료를 활용한 시각화 서비스도 개발할 계획이다.

국립중앙도서관은 “앞으로 웹사이트 아카이빙 범위를 점차 확대해 국가의 소중한 디지털 정보자원을 영구 보존해 후대에 전승할 수 있도록 노력하겠다”고 전했다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
비회원 글쓰기 계정인증을 통해
댓글을 남기실 수 있습니다.

  • 서울특별시 서초구 논현로31길 14 (서울미디어빌딩)
  • 대표전화 : 02-581-4396
  • 팩스 : 02-522-6725
  • 청소년보호책임자 : 권동혁
  • 법인명 : (주)에이원뉴스
  • 제호 : 독서신문
  • 등록번호 : 서울 아 00379
  • 등록일 : 2007-05-28
  • 발행일 : 1970-11-08
  • 발행인 : 방재홍
  • 편집인 : 방두철
  • ⌜열린보도원칙⌟ 당 매체는 독자와 취재원 등 뉴스 이용자의 권리 보장을 위해 반론이나 정정보도, 추후보도를 요청할 수 있는 창구를 열어두고 있음을 알려드립니다.
  • 고충처리인 권동혁 070-4699-7165 kdh@readersnews.com
  • 독서신문 모든 콘텐츠(영상,기사, 사진)는 저작권법의 보호를 받은바, 무단 전재와 복사, 배포 등을 금합니다.
  • Copyright © 2024 독서신문. All rights reserved. mail to webmaster@readersnews.com
ND소프트