[일본교육 평가혁명⑭] 일본수능 논술답안 채점에 인공지능(AI) 투입 검토
[일본교육 평가혁명⑭] 일본수능 논술답안 채점에 인공지능(AI) 투입 검토
  • 신향식 객원기자
  • 승인 2018.03.31 10:09
  • 댓글 0
이 기사를 공유합니다

잃어버린 20년은 공교육의 경쟁력 상실에서 시작됐다. 일본이 ‘교육평가혁명’을 시도하고 있다. 부실한 공교육이 국가발전의 걸림돌이라는 값비싼 교훈을 얻은 결과다. 한국 교육계가 대입수학능력시험을 절대평가로 전환하는 문제를 놓고 갈등하는 가운데 일본은 대학입시와 중고교 교육현장에서 ‘평가혁명’에 착수했다. 객관식 문제를 줄이거나 폐지하고 서술·논술형으로 바꾸는가 하면 국제 바칼로레아(International Baccalaureate, IB) 교육과정을 공교육에 도입하는 혁명적인 변화다. 서울대, 고려대, 서울교대 등이 대입전형에서 논술고사를 전면폐지하고 다른 대학들도 논술전형을 축소하는 한국과 정반대 현상이 나타나고 있다. 이에 독서신문은 신향식 객원기자를 일본에 급파, 일본 교육의 평가혁명 현주소를 살펴봤다. <편집자 주(註)>

 

일본 국립 정보학 연구소의 아라이 노리코 사회공유지식연구센터장

[독서신문]

‘인공지능이 논술 답안을 채점할 수 있을까.’
일본이 인공지능(AI)의 논술채점 방안을 연구하고 있어 그 성공 여부에 관심이 쏠리고 있다. 2020년부터 대입수능시험(대학입학공통시험)에 논술형 문제를 출제하는 일본은 채점기간과 인력을 줄이기 위해 인공지능 활용을 검토하고 있다.

일본 산케이신문과 베네세 교육사이트 등은 문부과학성의 인공지능 논술채점 방안 연구와 전문가들의 반응을 보도하고 있다. 교육 전문가들과 누리꾼들의 찬반논쟁도 후끈 달아올랐다. 안자이 유이치로 일본학술진흥회(JSPS) 이사장은 지난해 11월 28일 한국경제신문 인터뷰에서 “일본에서는 인공지능을 활용해 일정 수준 이하의 문장은 걸러내는 식으로 채점 시간을 줄이는 연구를 진행 중”이라고 밝혔다. 


◆ 문장의 인과관계 적절성 등도 판정할 것으로 기대

인공지능 논술채점은 문장 길이와 주제어, 어휘 수 등 출제진이 입력한 채점 조건을  토대로 인공지능이 순식간에 점수를 매기는 방식이다. 스캐너로 답안지를 전자데이터화한 뒤 간단한 편집 작업을 할 수 있는 소프트웨어를 사용하여 컴퓨터 화면에서 채점한다는 것이다. 특히 채점 경험을 쌓으면서 구체적인 판단 기준을 새로 학습하고 다각적인 판정도 할 수 있을 것으로 기대하고 있다. 이 연구가 진척되면 문장구성 인과관계의 적절성도 좀 더 정확하게 판정할 것으로 내다보고 있다.

안자이 유이치로 일본학술진흥회 이사장은 “객관식 시험에서 1점 차로 대학이 갈리는 데 문제의식을 느낀다면, 논술채점이 어렵다고 무작정 비판하기보다는 ‘제대로 채점할  수 있는 (창의적인) 방법’을 연구하는 게 더 생산적”이라고 밝혔다.

일본이 인공지능까지 동원하여 수능에 논술형 문항을 출제하려는 이유는 4차 산업혁명에 맞는 인재를 길러내기 위해서다. 객관식, 주입식, 암기식 교육으로는 사고력, 판단력, 표현력을 키울 수 없다고 보고 논술형 문항을 수능에 추가하려는 것이다. 일본은 2020년부터 대학입학공통시험의 국어와 수학에 객관식 문제와 함께 논술형 문제를 출제할 예정이다.


◆ 논술 채점기간 줄이려고 인공지능 활용방안 검토

문부과학성의 예측에 따르면, 단문 40글자 답안도 채점에 약 1개월이 필요하다. 채점자를 800명, 응시자 수를 최대 53만 명이라고 하면 채점관들에게 채점 기준을 설명하는 기간을 포함하여 채점에 최대 60일까지 걸리는 것으로 추정됐다. 시험 날짜에서 성적 통보  일까지 기간이 길어진다면 학사 일정에도 영향을 미칠 수 있어 채점 기간 단축이 급선무다. 그 과정에서 인공지능 논술채점 방안을 연구하게 되었다. 

물론, 기술적인 과제가 있어 이 방안을 실현하기까지 진통이 예상된다. 전문가들은 “영어 등과 달리 일본어는 말의 정렬 순서가 엄격하지 않고, 같은 단어라도 의미가 다른 사례도 있어 정확한 채점이 어렵다”고 지적했다.

문부과학성 보고서에는 “유사한 내용의 답안을 그룹화하는 등의 채점 지원 업무에 인공지능을 동원하는 방안을 찾아보는 중"이라고 적혀 있다. 이는 채점 ‘지원’ 업무에 국한하는 것으로 인공지능이 전부 채점하는 방안은 아니다. 광학식 문자판독장치(OCR)에서 읽은 답안을 분류할 뿐 최종적으로는 사람 손으로 채점해야 한다고 못을 박았다.


◆ “인공지능 논술채점은 절망적” 회의적 시각도

일본 국립정보학연구소 사회공유지식연구센터의 아라이 노리코 센터장은 일본교육 정보화 진흥회(JAPET & CEC)가 개최한 포럼에서 인공지능 논술채점은 ‘절망적’이라고 단언했다. 

아라이 노리코 센터장은 세계사 과목을 예로 들어 이같이 지적했다. 

“‘콜럼버스는 이자벨라 여왕과 남편 페르난도의 지원으로 1492년 마리아, 니나, 펜타의 선박 세 척으로 미국 대륙을 향해서 항해했다’는 모범 답안이 있음에도 불구하고, ‘미국의 여왕은 1492척의 배로 마리아 쪽으로 항해했다…’는 이상한 문장까지 정답으로 인정될 수 있다.”

주제어만 맞으면 고득점을 주고 반대로 독창성이 넘치는 글과 논리적이면서도 쉽게 표현한 문장에는 오히려 낮은 점수를 매길 수 있다는 지적도 나왔다.


◆ 국내 교육전문가들 “암기식 교육 탈피하려는 일본 노력 대단”

국제 바칼로레아(IB)를 국내 공교육에 처음 도입(경기외고)한 박하식 충남 삼성고 교장은 “논술은 학생들이 로봇이나 인공지능에 명령을 내릴 수 있는 창의적 비판적 사고방식을 갖도록 하는 것”이라며 “채점 효율성보다 더 중요한 일이 인간적인 모습이므로 인공지능 논술채점이 바람직해 보이지는 않는다”고 지적했다.

김슬옹 세종학 교육원 원장은 “논술은 사람으로서 갖추어야 할 최고의 고등 언어 능력을 말한다”면서 “논리적이면서 맥락에 따른 섬세한 언어 전략과 표현 능력이 융합된 글쓰기가 논술”이라고 밝혔다. 김 원장은 또 “이제 일본은 인공지능조차 논술 능력을 갖춘 세상으로 가고 있는데 대한민국은 교육부가 논술 교육 자체를 우습게 알고 있다”면서 “논술교육 전문가로서 우리나라 현실이 걱정된다”고 덧붙였다.

이혜정 교육과혁신연구소장은 “실현 가능성 여부를 떠나 인공지능을 활용해서라도 논술형 답안을 채점하게 하려는 일본의 평가혁신 의지가 놀랍다”면서 “한국도 그런 방향의 의지가 있으면 암기식, 주입식 교육의 해결 방안은 얼마든지 만들 수 있다”고 밝혔다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.