인공지능과 교육을 결합하고자 시도했던 역사를 제대로 살펴보기 위해서는 꽤 오래전으로 거슬러 올라가야 한다. 1965년도에 플라톤의 이름을 따서 만든 PLATO(Programmed Logic for Automatic Teaching Operation)라는 소프트웨어가 그 기원이라고 할 수 있다. 물론 인공지능을 현대적 의미로 해석한다면 엄밀한 의미에서 인공지능이라 할 수 없는 수준이지만 중요한 것은 PLATO가 교육분야에서 인공지능과 결합했을때 우리가 기대하고 있던 것을 정확하게 반영하고 있다는 사실이다. 

PLATO의 기능은 꽤 단순했는데 주어진 질문에 대한 각 답변에 “OK” 또는 “NO”로 응답할 수 있도록만 설계되었다. 학생들은 원하는 만큼 답변 할 수 있었지만 “OK”를 받을 때까지 새로운 내용으로 이동할 수 없었다. 물론 필요한 경우 학생은 도움말 버튼을 눌러 도움말 자료로 이동할 수 있기 도 했고 필요한 경우 질문과 추가 분기도 있기는 했지만 결과적으로 “AHA!”를 선택하여 원래 질문으로 돌아가서 다시 대답해야는 구조였다.

여기서 우리가 알 수 있는 것은 진공관에서 트랜지스터 시대로 접어들면서 나왔던 PLATO와 현재 교육분야에서 인공지능에 기대하는 바가 크게 다르지 않다는 것이다. 바로 개별화(Personalized) 혹은 맞춤화(Adaptive) 교육을 지향하고 있다는 것이다. 생각보다 오래된 이 주제는 컴퓨터의 환경(인공지능의 진화)에 맞춰 꾸준히 연구되고 개발되어 진화해왔고 최근 들어서는 실제적인 성과를 내고 있기도 하다. 미국의 뉴턴(Knewton)과 우리나라 노리(KnowRe), 산타토익 등은 맞춤형 교육의 대표적 사례라고 할 수 있다.

교육분야와 인공지능의 접점은 “방대한 정보를 수집, 분석, 처리, 저장할 수 있는 컴퓨터 및 지능형 시스템의 발달, 그 컴퓨터 및 시스템들 간의 상호작용 기술에 기반하여 수요자에게 맞춤형 정보가 최적의 형태로 제공되는 것”으로 정의되었던 지능정보화(홍선주 외, 2016)에 있다. 지능화된 인공지능을 활용해서 평균적인 학생들의 수준에 맞추어 진행되었던 교실수업 환경을 개인의 학습수준에 맞춘 개별화 수업방식으로 전환되기를 기대하는 것이다. 블룸의 완전학습 이론은 개별화 수업의 효과성을 이미 과학적으로 증명한 바가 있다. 다만 이를 실현하기 위한 비용을 정부 혹은 사회가 감당하기가 힘들다는 것이 교육 전분야에 적용할 수 있는 가능성을 가로막고 있었던 것이다. 인공지능을 활용한 개별화 교육에 관련된 연구가 이 당위성보다는 실현가능성과 효율성에 맞춰지는 이유다. 

현재 개별화 혹은 맞춤형 교육에 관련된 연구는 ITS(Intelligent Tutoring System) 혹은 AIS(Adaptive Instructional System)라고 통칭되고 있다. 인공지능의 활용범위가 넓어짐에 따라 ITS는 AIS를 구현하기 위한 하나의 모델로 정의되고 있고 AIS의 범위에는 ITS뿐만 아니라 다양한 종류의 인공지능, 컴퓨팅 기술을 활용한 개념을 포함하고 있기 때문에 AIS를 좀 더 넓은 의미로 정의하고 있다.

앞서 언급한대로 AIS를 효율적으로 실현하는데에 많은 걸림돌이 있다. 성공적인 사례로 언급되었던 뉴턴, 노리, 산타토익은 SAT와 수학, 영어이라는 특정 도메인에 국한된 서비스이기 때문에 이를 다른 도메인(평생교육, 물리, 화학 등) 분야에 그대로 적용할 수 없다는 것이다. (상업용으로 개발된 서비스라 같은 도메인이라고 하더라도 확장성 여부를 판단하기도 어렵다) 그리고 그보다 더 큰 문제는 이를 개발하기 위해 엄청난 리소스를 필요로 한다는 것이다. 

이러한 문제들을 해결하기 위해 인공지능을 교육에 적용(AIEd)할 수 있는 접근 방법을 다음 세가지로 요약하고 있다.

효과적 티칭을 위한 모델(Pedagogical model), 학습 내용을 중심으로 한 주제 모델(Domain model)과 학습자에 대한 모델(Learner model)은 각각 독립적으로 구현될 수도 있고 통합적으로 구현될 수도 있다. Pedagogical model은 LMS와 같은 학습관리시스템에서 주로 관심을 가지고 있는 부분이고 Domain Model은 앞서 말했던 뉴턴, 노리, 산타토익에서 했던 접근방식이다. Learner Model의 대표적인 사례는 실시간에서 학습자와 상호작용을 극대화하기 위해 만든 미네르바스쿨의 액티브 러닝 포럼(Active Learning Forum)이다. 

각각의 모델을 적용하는 기술은 제시된 사례들외에도 다양한 방식으로 적용되고 있다. 문제는 이런 모델들을 범용화하고 통합할 수 있느냐는 것이다. AIS를 구현한다는 것은 특정 도메인이 아닌 모든 도메인에 걸쳐 적용할 수 있는 범용적인 기술을 개발해서 효율적으로 적용할 수 있다는 것을 뜻하기 때문이다. 

이를 해결하기 위한 갖가지 노력들이 진행되고 있는데 그중 하나가 IMS Global, ADL, IEEE와 같은 표준화 기관들이 하고 있는 표준화 연구다. 다중 도메인에서 적용하기 위해서는 도메인간 호환이 가능한 데이터의 표준화가 관건인데 이를 우선 해결하고자 하는 것이다. 그동안 각각의 연구기관에서 독자적인 표준 모델을 제시하고 이를 부분적으로 활용하고 있었는데 최근들어 IEEE를 중심으로 한 새로운 워킹그룹에서 통합을 시도하고 있는 것으로 보인다. 다음은 그 내용들이다.

  • IEEE P9274.1 Experience API (xAPI) 2.0 – Learning activity tracking uses the xAPI to capture learning activity streams. The xAPI standard also includes xAPI profiles such as cmi5 and the TLA’s Master Object Model. xAPI 2.0 is targeted for approval in 2020.
  • IEEE 1484.12.1 Learner Object Metadata 2.0 – Descriptions of learning activities and their associated content are stored in the TLA’s Experience Index and use a modified version of the Learning Resource Metadata Initiative standard. A draft standard is being submitted for finalization in early 2020.
  • IEEE 1484.20.1 Reusable Competency Definitions – The definition of a competency, the relationship to other competencies, and the alignment of evidence to help measure proficiency of the competency, are included in this standard. This standard is expected for approval in 2020.
  • IEEE 1484.2 Interoperable Learning Records or IMS Global Comprehensive Learner Record – Learner profile standards do not currently meet all TLA requirements. These new standards are actively being developed and modified based on input from numerous industry groups and associations.

이 데이터 표준 내용들을 살펴보면 표준의 관점에서 개별화 학습에 접근하고 있는 연구의 방향성을 대략 엿볼 수 있다. 학습활동과 콘텐츠단위에 대한 메타데이터 표준(LOM 2.0), 도메인별 호환 가능한 형식의 역량표준(RCD), 개인별 학습 활동 데이터 수집의 표준(xAPI 2.0)과 학습자 프로파일 표준(ILR, IGCL)  네가지 스키마로 구성되어 있는데 이들을 조합해서 학습분석을 하는 것이다. 여기서 역량과 메타데이터 표준에서는 각각 교육의 방향성과 학습의 준거를 제시하는 기능을 맡고 학습자의 과거 학습 상태와  현재 진행되고 있는 상황은 학습자 프로파일과 LRS형식의 데이터 수집표준 스키마에 저장되는 것이다.

아래 그림에서 처럼 이들 스키마는 서로 상호보완적이며 이들 관계를 통해 분석된 결과를 통해 추천서비스 등과 같은 맞춤형 서비스가 가능하게 된다.

범용 AIS 개발을 위한 또 하나의 축은 멀티도메인에서 작동할 수 있는 프레임워크(Framework)를 개발하는 것인데 대표적인 사례가 미육군 연구소(US Army Research Laboratory, ARL)의 LITE (Learning in Intelligent Tutoring Environments) Lab에서 개발한  GIFT(Generalized Intelligent Framework for Tutoring)이다. GIFT는 다중 도메인, 오픈 소스 튜터링 아키텍쳐로 부상되고 있는데 시스템이라는 표현 대신 아키텍쳐 혹은 프레임워크라는 표현을 사용한 것은 그 자체의 완성도보다는 다른 시스템과의 연결성에 더 큰 무게를 두고 있기 때문이다. 최근 들어서는 edX, Moodle과 같은 범용적인 LMS와 연계하는 방식으로 확장 가능성을 넓히고 있는 것도 그 이유 때문이다. 

GIFT외에도 멤피스 대학에서 개발한 ‘AutoTutor’나 뉴질랜드 캔터베리 대학에서 개발 한 ‘ASPIRE’도 비슷한 개념으로 개발된 사례다. 이 모든 시스템들이 특정 도메인이 아닌 범용환경에서 운영할 수 있는 저작도구 및 외부 시스템 연계 기능들을 포함하고 있다는 것이 특징이다. AIS 환경을 지향하는 지능형 튜터링 시스템은 학생의 성과를 크게 향상시킨 오랜 역사를 가지고 있지만 대부분 매우 짧은 유통 기한으로 인해 개발 비용이 매우 비싼 오랜 역사를 가지고 있기도 하다. 쉽게 말해 ROI가 충분하지 않다는 것이다. 이러한 결함을 해결하기 위해 RACE (Rapid Adaptive Coaching Environment)와 같은 저작 도구의 개발을 필요로 할 수 밖에 없었던 것이다.

미국방성에서 진행한 RACE 프로젝트는 학습자 스스로가 독립적으로 연습할 수 있도록 지원하는 ITS를 개발하는데 필요한 저작 도구를 개발하는 방식을 연구했다. RACE를 개발하는데 있어 가장 어려운 기술적 과제는 상황 평가에 대한 일반화되고 사용 가능한 접근 방식을 개발하는 것이었다. 하지만 여러가지 측면에서 많은 진전을 이루었지만 궁극적으로 다른 요소 (특히 저작의 다른 측면을 단순화하기위한 목표 시퀀스의 명시적 정의의 어려움)로 인해 완전한 솔루션 개발을 진행하지는 못했다. 다양한 환경에서 범용적으로 사용하기 위해서는 더 많은 연구가 필요하다는 뜻이다.

앞선 여러가지 연구 사례를 통해 확인할 수 있는 바는 그간의 범용 AIS 환경 구축을 위한 접근방법(표준화, 멀티도메인 프레임워크, 저작도구)들이 AIS를 좀 더 효과적으로, 생산적으로 구현할 수 있는 가능성을 제공하고 있긴 하지만 보다 인간화된 인공지능을 통한 튜터링이라는 기대를 충족시키기에는 아직 많은 부분에서 부족하다는 것이다. 아직 인공지능의 수준이 이런 기술을 구현할 정도로 진화되지 않았다는 것도 중요한 이유이겠지만 또다른 측면은 현재까지 교육분야에서 연구되고 있거나 개발된 사례들이 인공지능 분야에서 최근 선보이고 있는 다양한 기술들을 충분히 활용하지 못하고 있다는 것에 기인하고 있다.

최근들어 인공지능계에서 가장 각광받고 있는 자연어처리(NLP) GPT-3는 다소 더디게 진화되고 있는 것처럼 보이는 인공지능의 범용적 활용성이 어쩌면 생각보다 빠르게 진화될 수도 있을 것이라는 전망을 갖게 한다.

GPT-3는 테슬라로 유명한 엘런머스크가 만든 인공지능 연구소 OpenAI에서 만든 자연어처리(NLP) 엔진의 이름이다. 일찌감치 인공지능의 위험성에 대해 경고를 해왔던 엘런머스크는 본인이 직접 참여하여 인공지능 기술을 일반에게 오픈하고 일부 개인 혹은 단체가 인공지능의 가능성을 독점하는 대신 인류가 공동의 자산으로 활용할 수 있기를 바라는 마음으로 OpenAI라는 일종의 연구소를 설립한 것이다. 

이 연구소는 꾸준히 연구개발을 해왔는데 작년에 나왔던 GPT-2부터 세간의 관심을 집중적으로 받기 시작했다. GPT-2가 제공하는 ‘그럴듯한 글짓기’ 기능때문이었다. 가짜뉴스가 양산되어 전세계 곳곳에서 문제가 되고 있던 시점이라 GPT-2를 활용한 가짜뉴스의 확산이 일치감치 염려가 되었기 때문이다. 작년에 이어 GPT-3는 더욱 놀라운 성능으로 진화되어 올해 5월에 릴리즈되었는데 GPT-2에 비해서도 월등한 기능을 선보이면서 세상을 깜짝 놀라게 했다. 연구결과에 따르면 50% 정도의 사람은 GPT-3가 쓴 글과 인간이 쓴 글을 구분을 하지 못했다고 한다.

논문리뷰

GPT-3의 가능성은 여기에서 그치지 않는다. 아래 링크는 GPT-3가 응용될 수 있는 다양한 사례들을 소개하고 있는데 이 사례들을 하나씩 보다보면 응용범위가 생각보다 넓다는 것을 금방 확인할 수 있다.

GPT-3 응용사례

GPT-3에 대해서 주목하는 이유는 그 성과 자체보다 기존의 관념을 깨고 인공지능 알고리즘을 개선하는 대신 대규모 컴퓨팅 파워를 통해 사전학습된 인공지능을 활용해 기존 딥러닝 분야에서 흔히 사용되었던 Fine Tuning 방식 대신 Few Shot 방식으로도 원하는 결과를 얻을 수 있다는 것을 확인했다는 데 있다. GPT-3는 사전학습을 위해 1,750억개의 Parameter를 가지고 사전 학습을 해야했는데 위해 285,000개의 CPU 코어와 10,000개의 GPU를 활용했다. 여기서 이야기하고 있는 Parameter는 뇌에 있는 시냅스와 같은 역할을 하는 것인데 인간의 뇌속에 있는 100조개의 시냅스 수와 비교했을때 부족한 것은 사실이지만 이 정도만으로도 충분히 의미있는 성과를 거둔 것이다. GPT-4가 나오는 시점에는 인간의 시냅스 수와 같은 정도 수준의 Parameter를 활용할 것으로 보여 조만간 인류의 지적 수준을 능가하는 인공지능이 출현할 가능성도 충분히 있다는 뜻이다. 

자연어처리 분야뿐만 아니라 딥러닝, 로보틱스 분야 등에서도 빠른 진화가 이뤄지고 있어 어쩌면 우리가 일반적으로 예상하는 것보다 훨씬 빠르게 기술적 특이점(技術的特異點, 영어: technological singularity, 인공지능(AI)의 발전이 가속화되어 모든 인류의 지성을 합친 것보다 더 뛰어난 초인공지능이 출현하는 시점을 말한다)에 도달할 가능성이 있다. 남은 문제는 인공지능의 진화속도에 맞춘 교육분야에 대한 적용 속도와 방향이다. 

국내로만 국한시켜 시장을 보면 교육분야는 산업의 규모에 비해 시장의 주목을 크게 받고 있는 분야는 아니었다. 이유는 대부분의 교육 예산이 공공부문에 속해 있어 실제 민간 시장의 규모가 그다지 크지도 않고 유아, 공교육, 고등교육, 평생교육 등 도메인별로 시장이 명확하게 구분되어 있어 도메인간 크로스 플랫폼이 동작되기 어려운 환경이었기 때문이다. 코로나로 인한 비대면 교육의 필요성과 글로벌 에듀테크 산업의 약진등의 분위기에 힘입어 현재는 공교육분야에서도 에듀테크 업계의 적극적인 참여를 요청하는 분위기로 전환되고 있지만 그 이전 꽤 오랫동안 비주류 산업군에 속했다는 것이다.

문제는 이로 인해 달라진 환경에 빠르게 적응할 수 있을 만한 기업들이 많이 양성되지 않았다는 것이다. 비교육 분야의 기업들은 Domain Knowledge의 부족으로 그리고 기존 에듀테크 기업은 규모의 한계로 인해 준비도가 모두 낮은 상태이기 때문이다. 

다행이 인공지능 기술을 손쉽게 활용할 수 있는 다양한 도구들의 등장과 인공지능을 토대로 교육 분야로 진출한 몇몇 성공적인 사례들 속에 교육분야에서도 데이터 및 데이터 분석에 대한 관심이 많아지고 있어 분위기는 빠르게 개선이 될 것으로 예상된다. 다만 인공지능 활용에 대한 충분한 이해와 더불어 경험을 보유한 인력들이 교육분야에 적극적으로 유입되지 않는 이상 인공지능 기술의 진화속도와 교육분야의 인공지능 기술 활용 속도간의 괴리는 당분간 유지될 것이다.

정부나 공공차원에서도 교육분야에서 인공지능의 활용이 중요하다는 인식을 공유한다면 두 분야의 발전 속도의 차이를 빠르게 개선하는 것과 동시에 교육분야에서 인공지능을 활용하는 분야를 좀 더 체계적이고 면밀하게 관리하고 지원할 필요가 있다. 앞서 이야기한대로 교육분야에서 인공지능과의 결합 모델은 크게 세가지 분야로 (Pedagogical, Domain, Learner 모델) 나눌 수 있고 시스템적 관점에서는 표준, 프레임워크, 저작도구 등으로 다시 구분될 수 있다. 

특정 기업이나 기관에서 이 모든 분야를 망라해서 개발하고 사업화하는 것이 사실상 불가능하기도 하지만 효율적이지도 않다는 뜻이다. 정부의 지원도 국내 교육 산업의 특성을 반영한 전략적인 집중이 필요한 이유다. 어떤 분야에 우리의 강점이 있는지 그리고 우리 교육이 어떤 방향을 지향하고 있는지에 따라 전략적 선택은 달라질 수 있으므로 우선 우리 교육의 방향성에 대한 논의가 선행되어야 한다는 것이다. 

 

출처 : 쑥갓선생