포브스의 지난 11월 30일자 기사에 의하면, 영국 레딩 대학교 연구진이 발표한 충격적인 연구 결과가 교육계에 파문을 일으키고 있습니다.
피터 스카프 교수 연구팀이 수행한 이번 연구는 교육 현장에서 AI가 만든 과제물이 얼마나 쉽게 교수진의 검증을 통과하는지를 적나라하게 보여주었습니다. 연구진은 가짜 학생 프로필을 만들어 AI로 작성한 기초적인 과제물을 제출했고, 놀랍게도 그중 94%가 교수진에 의해 발견되지 않았습니다. AI 사용을 명시적으로 지적해야 하는 더 엄격한 기준을 적용했을 때는 무려 97%가 발견되지 못했습니다.
더욱 우려스러운 것은 AI가 작성한 과제물의 질적 수준입니다. 연구 결과에 따르면 AI가 작성한 과제물이 83.4%의 확률로 실제 학생들의 과제물보다 더 높은 점수를 받았습니다. 이는 학업 성취도 평가의 근본적인 문제를 제기합니다. 실제 학습과 이해도를 측정하기 위한 평가가 AI의 능력을 측정하는 것으로 변질될 수 있다는 것입니다.
이러한 상황에서 일부 교육기관들의 대응은 우려스럽습니다. AI 탐지 기술의 사용을 제한하거나 금지하는 것은 문제의 해결이 아닌 회피에 불과합니다. 베트남의 미국 대학들에서 수행된 연구에 따르면, AI 탐지 시스템은 91%의 정확도로 AI 생성 콘텐츠를 식별했지만, 교수진은 54.5%만을 발견했습니다. 이는 기술의 도움 없이 인간의 판단만으로는 AI 사용을 효과적으로 탐지할 수 없다는 것을 보여줍니다.
현재의 상황은 교육계가 직면한 세 가지 과제를 제시한다. 첫째, 학습의 진실성을 어떻게 보장할 것인가? 둘째, AI 기술을 교육에 어떻게 통합할 것인가? 셋째, 평가 체계를 어떻게 혁신할 것인가?
이 문제들에 대한 해답을 찾지 못한다면, 우리는 머지않아 실질적 학습 없이 AI의 도움으로 학위를 취득한 전문가들이 우리 사회의 중요한 직책들을 채우는 상황을 마주하게 될 것입니다. 간호사와 의사, 엔지니어와 같이 같이 전문적 지식과 실무 능력이 필수적인 직종에서 이는 치명적인 결과를 초래할 수 있습니다.
교육계는 이제 AI를 적과 동지 중 어느 쪽으로 볼 것인지를 넘어, 어떻게 하면 AI 시대에 진정한 학습과 평가가 이루어질 수 있는지에 대한 근본적인 논의를 시작해야 합니다. 이는 단순히 기술적 해결책이나 정책적 규제만으로는 달성할 수 없는, 교육의 본질에 대한 재고찰을 요구하는 과제입니다.
댓글을 남겨주세요
댓글을 남기려면 로그인 해야 합니다.