Rewire (공부)/Edutech 교육공학

AI와 교육 - 데이터 마이닝과 EDM 교육 데이터 마이닝

FRENCH GREY 2024. 12. 12. 22:42

데이터 마이닝 (Fouille de donnée / Data Mining):

  • 정의: 데이터를 기반으로 지식을 추출하는 과정
  • FR: (ECD)  Extraction de connaissance à partir de donnés  EN: Knowledge Discovery from Data (KDD)
  • 영어 용어: 데이터 마이닝 (DM)
  • 목적: 대규모 데이터 세트에서 새로운 정보를 발견하는 것
  • 데이터 마이닝의 응용 분야:
    마케팅, 생물정보학, 테러 방지... 그리고 교육.

교육 데이터 마이닝 (EDM : Educational Data Mining):

  • 목적: 학생과 그들의 학습 환경을 더 잘 이해하는 것
  • 특징:
    • 다양한 데이터 유형 활용: 로그 데이터, 현장 관찰, 설문지, 실험실에서의 생리학적 측정 데이터 등
    • 다양한 데이터 수준 고려
    • 심리측정학(psychométrie)에서 유래한 방법들을 함께 사용

교육 데이터 마이닝에서의 EDM 데이터 수집 방법:

  • 수업 중 데이터 수집 (대면 수업)
  • 교육 소프트웨어: EIAH (Environnements Informatiques pour l'Apprentissage Humain, 인간 학습을 위한 정보 환경), 지능형 튜터 시스템(Intelligent Tutoring Systems),  Serious Games (jeu sérieux) 등.
  • E-learning 플랫폼: Moodle 등.
  • MOOCs (대규모 공개 온라인 강좌): Coursera, EdX, Canvas 등.
  • 대규모 테스트:
    • 미국의 SAT 시험,
    • 프랑스의 CEDRE 데이터.

컴퓨터로 처리 가능한 데이터의 양이 급증하고 있음

새로 형성된 과학 커뮤니티:

  • 관련 학회: 2007년부터 시작된 EDM 학회.
  • 전문 학술지: Journal of Educational Data Mining.

교육 데이터 마이닝의 반복적 응용

(Application itérative de la fouille de données éducatives)

Romero, Ventura, Pechenizkiy & Baker(2010)

주요 개념

교육 데이터 마이닝은 여러 참여자(학생, 교사, 관리자 등)가 교육 시스템(예: 강의실, e-learning 플랫폼, 적응형 시스템)을 통해 생성한 데이터를 분석하고, 이를 반복적인 과정으로 활용하여 교육 환경을 개선하는 것을 목표로 함


구성 요소와 과정

  1. 사용자(Utilisateurs / Participants):
    • 학생, 교사, 교육 관리자, 교육 연구자 등.
    • 이들은 데이터를 생성하고 결과를 활용하거나 설계 및 관리에 기여.
  2. 교육 시스템(Systèmes éducatifs / Educational Systems):
    • 데이터가 생성되는 환경.
      • 예: 강의실, e-learning 플랫폼, 적응형 시스템(Intelligent Tutoring Systems), 설문조사 등.
    • 이 시스템은 학습자 데이터를 수집하고 학습 콘텐츠와 관련된 자료를 제공.
  3. 데이터 마이닝 기술(Technique de fouilles de donnés / Data Mining Techniques):
    • 데이터를 분석하고 모델링하는 데 사용되는 도구 및 기술.
      • 예: 통계, 데이터 시각화, 분류(Classification), 클러스터링(Clustering) 등.
  4. 데이터 흐름과 반복:
    • 데이터 제공: 교육 시스템에서 사용자의 상호작용 데이터 (données d'utilisation et d'interaction)를 수집(예: 사용 로그, 성적, 학습 활동).
    • 모델링 및 분석: 데이터를 기반으로 학습자와 학습 과정을 모델링하고 분석. (modélisent les apprenants et leur apprentissage)
    • 결과 제공: 분석 결과를 바탕으로 학습자와 관리자에게 인사이트, 추천, 개선 방향을 전달. (communiquer les résultats, fournisser des recommandantions)
    • 반복적 적용: 결과를 다시 교육 시스템에 피드백하여 지속적으로 개선. 

목적

  • 학습자의 행동과 학습 스타일을 모델링하고, 데이터 분석을 통해 맞춤형 학습 경험 제공.
  • 교육 시스템의 효율성을 개선하고 데이터 기반으로 교육적 의사 결정을 지원.

이 반복적 응용은 데이터가 수집-분석-적용-피드백 과정을 통해 지속적으로 학습 환경을 향상시키는 순환 구조로 이루어져 있음

 


기존 교육 연구와 비교한 교육 데이터 마이닝(EDM)의 장점

  1. 데이터 저장소의 존재 (Existence d’entrepôts de données):
    • 생태학적으로 유효 (Écologiquement valides):
      • 실제 교육 환경에서 생성된 데이터로, 실험실 환경이 아닌 자연스러운 상황에서의 데이터를 분석할 수 있음.
    • 접근 용이 (Faciles d’accès):
      • 연구자들이 쉽게 접근할 수 있는 대규모 데이터 저장소가 존재.
      • 예: LearnSphere, PSLC DataShop (Koedinger et al., 2010).
  2. 연구 복제의 용이성 (Réplication facilitée):
    • 동일한 소프트웨어와 다양한 컨텍스트에서 데이터를 재분석하여 연구 결과를 복제 가능.
      • 예: MORF (Gardner et al., 2018).
    • 학생 간 개별 차이 연구 (Étude des différences individuelles entre étudiants):
      • 학생들의 다양한 특성과 차이를 고려하여 맞춤형 분석 가능.

 

교육 데이터 마이닝(EDM)의 응용 분야 (Domaines d’application)

  1. 강좌 유지 및 개선 (Maintenance et amélioration du cours):
    • 교육 콘텐츠 관리: 강의 자료 및 콘텐츠의 질을 유지하고 개선.
    • 구조 최적화: 교육 자료의 순서 및 흐름을 개선.
    • 퀴즈 및 평가 도구 개선: 학습자 성과를 측정하는 도구의 효과성을 높임.
  2. 추천 생성 (Génération de recommandations):
    • 자원 추천: 학습자가 활용할 수 있는 추가 자료 추천.
    • 강좌 추천: 학습자의 관심사나 필요에 맞는 강좌 추천.
    • 학생 추천: 협업이나 학습 파트너로 적합한 학생 추천.
  3. 예측 (Prédiction):
    • 최종 성적 예측: 학생의 최종 성적을 예측하여 학습 지원.
    • 중도 탈락 예측: 학습 중단 가능성을 파악하고 사전 개입.
    • 학습 개념 습득 여부 판단: 학습자가 특정 개념을 이해했는지 확인.
  4. 학생 모델링 (Modélisation de l’étudiant):
    • 학생의 학습 스타일, 행동, 성과를 모델링하여 개인화된 학습 경험 제공.

 

SU – Master EdTech – EDM Intro – F. Bouchet 강의 요약