AI와 교육 - 로그 파일의 통계 분석 (2) 추론 통계

2024. 12. 17. 23:23Rewire (공부)/Edutech 교육공학

추론 통계 (Statistiques inférentielles)

1. 목표 (Objectif)

  • 분포 비교: 두 데이터 분포 간의 차이를 평가하거나, 변수들 간의 관계를 확인. comparaison de distribution
  • 예시:
    • "A반과 B반 학생들의 성적에는 차이가 없다."
    • 이는 **귀무가설hypothèse nulle (H0)**로 설정되며, 통계 검정을 통해 이를 기각하거나 수용.

2. 방법 (Méthode)

가설 검정 (Test d’hypothèse):

  • 귀무가설 hypothèse nulle (H0): 두 그룹 간 차이가 없거나 효과가 없음을 주장.
  • 연구에서 검증하고자 하는 기본 가설로, 보통 "차이가 없다"거나 "효과가 없다"고 가정.
  • 예: "A반과 B반의 평균 성적에 차이가 없다." "기계의 평균 출력은 100kg이다." "새로운 약물이 기존 약물보다 효과가 높지 않다." "제품 불량률이 5%이다."
  • 데이터를 분석하고 가설을 검증할 때 기본 가정 역할
  • 연구자가 증명하려는 가설(대립가설, H₁)과 반대되는 입장
  • 일반적으로 검증이 가능한 간단하고 구체적인 형태로 설정
  • 반드시 "차이가 없다"거나 "효과가 없다"고 가정할 필요는 없음. 이는 연구 목표와 상황에 따라 특정 값, 기준 상태, 또는 효과 크기와 관련된 다양한 형태로 설정
    • 대립가설 hypothèse altenative (H1): 두 그룹 간 차이가 존재하거나 효과가 있음을 주장.
    • 귀무가설이 틀렸다는 것을 보여주기 위해 설정하는 가설로, 보통 "차이가 있다"거나 "효과가 있다"고 주장합니다.
    • 예: "A반과 B반의 평균 성적에 차이가 있다."

p-value:

  • 데이터에서 관측된 결과가 귀무가설(H0) 하에서 발생할 확률.
  • 일반 기준: p≤0.05이면 H0를 기각 (5% 유의수준).
  • p>0.05: H0를 기각하지 않음.

결론:

  • p≤0.05 : 귀무가설 기각 → 그룹 간 차이가 있음.
  • p>0.05: 귀무가설 유지 → 그룹 간 차이가 없음.

 

3. 분석의 두 가지 범주 (2 catégories d’analyses)

기준 모수적 검정 (Paramétrique) 비모수적 검정 (Non-paramétrique)
기본 가정 데이터가 정규분포를 따른다고 가정
distribution normale requise
정규분포 가정을 하지 않음
pas de distribution normale requise
데이터 유형 비율 척도(R), 구간 척도(I) 명목 척도(N), 서열 척도(O), 구간 척도(I)
효율성 데이터가 조건을 충족하면 더 강력 조건 없이 다양한 데이터에 적용 가능
검정력 (Power) 적절한 조건에서 높은 검정력 제공 샘플 크기가 작거나 조건이 없을 때 유용
샘플 크기 일반적으로 큰 샘플 크기를 요구 작은 샘플 크기에서도 작동 가능
예시 - t-검정(Student t-test) - Mann-Whitney U 검정
  - ANOVA - Kruskal-Wallis 검정
  - 선형 회귀 - Chi-2 검정

 

모수적 검정 (Paramétriques)

특징:

  1. 가정:
    • 데이터가 정규분포를 따르며, 등분산성(각 그룹의 분산이 동일)을 만족해야 함.
  2. 활용 데이터 유형:
    • 비율 척도(R): 예) 학습 시간, 점수.
    • 구간 척도(I): 예) 온도, 등급 점수.
  3. 장점:
    • 데이터가 조건을 충족하면 검정력이 높음.
    • 복잡한 모델(선형 회귀, 다변량 분석) 적용 가능.

한계:

  • 정규성 또는 등분산성이 충족되지 않으면 결과의 신뢰도가 낮아질 수 있음.
  • 샘플 크기가 작을 때 불안정.

대표적인 예시:

  1. t-검정 (Student t-test): 두 그룹의 평균 비교.
  2. ANOVA: 세 그룹 이상의 평균 비교.
  3. 선형 회귀 (Linear Regression): 독립 변수와 종속 변수 간의 관계 모델링.

비모수적 검정 (Non-paramétriques)

특징:

  1. 가정:
    • 정규성 가정이 필요하지 않음.
    • 데이터의 분포가 비대칭적이거나 이상치가 있는 경우에도 유용.
  2. 활용 데이터 유형:
    • 명목 척도(N): 예) 성별, 학습 유형.
    • 서열 척도(O): 예) 만족도(낮음/중간/높음).
    • 일부 구간 척도(I): 예) 점수가 정규분포를 따르지 않는 경우.
  3. 장점:
    • 다양한 데이터 유형에 적용 가능.
    • 소규모 데이터나 비대칭적 데이터에서도 유용.

한계:

  • 일반적으로 모수적 검정보다 검정력이 낮음.
  • 복잡한 데이터 모델링에는 제한적.

대표적인 예시:

  1. Mann-Whitney U 검정: 두 그룹의 중앙값 비교.
  2. Kruskal-Wallis 검정: 세 그룹 이상의 중앙값 비교.
  3. Chi-2 검정: 두 명목형 변수 간 독립성 검정.

적용 및 비교 요약


상황 모수적 검정 권장 비모수적 검정 권장
데이터가 정규분포를 따를 때 Donnés normales
샘플 크기가 작을 때 petit taille d'échantillon
데이터에 이상치가 있을 때 présence de valeurs extêmes
변수가 명목형 또는 서열형일 때 Variables nominales ou ordinales

각 검정의 Intérêt (활용 가치)

  1. 모수적 검정의 Intérêt:
    • 데이터가 가정을 충족할 때, 더 높은 정확성과 효율성으로 가설 검정을 수행 가능.
    • 숫자형 데이터(점수, 시간 등)를 비교할 때
    • 복잡한 통계 모델(예: 회귀 분석) 구축에 필수적.
    • 문제: "A반과 B반의 평균 시험 점수가 차이가 있는가?"
    • 방법: t-검정 사용.
  2. 비모수적 검정의 Intérêt:
    • 다양한 데이터 유형과 조건에서 유연하게 적용 가능.
    • 작은 샘플 크기, 정규성을 만족하지 않는 경우에 특히 유용.
    • 범주형(예: 남/여) 또는 순서형(예: 낮음/중간/높음) 데이터를 비교할 때.
    • 문제: "A반과 B반의 학습 만족도(낮음/중간/높음)가 차이가 있는가?"
    • 방법: Mann-Whitney U 검정 사용.

결론

  • 모수적 검정은 데이터가 정규성 가정을 충족할 경우 더 강력하고 효율적.
  • 비모수적 검정은 데이터의 분포가 정규성을 따르지 않거나, 작은 샘플 크기 또는 명목형/서열형 변수와 같은 경우에 적합
  • 상황에 따라 적합한 방법을 선택하는 것이 중요
 

Paramétrique 또는 non-paramétrique 결정: Kolmogorov-Smirnov 테스트

**Kolmogorov-Smirnov 테스트(K-S 테스트)**는 데이터가 **정규분포(가우스 분포)**를 따르는지 확인하는 데 사용.

이 테스트는 귀무가설 H0과 대립가설 H1에 기반하여 정규성을 검증


Kolmogorov-Smirnov 테스트의 기본 가설

  1. 귀무가설 (H0): 데이터 분포가 정규분포를 따른다. 즉, 데이터는 Loi normale(정규분포)를 따름.
  2. 대립가설 (H1): 데이터 분포가 정규분포를 따르지 않는다.

Kolmogorov-Smirnov 테스트 결과 해석

  • p-값 : 귀무가설을 기각할지 여부를 결정하는 기준. 일반적으로 를 유의수준으로 설정

1. p < 0.05: 귀무가설 기각

  • 해석: 데이터가 정규분포를 따를 가능성이 낮음. 정규성이 없으므로 모수적 검정(Paramétrique tests)**을 사용할 수 없음.
  • 대처:
    • 평균 대신 **중앙값(Médiane)**을 사용하여 데이터를 설명.
    • 비모수적 검정(Non-paramétrique tests)을 사용해야 함.

2. p > 0.05 : 귀무가설 기각 불가능

  • 해석:
    • 데이터가 정규분포를 따를 가능성이 충분히 높음.
    • 모수적 검정(Paramétrique tests)을 사용할 수 있음.
    • 데이터를 **가우스 분포(Gaussienne)**로 설명 가능.
  • 대처:
    • 평균, 표준편차 등 정규성을 가정한 통계적 측정치를 사용할 수 있음.

Kolmogorov-Smirnov 테스트 적용 과정

  1. 데이터 준비: 데이터를 정렬하고 분석을 위한 준비를 
  2. 정규성 검정 수행: Excel에는 기본적으로 Kolmogorov-Smirnov 테스트 기능이 없. 제공된 외부 스크립트나 통계 소프트웨어(R, Python 등)를 사용해야 함
  3. 결과 해석:
    • p<0.05p : 정규성 Loi normale 을 따르지 않음 → 비모수적 검정.
    • p>0.05p : 정규성 Loi normale 을 따름 → 모수적 검정.

정규성을 따르지 않을 경우의 대처

  1. 데이터 변환 (Transformation des données):
    • 로그(log), 제곱근(sqrt) 변환 등으로 데이터를 정규화할 수 있음.
  2. 비모수적 검정 사용:
    • 데이터가 정규성을 따르지 않을 경우 Mann-Whitney, Kruskal-Wallis와 같은 비모수적 검정을 적용.

요약

  • Kolmogorov-Smirnov 테스트는 데이터가 정규분포를 따르는지 검증하여, 모수적 검정을 사용할 수 있는지 여부를 결정
  • p>0.05 : 정규성을 충족 → 모수적 검정 가능.
  • p<0.05: 정규성 없음 → 비모수적 검정 필요.
  • 정규성을 충족하지 못할 경우, 중앙값 중심의 설명 및 비모수적 접근이 필요

 


t-test indépendant (Independent t-test)

t-test indépendant는 두 독립적인 그룹의 평균을 비교하여 그룹 간 차이가 있는지 확인하는 모수적 검정입니다.

가정 (Hypothèses)

  1. 독립성:
    • 두 그룹의 데이터는 서로 독립적이어야 함. indépendants
    • 예: A반과 B반 학생들의 시험 점수.
  2. 정규성:
    • 각 그룹의 데이터가 정규분포 loi normale 를 따라야 함
    • 검증 방법:
      • Kolmogorov-Smirnov 테스트를 사용해 정규성을 확인.
      • p>0.05 라면 정규성을 충족.
  3. 분산의 동질성 (Homogénéité de la variance):
    • 분산의 동질성이란, 비교하고자 하는 두 개 이상의 그룹에서 데이터의 분산(변동 정도)이 통계적으로 동일하다는 가정. 이는 모수적 검정(예: t-검정, ANOVA 등)의 중요한 전제 조건 중 하나임
    • 검증 방법:
      • F-테스트 사용: =TEST.F(data1, data2)
      • 조건: 분산이 큰 그룹의 데이터를 먼저 입력.
      • p>0.05 라면 분산이 동일하다고 간주. → 모수적 검정 사용 가능.

분산이란?

  • 분산(Variance): 데이터 값들이 평균에서 얼마나 떨어져 있는지를 나타내는 척도.
    • 분산이 크면 데이터 값이 평균 주위에 넓게 퍼져 있다는 의미.
    • 분산이 작으면 데이터 값이 평균 주위에 밀집되어 있다는 의미

 


검정 유형

  • 양측검정 (Test bilatéral):
    • 그룹 간 평균에 차이가 있는지 여부를 검정.
    • 일반적으로 많이 사용됨.
    • 귀무가설 H0: 두 그룹 평균이 동일하다.
    • 대립가설 H1: 두 그룹 평균이 다르다.
  • 단측검정 (Test unilatéral):
    • 한 그룹의 평균이 다른 그룹보다 크거나 작을지 특정 방향성을 가정.
    • 귀무가설 H0: μ1≤μ2 (또는 μ1≥μ2).
    • 대립가설 H1: μ1>μ2(또는 μ1<μ2).

t-검정 적용 조건

  1. 정규성 충족 여부:
    • Kolmogorov-Smirnov 테스트에서 p>0.05일 경우 t-test 사용 가능.
  2. 분산 동질성 확인:
    • F-테스트에서 p>0.05일 경우 t-test 진행.
    • p<0.05일 경우, 분산이 동일하지 않으므로 수정된 t-test(예: Welch의 t-test)를 사용해야 함.

Excel에서 수행

  1. t-test 함수:
    =TEST.T(data1, data2, 2, 2)
    • data1, data2: 비교할 데이터 범위.
    • 2: 양측검정을 의미. test bilatéral
    • 2: 분산이 동일한 그룹을 가정. 
  2. F-테스트 함수:
    =TEST.F(data1, data2)
    • 분산이 동일한지 확인하기 위한 단계.
  3. T-test studante(data 1, data 2, mode, type)

결과 해석

  1. t-값과 p-값 확인:
    • p≤0.05: 귀무가설 기각 → 두 그룹의 평균은 유의미하게 다름.
    • p>0.05: 귀무가설 유지 → 두 그룹의 평균 차이가 통계적으로 유의하지 않음.
  2. 결론:
    • p≤0.05: 예) A반과 B반 학생들의 시험 점수 차이가 존재함.
    • p>0.05: 예) A반과 B반 학생들의 시험 점수 차이가 없음.

요약

  • t-test의 사용 조건:
    1. 두 그룹이 독립적이어야 함.
    2. 데이터가 정규분포를 따라야 함 (Kolmogorov-Smirnov).
    3. 분산이 동일해야 함 (F-테스트).
  • 결과 해석:
    • p≤0.05: 그룹 간 평균 차이가 유의미함.
    • p>0.05: 그룹 간 평균 차이가 유의하지 않음.

이 검정은 그룹 간 차이를 평가하는 가장 기본적이면서 강력한 도구 중 하나로, 통계적 분석에서 자주 사용됨

 


t-test apparié (Paired t-test)

t-test apparié는 동일한 그룹의 두 측정값(예: 사전/사후 테스트, 한 개인의 전/후 상태)을 비교할 때 사용하는 모수적 검정

사전-사후 변화 또는 두 조건 간 차이가 유의미한지

가정 (Hypothèses)

  1. 동일한 개인:
    • 두 데이터셋(측정값)은 동일한 개인 또는 동일한 대상에서 수집된 결과
    • 예: 같은 학생의 사전 시험 점수와 사후 시험 점수 비교.
  2. 정규성:
    • 데이터 분포가 정규분포 le loi normale를 따라야 합니다.
    • 검증 방법: Kolmogorov-Smirnov 테스트를 사용해 정규성을 확인 (p>0.05일 때 정규성 충족).
  3. 분산의 동질성:
    • 두 분포의 분산이 동일해야 합니다.
    • 검증 방법: F-테스트 사용: =TEST.F(data1, data2)
      • 분산이 큰 데이터를 첫 번째 인자로 입력.
      • p>0.05: 분산 동질성 충족.

t-test apparié 사용 예

예시: 사전-사후 테스트

  • 귀무가설 (H0): 사전 테스트와 사후 테스트 점수 간에 차이가 없다.
  • 대립가설 (H1): 사후 테스트 점수가 사전 테스트 점수보다 높거나 낮다.

Excel에서 t-test apparié 수행

  • 함수: =TEST.STUDENT(data1, data2, mode, type)
    • data1, data2: 비교할 두 데이터 범위.
    • mode:
      • 1: 단측검정 (한쪽 방향 가설).
      • 2: 양측검정 (차이가 있는지 여부만 확인).
    • type: 2 (Paired t-test).

단측검정 vs 양측검정

  • 단측검정 (Mode = 1):
    데이터가 특정 방향(증가 또는 감소)으로 변했는지 확인
    • 예: "사후 테스트 점수가 사전 테스트 점수보다 높다."
  • 양측검정 (Mode = 2):
    데이터 간 차이 여부만 확인.
    • 예: "사전 테스트와 사후 테스트 점수가 다르다."
    • 일반적으로 양측검정이 더 자주 사용됩니다.

결과 해석

  1. p-값 확인:
    • p≤0.05: 귀무가설 기각 → 두 그룹 평균 간에 유의미한 차이가 있음.
    • p>0.05p 귀무가설 유지 → 두 그룹 평균 간에 유의미한 차이가 없음.
  2. 예시 결과:
    • p=0.03: 사전 테스트와 사후 테스트 점수에 유의미한 차이가 있음.
    • p=0.10: 사전 테스트와 사후 테스트 점수에 차이가 없음.

t-test apparié 사용의 의미

  • 사전/사후 변화 확인:
    같은 그룹에서 특정 개입(예: 교육 프로그램, 치료 등)이 영향을 미쳤는지 평가.
  • 효과의 방향 분석:
    단측검정을 통해 변화가 특정 방향으로 일어났는지 평가 가능.

요약

  • t-test apparié는 같은 그룹의 두 측정값을 비교할 때 사용.
  • 주요 가정:
    1. 동일한 개인 또는 대상에서 수집된 두 데이터셋.
    2. 데이터가 정규분포를 따름.
    3. 분산 동질성 충족.
  • Excel에서 수행:
    • =TEST.STUDENT(data1, data2, mode, type)
      • mode=2: 양측검정.
      • type=2: t-test apparié.

t-test apparié는 개입이나 조건의 변화에 따른 효과를 평가하는 데 매우 유용하며, 결과의 해석은 p-값을 기반으로 이루어진다.


두 개 이상의 분포를 비교하려면? (3개 이상의 분포)

1. t-검정을 여러 번 사용하는 문제점

  • t-검정은 2개의 분포를 비교할 때 적합
  • 하지만 3개 이상의 분포를 비교하려고 t-검정을 여러 번 사용하면, 다음과 같은 문제가 발생
  1. 통계적 검정력 감소 (Statistical Power 감소): diminuation de la puissance statistque du test
    • t-검정을 여러 번 반복하면 **유의수준(p=0.05)**이 왜곡됨.
    • 잘못된 결론(즉, 귀무가설을 잘못 기각하거나 유지하는 경우)이 나올 가능성이 높아짐
  2. Bonferroni 보정 (Correction de Bonferroni):
    • 이를 해결하기 위해, 각 검정의 유의수준을 조정. besoin d'adapter la valeur critique
    • 0.05/nombre_test- correction de bonferroni

2. 3개 이상의 분포 비교: ANOVA

ANOVA (Analysis of Variance)는 3개 이상의 분포를 비교하는 데 사용되는 대표적인 모수적 검정.

  • 가정:
    1. 데이터는 정규분포를 따라야 함.
    2. 분산이 동질적이어야 함.
  • 목적:
    • 그룹 간 평균의 차이를 평가.
    • 예: A반, B반, C반의 시험 점수가 유의미하게 다른지 확인.
  • Excel에서 ANOVA:
    Excel에는 기본적으로 단일 요인 ANOVA가 제공.
    • 데이터 → 데이터 분석 → 단일 요인 ANOVA 선택.

3. 비모수적 검정: Kruskal-Wallis

Kruskal-Wallis 검정ANOVA의 비모수적 대안으로, 데이터가 정규성을 충족하지 않거나 서열 데이터일 때 사용.

  • 특징:
    1. 데이터를 중앙값 중심으로 분석.
    2. 정규성을 가정하지 않아도 됨.
    3. 3개 이상의 분포 비교에 적합.
  • 예:
    A반, B반, C반 학생의 만족도(서열형 데이터: "낮음", "중간", "높음")를 비교.

4. 요약: 2개 vs 3개 이상의 분포 비교


분포 개수  모수적 검정 비모수적 검정
2개 분포 t-검정 (T-test) Mann-Whitney U 검정
3개 이상 분포 ANOVA Kruskal-Wallis 검정

비모수적 검정과 중앙값 비교의 활용 가치

  1. 정규성을 가정할 필요가 없음.
  2. 극단값(outliers)이나 비대칭 분포가 있어도 효과적.
  3. 서열형 변수나 구간형 변수 모두 적용 가능.
  • 서열형 또는 정규성을 위반하는 구간형 데이터를 비교할 때, 평균 대신 중앙값을 비교해야 함
  • 적절한 검정:
    • 2개 분포: Mann-Whitney U.
    • 3개 이상 분포: Kruskal-Wallis.
  • 이러한 방법은 데이터의 특성에 적합하며, 더 신뢰할 수 있는 결과를 제공

 

5. Excel에서 비모수적 검정

  • Excel 기본 기능에는 Mann-WhitneyKruskal-Wallis 같은 비모수적 검정이 없음.
  • Real-Statistics 또는 XlsStats와 같은 플러그인이나, R, Python 같은 통계 전용 소프트웨어를 사용하는 것이 필요.

 

결론

  1. 2개의 분포 비교:
    • 모수적 검정: t-검정.
    • 비모수적 검정: Mann-Whitney.
  2. 3개 이상의 분포 비교:
    • 모수적 검정: ANOVA.
    • 비모수적 검정: Kruskal-Wallis.
  3. 주의점:
    • t-검정을 반복적으로 사용하면 잘못된 결론이 나올 수 있으므로, ANOVA나 Kruskal-Wallis와 같은 적절한 검정을 사용하는 것이 중요
    • 비모수적 검정은 데이터가 정규분포를 따르지 않을 때 적합

비모수적 검정: 명목형 데이터에 대한 Chi-제곱(χ²) 검정

Chi-제곱(χ²) 검정은 명목형(Nominal) 데이터에서 두 변수 간의 관계를 분석하거나, 관측된 데이터와 기대값 간의 차이를 확인하는 데 사용되는 비모수적 검정임.


적용 시나리오

  1. 독립성 검정 (Test d’indépendance):
    • 두 범주형 변수 간의 독립 여부를 확인.
    • 예: 주중과 주말 간의 학습 자료 접근 비율 차이가 있는지 확인.
    • 귀무가설(H₀): "주중과 주말의 자료 접근 비율은 차이가 없다."
  2. 적합도 검정 (Test d’ajustement):
    • 관측값 données observées이 특정 분포(예: 기대값 données attendues)와 얼마나 일치하는지 평가.
    • 예: 설문 응답 비율이 예상 비율과 일치하는지 확인.

Chi-제곱 검정의 기본 가정

  1. 관측값:
    • 데이터는 범주형 변수에서 나옴
    • 예: 주중(Weekdays) 또는 주말(Weekend)과 같은 분류.
  2. 기대값 조건:
    • 기대값 테이블의 각 값이 5 이상이어야 함.
    • E=행 합계×열 합계 / 전체 합계
  3. 샘플 독립성:
    • 각 관측값은 서로 독립적이어야 합니다.

Excel에서 Chi-제곱 검정 수행

  1. 데이터 준비:
    • 관측값(Observed Values)과 기대값(Expected Values) 테이블 생성.
  2. 함수 사용:
    • =TEST.KHIDEUX(donnees_observees, donnees_attendues)
      • donnees_observees: 관측된 값의 범위.
      • donnees_attendues: 기대된 값의 범위.
  3. 결과 해석:
    • p≤0.05: 귀무가설 기각 → 변수 간 관계가 있음.
    • p>0.05: 귀무가설 유지 → 변수 간 관계 없음.

결과 해석 예시

문제: 주중과 주말의 자료 접근 비율 차이가 있는가?

  1. 관측값:
    • 주중: 50명, 주말: 30명.
  2. 기대값 계산:
    • 총 80명 중 주중/주말 비율이 동일하다고 가정하면:
      • 주중 기대값 = 80/2.
      • 주말 기대값 = 80/2.
  3. 검정 결과:
    • Chi-제곱 검정 수행 후 p=0.03 → 귀무가설 기각.
    • 결론: 주중과 주말의 자료 접근 비율에 유의미한 차이가 있음.

요약

  • Chi-제곱 검정은 명목형 데이터에서 범주 간 비율 또는 관계를 분석하는 데 사용
  • Excel에서 수행: =TEST.KHIDEUX(관측값 범위, 기대값 범위).
  • 결과 해석:
    • p≤0.05: 변수 간 관계 존재.
    • p>0.05: 변수 간 관계 없음.

이 검정은 두 변수 간의 독립성을 평가하거나, 관측값과 기대값 간 차이를 분석하는 데 효과적