2024. 12. 17. 23:23ㆍRewire (공부)/Edutech 교육공학
추론 통계 (Statistiques inférentielles)
1. 목표 (Objectif)
- 분포 비교: 두 데이터 분포 간의 차이를 평가하거나, 변수들 간의 관계를 확인. comparaison de distribution
- 예시:
- "A반과 B반 학생들의 성적에는 차이가 없다."
- 이는 **귀무가설hypothèse nulle (H0)**로 설정되며, 통계 검정을 통해 이를 기각하거나 수용.
2. 방법 (Méthode)
가설 검정 (Test d’hypothèse):
- 귀무가설 hypothèse nulle (H0): 두 그룹 간 차이가 없거나 효과가 없음을 주장.
- 연구에서 검증하고자 하는 기본 가설로, 보통 "차이가 없다"거나 "효과가 없다"고 가정.
- 예: "A반과 B반의 평균 성적에 차이가 없다." "기계의 평균 출력은 100kg이다." "새로운 약물이 기존 약물보다 효과가 높지 않다." "제품 불량률이 5%이다."
- 데이터를 분석하고 가설을 검증할 때 기본 가정 역할
- 연구자가 증명하려는 가설(대립가설, H₁)과 반대되는 입장
- 일반적으로 검증이 가능한 간단하고 구체적인 형태로 설정
- 반드시 "차이가 없다"거나 "효과가 없다"고 가정할 필요는 없음. 이는 연구 목표와 상황에 따라 특정 값, 기준 상태, 또는 효과 크기와 관련된 다양한 형태로 설정
-
- 대립가설 hypothèse altenative (H1): 두 그룹 간 차이가 존재하거나 효과가 있음을 주장.
- 귀무가설이 틀렸다는 것을 보여주기 위해 설정하는 가설로, 보통 "차이가 있다"거나 "효과가 있다"고 주장합니다.
- 예: "A반과 B반의 평균 성적에 차이가 있다."
p-value:
- 데이터에서 관측된 결과가 귀무가설(H0) 하에서 발생할 확률.
- 일반 기준: p≤0.05이면 H0를 기각 (5% 유의수준).
- p>0.05: H0를 기각하지 않음.
결론:
- p≤0.05 : 귀무가설 기각 → 그룹 간 차이가 있음.
- p>0.05: 귀무가설 유지 → 그룹 간 차이가 없음.
3. 분석의 두 가지 범주 (2 catégories d’analyses)
기준 | 모수적 검정 (Paramétrique) | 비모수적 검정 (Non-paramétrique) |
기본 가정 | 데이터가 정규분포를 따른다고 가정 distribution normale requise |
정규분포 가정을 하지 않음 pas de distribution normale requise |
데이터 유형 | 비율 척도(R), 구간 척도(I) | 명목 척도(N), 서열 척도(O), 구간 척도(I) |
효율성 | 데이터가 조건을 충족하면 더 강력 | 조건 없이 다양한 데이터에 적용 가능 |
검정력 (Power) | 적절한 조건에서 높은 검정력 제공 | 샘플 크기가 작거나 조건이 없을 때 유용 |
샘플 크기 | 일반적으로 큰 샘플 크기를 요구 | 작은 샘플 크기에서도 작동 가능 |
예시 | - t-검정(Student t-test) | - Mann-Whitney U 검정 |
- ANOVA | - Kruskal-Wallis 검정 | |
- 선형 회귀 | - Chi-2 검정 |
모수적 검정 (Paramétriques)
특징:
- 가정:
- 데이터가 정규분포를 따르며, 등분산성(각 그룹의 분산이 동일)을 만족해야 함.
- 활용 데이터 유형:
- 비율 척도(R): 예) 학습 시간, 점수.
- 구간 척도(I): 예) 온도, 등급 점수.
- 장점:
- 데이터가 조건을 충족하면 검정력이 높음.
- 복잡한 모델(선형 회귀, 다변량 분석) 적용 가능.
한계:
- 정규성 또는 등분산성이 충족되지 않으면 결과의 신뢰도가 낮아질 수 있음.
- 샘플 크기가 작을 때 불안정.
대표적인 예시:
- t-검정 (Student t-test): 두 그룹의 평균 비교.
- ANOVA: 세 그룹 이상의 평균 비교.
- 선형 회귀 (Linear Regression): 독립 변수와 종속 변수 간의 관계 모델링.
비모수적 검정 (Non-paramétriques)
특징:
- 가정:
- 정규성 가정이 필요하지 않음.
- 데이터의 분포가 비대칭적이거나 이상치가 있는 경우에도 유용.
- 활용 데이터 유형:
- 명목 척도(N): 예) 성별, 학습 유형.
- 서열 척도(O): 예) 만족도(낮음/중간/높음).
- 일부 구간 척도(I): 예) 점수가 정규분포를 따르지 않는 경우.
- 장점:
- 다양한 데이터 유형에 적용 가능.
- 소규모 데이터나 비대칭적 데이터에서도 유용.
한계:
- 일반적으로 모수적 검정보다 검정력이 낮음.
- 복잡한 데이터 모델링에는 제한적.
대표적인 예시:
- Mann-Whitney U 검정: 두 그룹의 중앙값 비교.
- Kruskal-Wallis 검정: 세 그룹 이상의 중앙값 비교.
- Chi-2 검정: 두 명목형 변수 간 독립성 검정.
적용 및 비교 요약
상황 | 모수적 검정 권장 | 비모수적 검정 권장 |
데이터가 정규분포를 따를 때 Donnés normales | ✅ | ❌ |
샘플 크기가 작을 때 petit taille d'échantillon | ❌ | ✅ |
데이터에 이상치가 있을 때 présence de valeurs extêmes | ❌ | ✅ |
변수가 명목형 또는 서열형일 때 Variables nominales ou ordinales | ❌ | ✅ |
각 검정의 Intérêt (활용 가치)
- 모수적 검정의 Intérêt:
- 데이터가 가정을 충족할 때, 더 높은 정확성과 효율성으로 가설 검정을 수행 가능.
- 숫자형 데이터(점수, 시간 등)를 비교할 때
- 복잡한 통계 모델(예: 회귀 분석) 구축에 필수적.
- 문제: "A반과 B반의 평균 시험 점수가 차이가 있는가?"
- 방법: t-검정 사용.
- 비모수적 검정의 Intérêt:
- 다양한 데이터 유형과 조건에서 유연하게 적용 가능.
- 작은 샘플 크기, 정규성을 만족하지 않는 경우에 특히 유용.
- 범주형(예: 남/여) 또는 순서형(예: 낮음/중간/높음) 데이터를 비교할 때.
- 문제: "A반과 B반의 학습 만족도(낮음/중간/높음)가 차이가 있는가?"
- 방법: Mann-Whitney U 검정 사용.
결론
- 모수적 검정은 데이터가 정규성 가정을 충족할 경우 더 강력하고 효율적.
- 비모수적 검정은 데이터의 분포가 정규성을 따르지 않거나, 작은 샘플 크기 또는 명목형/서열형 변수와 같은 경우에 적합
- 상황에 따라 적합한 방법을 선택하는 것이 중요
Paramétrique 또는 non-paramétrique 결정: Kolmogorov-Smirnov 테스트
**Kolmogorov-Smirnov 테스트(K-S 테스트)**는 데이터가 **정규분포(가우스 분포)**를 따르는지 확인하는 데 사용.
이 테스트는 귀무가설 H0과 대립가설 H1에 기반하여 정규성을 검증
Kolmogorov-Smirnov 테스트의 기본 가설
- 귀무가설 (H0): 데이터 분포가 정규분포를 따른다. 즉, 데이터는 Loi normale(정규분포)를 따름.
- 대립가설 (H1): 데이터 분포가 정규분포를 따르지 않는다.
Kolmogorov-Smirnov 테스트 결과 해석
- p-값 : 귀무가설을 기각할지 여부를 결정하는 기준. 일반적으로 를 유의수준으로 설정
1. p < 0.05: 귀무가설 기각
- 해석: 데이터가 정규분포를 따를 가능성이 낮음. 정규성이 없으므로 모수적 검정(Paramétrique tests)**을 사용할 수 없음.
- 대처:
- 평균 대신 **중앙값(Médiane)**을 사용하여 데이터를 설명.
- 비모수적 검정(Non-paramétrique tests)을 사용해야 함.
2. p > 0.05 : 귀무가설 기각 불가능
- 해석:
- 데이터가 정규분포를 따를 가능성이 충분히 높음.
- 모수적 검정(Paramétrique tests)을 사용할 수 있음.
- 데이터를 **가우스 분포(Gaussienne)**로 설명 가능.
- 대처:
- 평균, 표준편차 등 정규성을 가정한 통계적 측정치를 사용할 수 있음.
Kolmogorov-Smirnov 테스트 적용 과정
- 데이터 준비: 데이터를 정렬하고 분석을 위한 준비를
- 정규성 검정 수행: Excel에는 기본적으로 Kolmogorov-Smirnov 테스트 기능이 없. 제공된 외부 스크립트나 통계 소프트웨어(R, Python 등)를 사용해야 함
- 결과 해석:
- p<0.05p : 정규성 Loi normale 을 따르지 않음 → 비모수적 검정.
- p>0.05p : 정규성 Loi normale 을 따름 → 모수적 검정.
정규성을 따르지 않을 경우의 대처
- 데이터 변환 (Transformation des données):
- 로그(log), 제곱근(sqrt) 변환 등으로 데이터를 정규화할 수 있음.
- 비모수적 검정 사용:
- 데이터가 정규성을 따르지 않을 경우 Mann-Whitney, Kruskal-Wallis와 같은 비모수적 검정을 적용.
요약
- Kolmogorov-Smirnov 테스트는 데이터가 정규분포를 따르는지 검증하여, 모수적 검정을 사용할 수 있는지 여부를 결정
- p>0.05 : 정규성을 충족 → 모수적 검정 가능.
- p<0.05: 정규성 없음 → 비모수적 검정 필요.
- 정규성을 충족하지 못할 경우, 중앙값 중심의 설명 및 비모수적 접근이 필요
t-test indépendant (Independent t-test)
t-test indépendant는 두 독립적인 그룹의 평균을 비교하여 그룹 간 차이가 있는지 확인하는 모수적 검정입니다.
가정 (Hypothèses)
- 독립성:
- 두 그룹의 데이터는 서로 독립적이어야 함. indépendants
- 예: A반과 B반 학생들의 시험 점수.
- 정규성:
- 각 그룹의 데이터가 정규분포 loi normale 를 따라야 함
- 검증 방법:
- Kolmogorov-Smirnov 테스트를 사용해 정규성을 확인.
- p>0.05 라면 정규성을 충족.
- 분산의 동질성 (Homogénéité de la variance):
- 분산의 동질성이란, 비교하고자 하는 두 개 이상의 그룹에서 데이터의 분산(변동 정도)이 통계적으로 동일하다는 가정. 이는 모수적 검정(예: t-검정, ANOVA 등)의 중요한 전제 조건 중 하나임
- 검증 방법:
- F-테스트 사용: =TEST.F(data1, data2)
- 조건: 분산이 큰 그룹의 데이터를 먼저 입력.
- p>0.05 라면 분산이 동일하다고 간주. → 모수적 검정 사용 가능.
분산이란?
- 분산(Variance): 데이터 값들이 평균에서 얼마나 떨어져 있는지를 나타내는 척도.
- 분산이 크면 데이터 값이 평균 주위에 넓게 퍼져 있다는 의미.
- 분산이 작으면 데이터 값이 평균 주위에 밀집되어 있다는 의미
검정 유형
- 양측검정 (Test bilatéral):
- 그룹 간 평균에 차이가 있는지 여부를 검정.
- 일반적으로 많이 사용됨.
- 귀무가설 H0: 두 그룹 평균이 동일하다.
- 대립가설 H1: 두 그룹 평균이 다르다.
- 단측검정 (Test unilatéral):
- 한 그룹의 평균이 다른 그룹보다 크거나 작을지 특정 방향성을 가정.
- 귀무가설 H0: μ1≤μ2 (또는 μ1≥μ2).
- 대립가설 H1: μ1>μ2(또는 μ1<μ2).
t-검정 적용 조건
- 정규성 충족 여부:
- Kolmogorov-Smirnov 테스트에서 p>0.05일 경우 t-test 사용 가능.
- 분산 동질성 확인:
- F-테스트에서 p>0.05일 경우 t-test 진행.
- p<0.05일 경우, 분산이 동일하지 않으므로 수정된 t-test(예: Welch의 t-test)를 사용해야 함.
Excel에서 수행
- t-test 함수:
=TEST.T(data1, data2, 2, 2)- data1, data2: 비교할 데이터 범위.
- 2: 양측검정을 의미. test bilatéral
- 2: 분산이 동일한 그룹을 가정.
- F-테스트 함수:
=TEST.F(data1, data2)- 분산이 동일한지 확인하기 위한 단계.
- T-test studante(data 1, data 2, mode, type)
결과 해석
- t-값과 p-값 확인:
- p≤0.05: 귀무가설 기각 → 두 그룹의 평균은 유의미하게 다름.
- p>0.05: 귀무가설 유지 → 두 그룹의 평균 차이가 통계적으로 유의하지 않음.
- 결론:
- p≤0.05: 예) A반과 B반 학생들의 시험 점수 차이가 존재함.
- p>0.05: 예) A반과 B반 학생들의 시험 점수 차이가 없음.
요약
- t-test의 사용 조건:
- 두 그룹이 독립적이어야 함.
- 데이터가 정규분포를 따라야 함 (Kolmogorov-Smirnov).
- 분산이 동일해야 함 (F-테스트).
- 결과 해석:
- p≤0.05: 그룹 간 평균 차이가 유의미함.
- p>0.05: 그룹 간 평균 차이가 유의하지 않음.
이 검정은 그룹 간 차이를 평가하는 가장 기본적이면서 강력한 도구 중 하나로, 통계적 분석에서 자주 사용됨
t-test apparié (Paired t-test)
t-test apparié는 동일한 그룹의 두 측정값(예: 사전/사후 테스트, 한 개인의 전/후 상태)을 비교할 때 사용하는 모수적 검정
사전-사후 변화 또는 두 조건 간 차이가 유의미한지
가정 (Hypothèses)
- 동일한 개인:
- 두 데이터셋(측정값)은 동일한 개인 또는 동일한 대상에서 수집된 결과
- 예: 같은 학생의 사전 시험 점수와 사후 시험 점수 비교.
- 정규성:
- 데이터 분포가 정규분포 le loi normale를 따라야 합니다.
- 검증 방법: Kolmogorov-Smirnov 테스트를 사용해 정규성을 확인 (p>0.05일 때 정규성 충족).
- 분산의 동질성:
- 두 분포의 분산이 동일해야 합니다.
- 검증 방법: F-테스트 사용: =TEST.F(data1, data2)
- 분산이 큰 데이터를 첫 번째 인자로 입력.
- p>0.05: 분산 동질성 충족.
t-test apparié 사용 예
예시: 사전-사후 테스트
- 귀무가설 (H0): 사전 테스트와 사후 테스트 점수 간에 차이가 없다.
- 대립가설 (H1): 사후 테스트 점수가 사전 테스트 점수보다 높거나 낮다.
Excel에서 t-test apparié 수행
- 함수: =TEST.STUDENT(data1, data2, mode, type)
- data1, data2: 비교할 두 데이터 범위.
- mode:
- 1: 단측검정 (한쪽 방향 가설).
- 2: 양측검정 (차이가 있는지 여부만 확인).
- type: 2 (Paired t-test).
단측검정 vs 양측검정
- 단측검정 (Mode = 1):
데이터가 특정 방향(증가 또는 감소)으로 변했는지 확인
- 예: "사후 테스트 점수가 사전 테스트 점수보다 높다."
- 양측검정 (Mode = 2):
데이터 간 차이 여부만 확인.
- 예: "사전 테스트와 사후 테스트 점수가 다르다."
- 일반적으로 양측검정이 더 자주 사용됩니다.
결과 해석
- p-값 확인:
- p≤0.05: 귀무가설 기각 → 두 그룹 평균 간에 유의미한 차이가 있음.
- p>0.05p 귀무가설 유지 → 두 그룹 평균 간에 유의미한 차이가 없음.
- 예시 결과:
- p=0.03: 사전 테스트와 사후 테스트 점수에 유의미한 차이가 있음.
- p=0.10: 사전 테스트와 사후 테스트 점수에 차이가 없음.
t-test apparié 사용의 의미
- 사전/사후 변화 확인:
같은 그룹에서 특정 개입(예: 교육 프로그램, 치료 등)이 영향을 미쳤는지 평가. - 효과의 방향 분석:
단측검정을 통해 변화가 특정 방향으로 일어났는지 평가 가능.
요약
- t-test apparié는 같은 그룹의 두 측정값을 비교할 때 사용.
- 주요 가정:
- 동일한 개인 또는 대상에서 수집된 두 데이터셋.
- 데이터가 정규분포를 따름.
- 분산 동질성 충족.
- Excel에서 수행:
- =TEST.STUDENT(data1, data2, mode, type)
- mode=2: 양측검정.
- type=2: t-test apparié.
- =TEST.STUDENT(data1, data2, mode, type)
t-test apparié는 개입이나 조건의 변화에 따른 효과를 평가하는 데 매우 유용하며, 결과의 해석은 p-값을 기반으로 이루어진다.
두 개 이상의 분포를 비교하려면? (3개 이상의 분포)
1. t-검정을 여러 번 사용하는 문제점
- t-검정은 2개의 분포를 비교할 때 적합
- 하지만 3개 이상의 분포를 비교하려고 t-검정을 여러 번 사용하면, 다음과 같은 문제가 발생
- 통계적 검정력 감소 (Statistical Power 감소): diminuation de la puissance statistque du test
- t-검정을 여러 번 반복하면 **유의수준(p=0.05)**이 왜곡됨.
- 잘못된 결론(즉, 귀무가설을 잘못 기각하거나 유지하는 경우)이 나올 가능성이 높아짐
- Bonferroni 보정 (Correction de Bonferroni):
- 이를 해결하기 위해, 각 검정의 유의수준을 조정. besoin d'adapter la valeur critique
- 0.05/nombre_test- correction de bonferroni
2. 3개 이상의 분포 비교: ANOVA
ANOVA (Analysis of Variance)는 3개 이상의 분포를 비교하는 데 사용되는 대표적인 모수적 검정.
- 가정:
- 데이터는 정규분포를 따라야 함.
- 분산이 동질적이어야 함.
- 목적:
- 그룹 간 평균의 차이를 평가.
- 예: A반, B반, C반의 시험 점수가 유의미하게 다른지 확인.
- Excel에서 ANOVA:
Excel에는 기본적으로 단일 요인 ANOVA가 제공.- 데이터 → 데이터 분석 → 단일 요인 ANOVA 선택.
3. 비모수적 검정: Kruskal-Wallis
Kruskal-Wallis 검정은 ANOVA의 비모수적 대안으로, 데이터가 정규성을 충족하지 않거나 서열 데이터일 때 사용.
- 특징:
- 데이터를 중앙값 중심으로 분석.
- 정규성을 가정하지 않아도 됨.
- 3개 이상의 분포 비교에 적합.
- 예:
A반, B반, C반 학생의 만족도(서열형 데이터: "낮음", "중간", "높음")를 비교.
4. 요약: 2개 vs 3개 이상의 분포 비교
분포 개수 | 모수적 검정 | 비모수적 검정 |
2개 분포 | t-검정 (T-test) | Mann-Whitney U 검정 |
3개 이상 분포 | ANOVA | Kruskal-Wallis 검정 |
비모수적 검정과 중앙값 비교의 활용 가치
- 정규성을 가정할 필요가 없음.
- 극단값(outliers)이나 비대칭 분포가 있어도 효과적.
- 서열형 변수나 구간형 변수 모두 적용 가능.
- 서열형 또는 정규성을 위반하는 구간형 데이터를 비교할 때, 평균 대신 중앙값을 비교해야 함
- 적절한 검정:
- 2개 분포: Mann-Whitney U.
- 3개 이상 분포: Kruskal-Wallis.
- 이러한 방법은 데이터의 특성에 적합하며, 더 신뢰할 수 있는 결과를 제공
5. Excel에서 비모수적 검정
- Excel 기본 기능에는 Mann-Whitney나 Kruskal-Wallis 같은 비모수적 검정이 없음.
- Real-Statistics 또는 XlsStats와 같은 플러그인이나, R, Python 같은 통계 전용 소프트웨어를 사용하는 것이 필요.
결론
- 2개의 분포 비교:
- 모수적 검정: t-검정.
- 비모수적 검정: Mann-Whitney.
- 3개 이상의 분포 비교:
- 모수적 검정: ANOVA.
- 비모수적 검정: Kruskal-Wallis.
- 주의점:
- t-검정을 반복적으로 사용하면 잘못된 결론이 나올 수 있으므로, ANOVA나 Kruskal-Wallis와 같은 적절한 검정을 사용하는 것이 중요
- 비모수적 검정은 데이터가 정규분포를 따르지 않을 때 적합
비모수적 검정: 명목형 데이터에 대한 Chi-제곱(χ²) 검정
Chi-제곱(χ²) 검정은 명목형(Nominal) 데이터에서 두 변수 간의 관계를 분석하거나, 관측된 데이터와 기대값 간의 차이를 확인하는 데 사용되는 비모수적 검정임.
적용 시나리오
- 독립성 검정 (Test d’indépendance):
- 두 범주형 변수 간의 독립 여부를 확인.
- 예: 주중과 주말 간의 학습 자료 접근 비율 차이가 있는지 확인.
- 귀무가설(H₀): "주중과 주말의 자료 접근 비율은 차이가 없다."
- 적합도 검정 (Test d’ajustement):
- 관측값 données observées이 특정 분포(예: 기대값 données attendues)와 얼마나 일치하는지 평가.
- 예: 설문 응답 비율이 예상 비율과 일치하는지 확인.
Chi-제곱 검정의 기본 가정
- 관측값:
- 데이터는 범주형 변수에서 나옴
- 예: 주중(Weekdays) 또는 주말(Weekend)과 같은 분류.
- 기대값 조건:
- 기대값 테이블의 각 값이 5 이상이어야 함.
- E=행 합계×열 합계 / 전체 합계
- 샘플 독립성:
- 각 관측값은 서로 독립적이어야 합니다.
Excel에서 Chi-제곱 검정 수행
- 데이터 준비:
- 관측값(Observed Values)과 기대값(Expected Values) 테이블 생성.
- 함수 사용:
- =TEST.KHIDEUX(donnees_observees, donnees_attendues)
- donnees_observees: 관측된 값의 범위.
- donnees_attendues: 기대된 값의 범위.
- =TEST.KHIDEUX(donnees_observees, donnees_attendues)
- 결과 해석:
- p≤0.05: 귀무가설 기각 → 변수 간 관계가 있음.
- p>0.05: 귀무가설 유지 → 변수 간 관계 없음.
결과 해석 예시
문제: 주중과 주말의 자료 접근 비율 차이가 있는가?
- 관측값:
- 주중: 50명, 주말: 30명.
- 기대값 계산:
- 총 80명 중 주중/주말 비율이 동일하다고 가정하면:
- 주중 기대값 = 80/2.
- 주말 기대값 = 80/2.
- 총 80명 중 주중/주말 비율이 동일하다고 가정하면:
- 검정 결과:
- Chi-제곱 검정 수행 후 p=0.03 → 귀무가설 기각.
- 결론: 주중과 주말의 자료 접근 비율에 유의미한 차이가 있음.
요약
- Chi-제곱 검정은 명목형 데이터에서 범주 간 비율 또는 관계를 분석하는 데 사용
- Excel에서 수행: =TEST.KHIDEUX(관측값 범위, 기대값 범위).
- 결과 해석:
- p≤0.05: 변수 간 관계 존재.
- p>0.05: 변수 간 관계 없음.
이 검정은 두 변수 간의 독립성을 평가하거나, 관측값과 기대값 간 차이를 분석하는 데 효과적
'Rewire (공부) > Edutech 교육공학' 카테고리의 다른 글
AI와 교육 - 교육 데이터 마이닝 머신러닝 예측 모델 Predictive analytics (1) (2) | 2024.12.18 |
---|---|
AI와 교육 - 로그 파일의 통계 분석 (1) 기술 통계 (0) | 2024.12.16 |
AI와 교육 - 교육 데이터의 전처리 및 통계 분석 개념 (3) | 2024.12.16 |
AI와 교육 - 교육 데이터 마이닝(EDM)의 연관 분야와 미래 (러닝아날리틱스 Learning Analytics, 생성형 AI) (3) | 2024.12.15 |
AI와 교육 - 데이터 마이닝과 EDM 교육 데이터 마이닝 (3) | 2024.12.12 |