빅분기 준비하면서 II - 1. 기술통계 단원에 '체비셰프 정리'가 나온다.
수제비 교재에 따르면 해당 이론은 다음과 같은 정의를 가진다.
체비셰프 정리는 임의의 양수 k에 대하여 확률변수가 평균으로부터 k배의 표준편차 범위 내에 있을 확률에 대한 예측값을 보수적으로 제공하는 정리이다. 체비셰프 정리는 관측값들의 분포에 상관없이 성립하지만, 확률에 대한 하한값을 제공할 뿐이다.

뭔말이야
쉽게 설명하면 다음과 같다.
체비셰프 정리는 확률분포가 어떤 모양이든 상관없이, 평균 근처에 데이터가 일정 비율 이상 몰려있다는 걸 보장하는 정리.
즉, 분포가 정규분포든, 삐뚤빼뚤하든, 한쪽으로 치우쳐 있든 간에 항상 성립하는 보편적인 규칙!
공식은 다음과 같다.
임의의 양수 k(k>1)에 대해서 확률변수 X의 평균이 , 표준편차 σ를 갖는다고 할 때,

즉, “어떤 데이터라도, 평균에서 멀리 떨어진 값은 그렇게 많지 않다”는 최소한의 보장을 해주는 정리라고 생각하면 된다.
'자격증 > 빅데이터분석기사' 카테고리의 다른 글
| [빅데이터분석기사 필기] 3-2. (1) 분석기법 개요 (0) | 2025.09.04 |
|---|---|
| [확률통계론] 이산확률분포(Discrete Probability Distribution) (0) | 2025.08.31 |
| [빅데이터분석기사 필기] 2-2. 분석 변수 처리(변수 선택/차원축소/파생변수/변수 변환/불균형 데이터 처리) (5) | 2025.07.24 |
| [빅데이터분석기사 필기] 2-1. 데이터 전처리(세분화/결측값 처리/이상치 검출/이상치 처리) (5) | 2025.07.12 |
| [빅데이터분석기사] 시험범위 (0) | 2025.06.22 |