- 확률변수 : 특정 확률로 발생하는 결과를 수치적으로 표현하는 변수
- 확률분포 : 확률변수가 특정 값을 가질 확률을 나타내는 분포
이산확률분포 종류 = 포/베/이
1. 포아송 분포
어떤 사건이 일정한 시간이나 공간 안에서 발생하는 횟수를 나타내는 확률분포
예제
- 한 시간 동안 사건이 몇 번 발생할지
- 특정 면적에 몇개의 점(ex. 별, 결함, 고객 등)이 나타날지
- 등등..
포아송 분포의 조건
- 사건이 독립적으로 일어날 때 (각 사건이 서로 영향을 주지 않을때)
- 사건이 발생하는 평균 빈도(λ)가 일정할 때
확률 질량 함수
어떤 구간에서 사건이 k번 발생할 확률은 다음과 같다.

- k : 주어진 시간/공간 내에서 사건이 발생하는 횟수 (0, 1, 2, …)
- λ : 평균 발생 횟수(k에 대한 기댓값)
- e ≈ 2.718: 자연상수
특징
- E[X] = λ
- Var[X] = λ
- 평균 발생 횟수(λ)가 커질수록 정규분포와 비슷한 형태의 그래프가 됨
- 포아송 분포는 λ 하나로 모양이 결정됨
2. 베르누이 분포
성공/실패, 1/0, 예/아니오 처럼 두 가지 결과에 대한 확률분포
예제
- 동전 던지기에서 앞면이 성공(1) 뒷면이 실패(0)인 경우
- 스팸 메일 여부
확률 질량 함수

- : 성공 확률 (0 ≤ p ≤ 1)
- 확률변수 (결과값)
특징
- E[X] =
- Var[X] =
3. 이항분포
베르누이 시행을 n번 반복했을 때 성공이 k번 일어날 확률을 나타내는 분포
예제


특징
- E[X] =
- Var[X] =
맨날 헷갈리는 거는 바로바로 알아보고 정리해야겠다..
'자격증 > 빅데이터분석기사' 카테고리의 다른 글
| [빅데이터분석기사 필기] 3-2. (1) 회귀분석 (Regression Analysis)_지도학습/예측 (0) | 2025.09.05 |
|---|---|
| [빅데이터분석기사 필기] 3-2. (1) 분석기법 개요 (0) | 2025.09.04 |
| [확률통계론] 체비셰프(Chebyshev) 정리 (0) | 2025.08.30 |
| [빅데이터분석기사 필기] 2-2. 분석 변수 처리(변수 선택/차원축소/파생변수/변수 변환/불균형 데이터 처리) (5) | 2025.07.24 |
| [빅데이터분석기사 필기] 2-1. 데이터 전처리(세분화/결측값 처리/이상치 검출/이상치 처리) (5) | 2025.07.12 |