연관성 분석이란?
데이터 내부에 존재하는 항목 간의 상호 관계 혹은 종속 관계를 찾아내는 분석 기법
= 장바구니 분석 (Market Basket Analysis)
장바구니 안에 무엇이 같이 들어 있는지에 대한 분석 기법
= 서열 분석 (Sequence Analysis)
A를 구입한 다음에 B를 구입한다는 것을 분석하는 기법
측정 지표
1. 지지도 (Support)
전체 거래 중 A와 B를 동시에 포함하는 거래 비율
2. 신뢰도 (Confidence)
A를 구매했을 때 B도 구매할 조건부 확률에 대한 척도
3. 향상도 (Lift)
규칙이 우연에 의해 발생한 것인지를 판단하기 위해 연관성의 정도를 측정하는 척도
- Lift = 1 ▶ 서로 독립
- Lift > 1 ▶ 양(+)의 상관관계
- Lift < 1 ▶ 음(-)의 상관관계
알고리즘
1. 아프리오리 알고리즘 (Apriori)
가능한 모든 경우의 수를 탐색하는 방식을 개선하기 위해, 데이터들의 발생빈도가 높은 것을 찾는 방식
[규칙]
- 한 항목 집합이 빈발하면, 이 항목 집합의 모든 부분집합은 빈발항목 집합이다.
- 한 항목 집합이 빈발하지 않다면 이 항목 집합을 포함하는 모든 집합은 비 빈발항목 집합이다.
2. FP-Growth 알고리즘
FP-Tree라는 구조를 통해 최소 지지도를 만족하는 빈발 아이템 집합을 추출하는 알고리즘이다
'자격증 > 빅데이터분석기사' 카테고리의 다른 글
| [빅데이터분석기사 필기] 3-2. (1) 군집분석 (Cluster Analysis)_비지도 학습 (0) | 2025.09.05 |
|---|---|
| [빅데이터분석기사 필기] 3-2. (1) 서포트 벡터 머신(SVM; Support Vector Machine)_지도학습/분류 (0) | 2025.09.05 |
| [빅데이터분석기사 필기] 3-2. (1) 인공신경망(Artificial Neural Network; ANN)_지도학습/분류, 비지도학습 (0) | 2025.09.05 |
| [빅데이터분석기사 필기] 3-2. (1) 의사결정 나무 (Deicision Tree)_지도학습/분류&예측 (0) | 2025.09.05 |
| [빅데이터분석기사 필기] 3-2. (1) 회귀분석 (Regression Analysis)_지도학습/예측 (0) | 2025.09.05 |