지도학습 (Supervised Learning)
정답(Label, 라벨, 레이블)이 있는 데이터를 활용해 데이터를 학습시키는 방법
프로세스
- 훈련 데이터(정답O)로 모델을 학습시킴
- 테스트 데이터(정답X)로 학습시킨 모델의 성능을 검증함
유형
A. 분류
a. 이진분류
b. 다중분류
- 의사결정트리(분류)
- 랜덤 포레스트
- 인공신경망
- 서포트벡터머신(SVM)
- 로지스틱 회귀분석
B. 회귀(=예측)
- 의사결정트리(회귀)
- 선형회귀분석
- 다중회귀분석
비지도학습 (Unsupervised Learning)
정답이 없는 데이터를 컴퓨터가 스스로 학습하여 숨겨진 의미나 패턴 등을 찾아내고 구조화하는 방법
종류
- 군집분석 (Clustering)
- 연관성분석 (Association Analysis)
- 인공신경망 (Neural Networks)
- 오토인코더 (Auto-encoder)
준지도학습 (Semi-supervised Learning)
정답이 있는 데이터와 정답이 없는 데이터를 동시에 학습하는 방법
종류
- 셀프 트레이닝 : 정답이 있는 데이터로 모델 학습한 후, 정답이 없는 데이터를 예측하여 이 중 가장 확률값이 높은 데이터들만 정답 데이터로 다시 가져가는 방식을 반복
- GAN(Genrative Adversarial Networks; 생성적 적대 신경망) : '생성모델'에서 데이터 분포 법칙에 따라 데이터를 생성하면 '판별모델'에서 이를 판별
강화학습 (Reinforcement Learning)
주어진 환경에서 보상을 최대화하도록 에이전트를 학습하는 방법
종류
- Q-Learning
- 정책경사(PG; Policy Gradient)
데이터 분석 알고리즘과 활용 분야
- 업리프트 모델링 : 단계적 추정, 예측 분석, 마케팅(AB Test)
- 생존분석 : 의료 통계, 설비 분야 사건 예측
- 회귀분석 : 예측, 추정 분석
- 시각화 : 원인과 관계 분석
- 기초통계 : 기초 통계현황 파악
- 부스팅/배깅 : 분류 분석
- 시계열 분석: 시간상의 예측, 금융(이자율, 주식)
- 요인분석 : 차원 축소
- 텍스트 마이닝 : 감성 분석
- 의사결정 나무/랜덤 포레스트 : 분류
- 신경 회로망 : 예측 분석
- 군집분석 : 독립변수들만의 분류, 그룹화
- 추천-협업 필터링 : 아이템과 이용자 간의 상호 분석을 통한 추천
- 앙상블 기법 : 추정, 예측, 규범 등의 결합 분석
- 소셜네트워크 분석 : 관계망 분석
- SVM : 분류 분석
- PCA : 원인분석, 차원축소
'자격증 > 빅데이터분석기사' 카테고리의 다른 글
| [빅데이터분석기사 필기] 3-2. (1) 의사결정 나무 (Deicision Tree)_지도학습/분류&예측 (0) | 2025.09.05 |
|---|---|
| [빅데이터분석기사 필기] 3-2. (1) 회귀분석 (Regression Analysis)_지도학습/예측 (0) | 2025.09.05 |
| [확률통계론] 이산확률분포(Discrete Probability Distribution) (0) | 2025.08.31 |
| [확률통계론] 체비셰프(Chebyshev) 정리 (0) | 2025.08.30 |
| [빅데이터분석기사 필기] 2-2. 분석 변수 처리(변수 선택/차원축소/파생변수/변수 변환/불균형 데이터 처리) (5) | 2025.07.24 |