[TIL] 데이터분석 데브코스 47일차 (3) - kaggle 데이터를 활용한 선형 회귀 분석 / 선형 분류 분석 실습

2024. 4. 24. 22:10· 데이터 분석 Data Analytics/프로그래머스 데이터분석 데브코스 2기

[TIL] 데이터분석 데브코스 48일차 (2) - 의사결정나무(Decision Tree) (0)	2024.04.24
[TIL] 데이터분석 데브코스 48일차 (1) - 선형 SVM/소프트 마진 SVM/비선형 SVM/SVR(Support Vector Regression) (0)	2024.04.24
[TIL] 데이터분석 데브코스 47일차 (2) - 선형 관계/선형 결합/선형 모델 (0)	2024.04.23
[TIL] 데이터분석 데브코스 47일차 (1) - 머신러닝 오픈 소스 패키지 scikit-learn(사이킷런)/파이썬 패키지 Numpy(넘파이), Pandas(판다스)/시각화 패키지 Matplotlib (0)	2024.04.23
[TIL] 데이터분석 데브코스 46일차 (2) - 머신러닝에 필요한 선형대수/확률이론 (0)	2024.04.23

[TIL] 데이터분석 데브코스 47일차 (3) - kaggle 데이터를 활용한 선형 회귀 분석 / 선형 분류 분석 실습

상단으로

선형 회귀 분석

실습 데이터

문제 정의

1단계. 데이터 로드

2단계. EDA

1) 기본 정보 및 기초 통계량 분석

2) 시각화 - 수치형 데이터

3) 상관관계 분석

4) 시각화 - 범주형 데이터

3단계. 데이터 전처리

1) 범주형 변수 인코딩

📌 One-hot Encoding

4단계. 데이터 분리 (학습/평가)

5단계. 특성 스케일링 (필수X)

6단계. 선형 회귀 모델 학습

7단계. 학습한 모델 평가

1) MSE

2) 산점도 시각화

8단계. 결과 해석

1) 변수 중요도

2) 잔차 분석

선형 분류 분석

실습 데이터

문제 정의

1단계. 데이터 로드

2단계. EDA

1) 기본 분석 및 기초 통계 분석

2) 시각화 - 수치형 데이터

3) 이상치 확인 - 수치형 데이터

4) 상관관계 분석 - 수치형 데이터

5) 시각화 - 서수형 데이터

6) 상관관계 분석 - 서수형 데이터

7) 시각화 - 범주형 데이터

3단계. 데이터 전처리

1) 데이터 제거

2) 범주형 변수 One-hot Encoding

3) 일부 특성만 사용

4단계. 데이터 분리 (학습 / 평가)

5단계. 선형 분류 모델(로지스틱 회귀) 학습

6단계. 학습한 모델 평가

1) 정확도(Accuracy)

2) Confusion matrix

7단계. 결과 해석

1) 변수의 중요도

'데이터 분석 Data Analytics > 프로그래머스 데이터분석 데브코스 2기' 카테고리의 다른 글

티스토리툴바