선형 관계: 독립 변수가 파라미터 값 만큼 일정한 비율로 결과 종속 변수에 영향을 미치는 관계 마트에서 과자(단가 1500원)와 우유(1200원)를 사는 것을 가정해보자.[조건] 물건 가격 할인과 서로 다른 물건 끼리의 가격 영향은 없음전체 비용은 구매하는 과자와 우유 수에 영향을 받음독립 변수 : num_과자, num_우유파라미터 : 1500원(price_과자), 1200원(price_우유)종속 변수 : TotalCost 선형 결합: 파라미터들이 어떠한 실수(혹은 벡터)와 가중합(곱하기&더하기)으로 표현된 것𝑥1 ... 𝑥n : 독립 변수 혹은 특징(feature) ► 입력하는 데이터𝑤1 ...𝑤n : 파라미터 ► 찾아 내야 하는 값 ..
데이터 분석 Data Analytics
📌 학습목표 1. Scikit-learn 2. Numpy 3. Pandas 4. Matplotlib scikit-learn(사이킷런) : 다양한 머신러닝 알고리즘이 구현되어 있는 오픈 소스 패키지 (내부 작동 과정을 하나하나 확인할 수 있음) 데이터 처리, 파이프라인, 여러 학습 알고리즘, 전/후처리 등 다양한 기능을 제공 실제 산업 현장이나 학계에서도 널리 사용됨 타 파이썬 패키지와 과학 분석 목적 패키지와 연동이 좋음 ◆ 사이킷런 주요 객체 scikit-learn에서는 아래의 주요 기능을 갖는 객체를 제공 제공하는머신러닝모델및알고리즘은아래객체의메서드를전부혹은일부를사용 이는 통일된 API 호출 시스템을 구성해 사용자가 손쉽게 사용할 수 있는 인터페이스를 제공하기 위함 1) Estimator (추정기) ..
📌 학습목표 1. 선형대수 2. 확률 분포 3. 확률론적 모델링과 추론 선형대수 : 수 들이 모여있는(=벡터 or 행렬) 개념과 관련된 식을 연구하는 수학의 한 분야로, 수를 다루는 많은 학문(데이터, 공학, 과학적 분석 등)에서 수의 연산을 빠르고 효과적으로 하기 위해 사용하는 도구 수의 집합을 기하학적인 형상으로 적용하여 표현 시각적이고 직관적으로 수의 값을 이해할 수 있음 기하학적으로 의미를 갖는 다양한 변환을 수학적으로 정의할 수 있음(ex. 회전, 스케일링 등) 컴퓨터 그래픽스, 엔지니어링, 물리학, 컴퓨터 과학, 머신러닝 등 다양한 분야에서 응용 머신러닝에서는 데이터를 표현하고 변환하는데 필수적인 도구로 사용됨 ◆ 수의 집합 : {스칼라, 벡터, 행렬, 텐서} 숫자는 특정한 방향(=차원)으로 ..
📌 학습목표1. 머신러닝이란?2. 메타데이터3. 레이블4. 머신러닝의 종류 - 지도학습/비지도학습/준지도학습/자기지도학습/강화학습5. 데이터 분할 - 학습/검증/평가6. 과적합7. 손실과 손실함수8. 파라미터와 최적화 명시적 프로그램 : 규칙 기반 전문가 시스템(Rule-Based Expert System): 문제를 해결하기 위한 규칙(rule)을 사람이 수동으로 사전에 정의하고 해당 정의에 따라서 판단을 내리는 것(※ 규칙 : 하드 코딩된 `if-else` 명령어의 집합) 머신러닝 이전의 문제 해결 방법론ex. 스팸 메일을 분류하는 과정 → 특정 단어(Sale, Win, Free 등)의 유무로 스팸 메일을 분류 장점단점- 처리 과정을 사람이 이해하기 쉬움- 작은 데이터에서 효과적- 특정 규칙은 하..
📌 학습목표 1. Superset 2. Superset 실습 3. Preset 설정 4. Docker을 활용한 Superset 설치 5. Redshift 설정하고 MAU 차트 만들기 6. Cohort 차트, 대시보드 만들기