전체 글

궁금해하고 공부하고 기록하고
🤔 문제다음은 어느 한 서점에서 판매중인 도서들의 도서 정보(`BOOK`), 저자 정보(`AUTHOR`) 테이블입니다.`BOOK` 테이블은 각 도서의 정보를 담은 테이블로 아래와 같은 구조로 되어있습니다.   `AUTHOR` 테이블은 도서의 저자의 정보를 담은 테이블로 아래와 같은 구조로 되어있습니다. `BOOK_SALES` 테이블은 각 도서의 날짜 별 판매량 정보를 담은 테이블로 아래와 같은 구조로 되어있습니다. 2022년 1월의 도서 판매 데이터를 기준으로 저자 별, 카테고리 별 매출액(`TOTAL_SALES` = 판매량 * 판매가) 을 구하여, 저자 ID(AUTHOR_ID), 저자명(AUTHOR_NAME), 카테고리(CATEGORY), 매출액(`SALES`) 리스트를 출력하는 SQL문을 작성해주세..
EDA(Exploratory Data Analysis) EDA를 하는 이유효과적인 데이터 분석과 모델링을 위한 기초 마련데이터 품질 확인(현업에서 깨끗한 데이터란 존재할 수 없음)중복 레코드 체그최근 데이터 존재 여부(=최신성) 체크Primary key Uniqueness 체크값이 비어있는 컬럼 존재 여부 체크데이터 특성(패턴) 확인   EDA 기법1. 기술 통계 분석숫자 변수와 카테고리 변수 파악숫자 변수의 경우 값 범위 파악카테고리 변수의 경우에는 카테고리 수 파악카테고리의 경우 머신러닝 모델을 만들때 인코딩 방법 결정 2. 결측치 탐지 및 처리비어있는 값이 있는 필드를 가진 레코드들을 찾기 널 값이 있는 레코드 무시 가능널 값이 있는 레코드 채우는 방법 :  숫자 : 평균값, 최소값, 최대값, 가장..
🤔 문제다음은 어느 의류 쇼핑몰에 가입한 회원 정보를 담은 `USER_INFO` 테이블과 온라인 상품 판매 정보를 담은 `ONLINE_SALE` 테이블 입니다. `USER_INFO` 테이블은 아래와 같은 구조로 되어있으며 `USER_ID`, `GENDER`, `AGE`, `JOINED`는 각각 회원 ID, 성별, 나이, 가입일을 나타냅니다. `GENDER` 컬럼은 비어있거나 0 또는 1의 값을 가지며 0인 경우 남자를, 1인 경우는 여자를 나타냅니다. `ONLINE_SALE` 테이블은 아래와 같은 구조로 되어있으며, `ONLINE_SALE_ID`, `USER_ID`, `PRODUCT_ID`, `SALES_AMOUNT`, `SALES_DATE`는 각각 온라인 상품 판매 ID, 회원 ID, 상품 ID, 판..
Kaggle이란?: 호주에서 시작한 국제적인 머신러닝 대회를 제공하는 서비스  Kaggle Code(Kaggle Kernel): 데이터 사이언스 관련 모듈이 모두 설치되어있는 Jupyter Python Notebook무료4 CPU, 16 GB 메모리, 1GB 디스크여기서 만든 노트북을 다른 사람들과 공유 가능 + 다른 사람들이 만든 노트북을 보고 공부하기에 최적화 Kaggle Ranking개인이 캐글에서 어떤 활동을 하느냐에 따라서 받게되는 레벨Novices : 캐글 커뮤니티 참여하면 기본적으로 부여ContributorsExpertsMastersGrandmasters 레벨이 각각 적용되는 분야가 크게 4개로 나뉘어진다.Competitions : 대회에서 어떤 성과를 거두었느냐에 따라Datasets : 캐..
검증(Validation): 모델의 학습이 잘 진행되었는지(=일반화 능력이 좋은지)를 판단하는 평가 과정 ► 학습의 종료 시점을 판가름할 수 있음 📌 일반화 능력 : 내가 학습한 데이터가 아닌 새로운 다른 데이터로도 모델이 잘 작동하는 능력     교차 검증 (Cross Validation; CV): 다음의 문제를 회피(혹은 감수)하면서도 검증의 원래 의미를 살리는 평가 방법으로,전체 데이터를 여러 개의 하위 데이터로 나누고 이 하위 데이터 세트들의 조합은 서로 다른 방법으로 훈련&검증에 사용해서 모델의 일반화 능력을 충분히 측정한다.► 각 조합의 결과 개수 = 하위 데이터 셋들의 조합 수※ 머신러닝 모델 학습 과정에서 발생할 수 있는 문제- 너무 쉬운 데이터로의 편향- 전체적인 데이터 양의 부족 장점..
· 프로젝트
월간 프로젝트 2
· 프로젝트
월간 프로젝트 1
딥러닝: 사람의 신경망을 기반으로 학습과 추론을 진행하는 학문  인간과 딥러닝뉴런(Neuron) : 사람 신경 구조의 기본 단위 ► 뉴런이 모여 신경계가 이루어짐  시냅스(Synapse): 정보가 전달되는 연결통로로, 뉴런과 뉴런을 이어줌 수상돌기 : 앞선 뉴런의 신호를 수신 세포체 : 신호 연산 축색돌기 : 신호 이동 출색말단 : 후발 뉴런에게 신호 전달      퍼셉트론(Perceptron; ●) : 뉴런을 모방하기 위해 수학적으로 모델링한 딥러닝의 기본 단위 ► 퍼셉트론이 쌓아져 딥러닝 모델이 만들어짐※ 퍼셉트론을 어떤식으로 구성하느냐에 따라 받을 수 있는 입력 데이터와 풀 수 있는 문제가 달라진다. 가중치(Weight; →) : 두 퍼셉트론 사이의 연관관계도         이미지 데이터 처리문제이..
상급닌자연습생
상급닌자수련원