분류 전체보기

📌 학습목표 1. 데이터 분석을 해야하는 이유 2. 데이터 분석 프로세스 3. 데이터 분석 툴(Google Colab) 소개 4. 데이터 정규화 및 스케일링 데이터 분석을 해야하는 이유 산업의 변화 제조업 → 서비스 기업 데이터를 이용한 가치를 판매 예시 : Amazon : 데이터 분석을 이용한 예측배송 서비스 Google, Facebook : 데이터 분석을 이용한 온라인 광고 서비스 Netflix : 데이터 분석을 이용한 콘텐츠 추천 서비스 데이터 분석이란? : 데이터를 정리/변환/조작/검사 하여 "인사이트"를 만들어내는 작업 데이터 분석을 해야하는 이유 → 의사결정 판단의 기준이 주관적 직감에서 객관적 데이터로 바뀔 수 있음 주어진 데이터로 문제를 해결할 수 있을지 없을지 판단하는 것 또한 데이터 분..
🤔 문제 다음은 어느 한 서점에서 판매중인 도서들의 도서 정보(`BOOK`), 판매 정보(`BOOK_SALES`) 테이블입니다. `BOOK` 테이블은 각 도서의 정보를 담은 테이블로 아래와 같은 구조로 되어있습니다. `BOOK_SALES` 테이블은 각 도서의 날짜 별 판매량 정보를 담은 테이블로 아래와 같은 구조로 되어있습니다. 2022년 1월의 카테고리 별 도서 판매량을 합산하고, 카테고리(`CATEGORY`), 총 판매량(`TOTAL_SALES`) 리스트를 출력하는 SQL문을 작성해주세요. 결과는 카테고리명을 기준으로 오름차순 정렬해주세요. 예시 예를 들어 `BOOK` 테이블과 `BOOK_SALES` 테이블이 다음과 같다면 2022년 1월의 도서 별 총 판매량은 도서 ID 가 1 인 도서가 총 3권,..
🤔 문제 다음은 어느 자동차 대여 회사에서 대여 중인 자동차들의 정보를 담은 `CAR_RENTAL_COMPANY_CAR` 테이블과 자동차 대여 기록 정보를 담은 `CAR_RENTAL_COMPANY_RENTAL_HISTORY` 테이블과 자동차 종류 별 대여 기간 종류 별 할인 정책 정보를 담은 `CAR_RENTAL_COMPANY_DISCOUNT_PLAN` 테이블 입니다. `CAR_RENTAL_COMPANY_CAR` 테이블은 아래와 같은 구조로 되어있으며, `CAR_ID`, `CAR_TYPE`, `DAILY_FEE`, `OPTIONS` 는 각각 자동차 ID, 자동차 종류, 일일 대여 요금(원), 자동차 옵션 리스트를 나타냅니다. 자동차 종류는 '세단', 'SUV', '승합차', '트럭', '리무진' 이 있습..
📌 학습목표 1. 날짜와 시간 - timestamp/DatetimeIndex 2. 날짜 범위 생성 - date_range 3. 기간과 기간 인덱스 - Period/PeriodIndex 4. 간격과 간격 인덱스 - Timedelta/TimedeltaIndex 5. 날짜/시간 속성 접근자 - .dt 6. Timestamp와 DatetimeIndex의 메소드 및 속성 7. 데이터 셋에서 시계열 데이터 처리 - to_datetime 8. 날짜 포맷 9. 잘못된 날짜 포맷 10. 시계열 조회 - loc 11. 재색인 - reindex 12. 결측치 결정 13. 재샘플링 - resample
📌 학습목표 1. 행렬 전치 - transpose 2. 인덱스 레벨 제어 - stack/unstack/droplevel 3. 재구조화 - melt 4. 피벗/피벗테이블 - pivot/pivot_table 5. 그룹화 - groupby .transpose() 또는 .T() : 행과 열을 주대각선을 축으로 서로 반사대칭하여 얻게 되는 전치 행렬을 반환한다. (비파괴적 처리) `args` : 인자 (튜플이 올수도 있음) `copy` : 전치시킨 이후에 행렬을 복제할 것인지 여부 `False` : 복제 O ← 디폴트 `True` : 복제 X [예제] 원본이 아래와 같을 때 # 원본 students 행렬 전치를 수행하면 # 전치를 해보면.. students.transpose() ※ 전치를 2번 시행한것과 원본은 ..
🤔 문제다음은 식품의 정보를 담은 `FOOD_PRODUCT` 테이블입니다.`FOOD_PRODUCT` 테이블은 다음과 같으며 `PRODUCT_ID`, `PRODUCT_NAME`, `PRODUCT_CD`, `CATEGORY`, `PRICE`는 식품 ID, 식품 이름, 식품코드, 식품분류, 식품 가격을 의미합니다.  `FOOD_PRODUCT` 테이블에서 식품분류별로 가격이 제일 비싼 식품의 분류, 가격, 이름을 조회하는 SQL문을 작성해주세요.이때 식품분류가 '과자', '국', '김치', '식용유'인 경우만 출력시켜 주시고 결과는 식품 가격을 기준으로 내림차순 정렬해주세요.   예시`FOOD_PRODUCT` 테이블이 다음과 같을 때 SQL을 실행하면 다음과 같이 출력되어야 합니다.         💻 나의 ..
📌 학습목표 1. 시리즈에 대한 문자열 함수 Series.str. 2. .str.upper(), .str.lower() 3. 문자열 슬라이싱 .str[시작 : 끝 : 스텝] 4. .str.contains() 5. .str.startswith(), .str.endswith() 6. .str.replace() 7. 인덱스에 대한 문자열 함수 .index.str. 8. 컬럼에 대한 문자열 함수 .columns.str. 🔗 실습 링크 : https://www.kaggle.com/datasets/abcsds/pokemon Pokemon with stats 721 Pokemon with stats and types www.kaggle.com Series.str. : Series에 대한 벡터화된 문자열 함수 문자열 ..
📌 학습목표 1. 함수 적용 .apply(func) 2. 🔗 실습링크 : https://www.kaggle.com/datasets/imakash3011/customer-personality-analysis Customer Personality Analysis Analysis of company's ideal customers www.kaggle.com 컬럼 살펴보기 (사람 정보) 속성 설명 범주 ID 고객의 고유 식별자 Year_Birth 고객의 출생 연도 Education 고객의 교육 수준 'Basic' : 고졸 'Graduation' : 학사졸업 '2nd Cycle' : 대학원 재학생 'Master' : 석사 'PhD' : 박사 Martial_Status 고객의 결혼 여부 Income 고객의 연간 가..
상급닌자연습생
'분류 전체보기' 카테고리의 글 목록 (12 Page)