데이터 분석 Data Analytics

📌 학습목표 1. 데이터 웨어하우스의 옵션 2. 데이터 레이크 3. 빅데이터 처리 프레임워크 4. ETL(데이터 파이프라인), ELT 5. 다양한 데이터 소스 6. Airflow 7. 데이터 플랫폼 발전 단계 8. 실리콘 밸리 회사들의 데이터 스택 트렌드 9. [실습] Google Colab으로 간단한 ETL 작성해보기 데이터 웨어하우스(Data Warehouse) 옵션 확장 가능성(Scalable)과 적정한 비용이 중요함 데이터 규모가 커지면서 '클라우드'가 대세 오픈소스 기반(Presto, Hive)을 사용하는 경우도 클라우드 버전 존재 데이터가 작다면 굳이 빅데이터 기반 데이터베이스 사용할 필요X 1. 고정비용 옵션 장점 : 비용이 고정되어있기 때문에 비용 관리 측면에서는 좋음 단점 : 사용하지 않..
📌 학습목표 1. 시각화 2. matplotlib plot - Scatterplot, Barplot, Histogram, Plechart, heatmap, style, Subplots, boxplot, violinplot 시각화 (Visualization) : 데이터분석 결과를 Plot이나 Graph등을 통해 시각적으로 전달하는 방법 데이터 분석 내용을 한눈에 볼 수 있게 내용을 효과적으로 전달 통계수치상으로는 파악하기 쉽지 않은 내용까지 분석 가능한 경우도 존재 (예. 데이터 분포를 시각화로 나타낼 때) ✓ 대표적인 데이터 시각화 라이브러리 matplotlib seaborn matplotlib : 데이터를 다양한 방법으로 도식화 할 수 있도록 하는 Python Library (우리가 사용할 것은 mat..
📌 학습목표 1. 데이터 분석을 해야하는 이유 2. 데이터 분석 프로세스 3. 데이터 분석 툴(Google Colab) 소개 4. 데이터 정규화 및 스케일링 데이터 분석을 해야하는 이유 산업의 변화 제조업 → 서비스 기업 데이터를 이용한 가치를 판매 예시 : Amazon : 데이터 분석을 이용한 예측배송 서비스 Google, Facebook : 데이터 분석을 이용한 온라인 광고 서비스 Netflix : 데이터 분석을 이용한 콘텐츠 추천 서비스 데이터 분석이란? : 데이터를 정리/변환/조작/검사 하여 "인사이트"를 만들어내는 작업 데이터 분석을 해야하는 이유 → 의사결정 판단의 기준이 주관적 직감에서 객관적 데이터로 바뀔 수 있음 주어진 데이터로 문제를 해결할 수 있을지 없을지 판단하는 것 또한 데이터 분..
상급닌자연습생
'데이터 분석 Data Analytics' 카테고리의 글 목록 (6 Page)