전체 글

궁금해하고 공부하고 기록하고
Snowflake클라우드 기반의 데이터 웨어하우스로 시작되었으며 현재는 데이터 클라우드 수준  Snowflake 특징멀티 클라..
📌 학습목표 1. 데이터 웨어하우스의 옵션 2. 데이터 레이크 3. 빅데이터 처리 프레임워크 4. ETL(데이터 파이프라인), ELT 5. 다양한 데이터 소스 6. Airflow 7. 데이터 플랫폼 발전 단계 8. 실리콘 밸리 회사들의 데이터 스택 트렌드 9. [실습] Google Colab으로 간단한 ETL 작성해보기 데이터 웨어하우스(Data Warehouse) 옵션 확장 가능성(Scalable)과 적정한 비용이 중요함 데이터 규모가 커지면서 '클라우드'가 대세 오픈소스 기반(Presto, Hive)을 사용하는 경우도 클라우드 버전 존재 데이터가 작다면 굳이 빅데이터 기반 데이터베이스 사용할 필요X 1. 고정비용 옵션 장점 : 비용이 고정되어있기 때문에 비용 관리 측면에서는 좋음 단점 : 사용하지 않..
📌 학습목표 1. 시각화 2. matplotlib plot - Scatterplot, Barplot, Histogram, Plechart, heatmap, style, Subplots, boxplot, violinplot 시각화 (Visualization) : 데이터분석 결과를 Plot이나 Graph등을 통해 시각적으로 전달하는 방법 데이터 분석 내용을 한눈에 볼 수 있게 내용을 효과적으로 전달 통계수치상으로는 파악하기 쉽지 않은 내용까지 분석 가능한 경우도 존재 (예. 데이터 분포를 시각화로 나타낼 때) ✓ 대표적인 데이터 시각화 라이브러리 matplotlib seaborn matplotlib : 데이터를 다양한 방법으로 도식화 할 수 있도록 하는 Python Library (우리가 사용할 것은 mat..
상급닌자연습생
상급닌자수련원