데이터분석

Kaggle이란?: 호주에서 시작한 국제적인 머신러닝 대회를 제공하는 서비스  Kaggle Code(Kaggle Kernel): 데이터 사이언스 관련 모듈이 모두 설치되어있는 Jupyter Python Notebook무료4 CPU, 16 GB 메모리, 1GB 디스크여기서 만든 노트북을 다른 사람들과 공유 가능 + 다른 사람들이 만든 노트북을 보고 공부하기에 최적화 Kaggle Ranking개인이 캐글에서 어떤 활동을 하느냐에 따라서 받게되는 레벨Novices : 캐글 커뮤니티 참여하면 기본적으로 부여ContributorsExpertsMastersGrandmasters 레벨이 각각 적용되는 분야가 크게 4개로 나뉘어진다.Competitions : 대회에서 어떤 성과를 거두었느냐에 따라Datasets : 캐..
· Database/SQL
MySQL Workbench는 MySQL에서 공식적으로 제공하는 GUI 기반의 MySQL 클라이언트 프로그램이다. 설치하는 방법은 유튜브 '생활코딩'님의 영상을 참고했다. 나는 초보자 입장에서 (나중에 내가 보기 편하게) 설치 튜토리얼을 작성할 예정이기 때문에, 혹시 내 블로그 설명이 부족하다고 느끼는 분들은 아래 링크를 참고하면 좋을 것 같다. [🔗 Youtube '생활코딩' - DATABASE2 MySQL - 20.MySQL Workbench] 필자는 코드잇 홈페이지도 참고했는데, 자세하게 설명되있기도 하고 작성일자가 비교적 최근이라 설치하면서 보여지는 화면들이 제일 비슷했다. 🔗 참고 링크 : https://www.codeit.kr/tutorials/12/MySQL-Workbench-%EC%84%A..
결측치(Missing Value) : 0이 아닌 값 언어별로 다르게 부르는데, - NA(Not Available) : 유효하지 않음 - NaN(Not a Number) : 숫자가 아님 - Null : 아무것도 존재하지 않음 ※ 주의해야 할 점은, 결측치는 0이 아니기 때문에 0과는 달리 이 값이 무엇일지 예측할 수 없다는 것이다. 결측치는 왜 생기는 것일까? - 실제로 값 혹은 응답을 입력하지 않아서 - 데이터의 오류로 인해서 결측치를 처리해야 하는 이유 - 결측치로 인해 데이터의 손실이 발생할 수 있음 - 결측치를 어떻게 대체하느냐에 따라서 데이터의 편향이 생길 수 있음 - 데이터 분석가가 결측치를 어떻게 처리하는지에 따라 분석 결과가 달라질 수 있음 결측치 처리 방법 1. 평균으로 대체하는 방법 - ..
상급닌자연습생
'데이터분석' 태그의 글 목록