엑셀 기준) 데이터 종류 1. 숫자 데이터 숫자로 이루어진 데이터. 계산이 가능하다. 가장 많이 사용됨 숫자 0~9, +/-, 화폐기호, 소수점, 등 ex) 180, 56%, 4000$, -10 2. 문자 데이터 - 문자와 숫자가 혼합된 데이터도 문자 데이터로 분류된다. 계산이 불가능하다. 특정 함수 사용이 불가능하다. 문자열 함수를 사용 가능하다. ex) 010-3323-2123, 사과 3. 날짜 데이터 년/월/일 등의 날짜를 표시하기 위한 데이터. 계산이 가능하다 숫자 1 = 하루 (1 = 24시간, 0.4 = 12시간) 날짜 데이터에서만 특정 함수를 사용할 수 있음 ex) 2023-10-02, 2023/10/02 4. 기타 - 논리데이터 - 시간 데이터 - 수식 데이터 - 승객명, 성별 = 문자데이..
전체 글
궁금해하고 공부하고 기록하고데이터란 무엇인가? 사전적 정의)이론을 세우는 데 기촉 되는 사실 또는 바탕이 되는 자료 DIKW관점에서 정의) 정보를 도출해내기 위한 사실을 수집하는 자료 영어 표준점수 141점 = 데이터 -> 어던 수준이나 정보를 파악하기 힘들다 비교적 수준이 높다 = 지식 일부 데이터만 봤음에도 불구하고 정보를 파악할 수 있고 이를 통해서 여러가지 추론을 할 수 있다. 실습 1. https://www.data.go.kr/ 접속 + 가입 2. 상단에 '데이터 찾기' > '이슈 및 추천 데이터' 클릭 2. 본인이 흥미있는 데이터를 찾아보고 다운로드 받기 3. 해당 데이터로부터 정보를 수집하기.
데이터 이슈와 해결책 데이터 민주화 (Data Democratization) : 데이터를 필요로하는 사람이 접근 가능해지는 것 데이터 민주화가 잘못되면 정보과잉이 발생할 수 있다. 데이터 거버넌스 : 데이터의 활용이 늘어나면서 데이터를 잘못활용했을 경우 Garbage In Garbage Out으로 오히려 해가 될 수 있기 때문에 데이터 수집, 분석, 저장까지 전반적인 프로세스가 정해져야 함 데이터 엔지니어의 경우 누군가의 요청으로 데이터를 수집/정제/적재하는데, 이 때 요청한 누군가가 데이터의 오너가 된다. 테크니컬 오너 비즈니스 오너 : 위의 요청한 누군가 (개인보다는 팀으로 기록되어야 함) 오너십도 메타데이터로 볼수 있다. 데이터에 대한 데이터가 있다면 그것을 활용해서 데이터를 검색/관리 가능해진다...
퀴즈 리뷰 생성형 AI (Generative AI) 인공지능 > 머신러닝 > 딥러닝 인공지능 (AI; Artificial Intelligence) : 인간이 하는 일을 대신 해주는 시스템을 만드는 컴퓨터 사이언스 머신러닝 (ML; Machine Learning) : 인공지능의 기능을 구현함에 있어서, 데이터내에서 패턴을 찾아주는 블랙박스 형태 딥러닝 (DL; Deep Learning) : 인공신경망의 다른 이름 - 인공신경망을 사용해서 기존의 ML 알고리즘이 처리하지 못하는 훨씬 더 복잡한 패턴도 처리할 수 있음 → 생성형 AI는 딥러닝의 일부이다. 딥러닝 모델의 유형 1. Discriminative : 레이블(=정답이 있는 훈련데이터)이 존재하는 데이터를 활용해서 분류(Classification)하거나..
** 수정중** 데이터 기반 제품 개선(Product Science; 제품 과학) 머신러닝 > 확장 >> 인공지능 머신러닝이란? : 데이터 기반으로 제품/서비스를 개선하는 것 데이터 기반 제품 개선? : 머신러닝을 통해 데이터로부터 코딩 없이 패턴을 찾아, 패턴을 바탕으로 미래를 예측하는 것. 이를 기반으로 제품을 사용하는 사용자들의 과거 행동을 살펴보고 개인화, 추천, 검색 등으로 제품/서비스의 기능을 개선하는 것. 혹은 공정 최적화를 통해 비용을 최소화하거나 챗봇으로 반복적인 프로세스에 대한 비용을 최소화하기도 한다. 데이터 과학자의 역할 - 머신러닝 형태의 블랙박스 모델을 만들어서 사용자들의 경험을 개선시킴 - 모든 중요한 문제를 정의하는 것이 우선적인 과정이다. 어떤 문제를 해결할것인지 가설을 세..
** 수정중 ** 데이터 기반 의사결정 의사결정 = 갈림길에서 왼쪽으로 갈지, 오른쪽으로 갈지 정하는 것 데이터 기반 의사결정의 유형 유형 1. Data Driven Decision : 데이터가 하라는 대로 결정한다. 이미 있는 유형 2. Data Informed Decision : 데이터로 기록이 없는 새로운 일을 시작할 때, 비슷한 과거의 데이터를 찾아서 참고하는 방식에 가까움 결론) 모든 결정을 데이터로 할 수는 없다. 데이터는 과거의 기록일 뿐 현재, 지금 이 순간의 상태를 설명할 수 있을지 없을지 아무도 모름! 그런 점에서 Data Driven Decision 보다 Data Informed Decision이 더 바람직할 수 있다. 미팅을 할 때마다 next mattew's fealous..? 데..
데이터(Data)란? : 일상에서 관찰할 수 있는 '모든 것' 데이터 분석(Data Analysis)이란? : 데이터로부터 유의미한 정보를 도출하여, 이로부터 조직 혹은 개인이 의사결정을 내리는 데 도움을 주는 것 즉, 일상에서 관찰할 수 있는 모든 것(여기에는 아날로그, 물리적인 것들이 포함된다)을 데이터화하여 기록하고 수집하는 것이 데이터 분석의 첫 단계이다. 조직과 개인의 가치를 향상시키는 것 ✷ 버티컬 검색 엔진 : 특정한 도메인에 최적화된 검색 엔진 ✷ 엔젤 투자 : 스타트업의 초기 상태에 자금, 지식, 네트워크 등을 투자하여 기업의 성장을 돕는 것 데이터 문해력(Data Literacy)이란? : 데이터를 읽고, ..
** 본 포스팅은 연세대학교 의과대학의생명시스템정보학교실 유튜브 영상을 시청하며 학습을 목적으로 정리한 내용입니다. ** https://youtu.be/_D1YYpvfVLU?si=tETlQdvkNC25y3ju 의생명 데이터사이언스의 궁극적인 목표 의학계가 갖고있는 수많은 데이터를 만들기 위해서 주요한 노력과 자원으로부터 최대한의 가치를 끌어내고, 그 가치가 인간의 건강과 질병을 치료하는데 이용하는 것 이러한 것들을 가능케 했던 많은 노력들 - 2000년 human genom project - 암 유전체 tcg, icg ICT & 빅데이터와 결합된 정밀의학의 핵심 개인 데이터(화자 유전체 정보, 병력 및 가족력, 생활습관 및 환경, 질병 증상 등)를 적절히 가공하고 추출한 지식으로부터 환자를 카테고리별로 ..