🐥 Education/프로그래머스 데이터분석데브코스

💡 요약 테이블을 집합으로 생각하기 데이터 조회 시 효율성 높이기 LIMIT 걸고 조회 파티션을 필터 조건으로 걸고 조회 SELECT * 지양 LIKE 사용 시 % 제한적으로 사용 데이터 타입 잘 확인하기 비교 연산자 사용 시 타입 확인 상대적으로 작은 사이즈의 Column에 함수 사용 JOIN 시 유의할 점 JOIN 하는 테이블 간의 관계 고려하기 데이터 중복이 있는지 확인 여러 가지 쿼리 방식 고려 가독성 높이기 🌳 테이블을 집합으로 생각하기 최대한 작게 만들어 놓고 JOIN 하기 필터링 후 JOIN 처리 속도 < JOIN 후 필터링 처리 속도 🌳 데이터 조회 시 효율성 높이기 LIMIT 걸고 조회 테이블에 어떤 데이터가 있는지 조회할 때 → LIMIT을 걸어 조회하는 것이 안전 행 수가 굉장히 많은..
💡 요약 숫자 BIT TINYINT BOOL / BOOLEAN SMALLINT MEDIUMINT INT / INTEGER BIGINT / SERIAL DECIMAL / DEC / FIXED FLOAT DOUBLE 문자 CHAR VARCHAR TEXT TINYTEXT MEDIUMTEXT LONGTEXT ENUM SET 이진 BLOB TINYBLOB MEDIUMBLOB LONGBLOB BINARY VARBINARY Array JSON_ARRAY JSON_TYPE JSON_EXTRACT Key-value JSON_OBJECT JSON_EXTRACT JSON_INSERT JSON_REPLACE 💭 느낀 점 SQL의 데이터 타입에 대해 하나하나 배웠는데 종류도 많고.. 다 비슷해보이고.. 오늘은 조금 힘들었다😢 ..
💡 요약 다양한 JOIN INNER JOIN LEFT JOIN RIGHT JOIN FULL OUTER JOIN CROSS JOIN SELF JOIN UNION / UNION ALL WITH Subquery SELECT절 서브쿼리 FROM절 서브쿼리 WHERE절 서브쿼리 타임스탬프 함수 시간을 나타내는 데이터 타입 현재 시간 날짜 형식화 날짜 연산 타입 변환 조건문 IF IFNULL CASE 그 외 유용한 함수 RANK LEAD LAG 💭 느낀 점 테이블 결합부터 데이터 타입, 날짜/시간 관련 함수, 조건문, RANK, LEAD 등에 대해 배웠다. 오늘 역시나 JOIN과 조건문은 데이터리안에서 배운 내용이라 전혀 어렵지 않았고, 나머지 함수들은 한 번씩 보긴 했지만 어떻게 사용하는지 궁금했었는데 이번에 배..
💡 요약 RDB와 SQL이란? RDBMS RDBMS vs NoSQL SQL 데이터 조회 SELECT / FROM / WHERE LIMIT 비교 연산자 / 논리 연산자 정렬과 집계 기초 SQL 함수 문자열을 다루는 함수 숫자열을 다루는 함수 DDL / DML 💭 느낀 점 오늘 수업은 ADsP 자격증 공부한 것과 데이터리안 입문반 과정을 수강하며 배웠던 내용들이라 복습하는 느낌이었다. 데이터리안이 하나하나 더 상세하게 알려주는 느낌이라 먼저 수강을 해서 다행이라는 생각이 들었다! 오늘 TIL은 중복으로 작성할 필요가 없을 것 같아 중복 내용은 데이터리안 TIL을 링크하는 방법으로 작성하려고 한다. 🌳 RDB와 SQL이란? RDBMS 데이터베이스 : 데이터를 쌓아두는 공간 + 관리시스템 관계형 데이터베이스 R..
💭 1주간 강의 이번 주는 엑셀을 가지고 데이터 분석하는 법을 배웠다. 사실 제공된 강의의 절대적인 시간도 지난 주에 비해 많이 적기도 했고, 그러면서 내용도 줄어서 사실 알고 있던 것들을 복기하는 정도였다. 그럼에도 좋았던 부분은 Gen AI 특강과 어찌됐든 데이터 분석을 해보는 실습이었다. 먼저, Gen AI는 지난 주에 배우긴 했지만 이론적인 내용이 중점이었고 Chat GPT를 한 번 사용해보는 정도였다. 그 때 궁금했던 게 '어떻게 프롬프트를 입력을 해야 Chat GPT를 200% 업무에 활용할 수 있을까' 라는 궁금증과 '업무에서 사용하는 툴들이 분명 있을 건데, Chat GPT는 언제 사용하는 거지?' 하는 의문이었다. 이 두 가지가 속 시원하게 해결이 되어서 기억에 남는 것 같다. 전자의 궁..
💡 요약 결측치 결측치란? 결측치가 발생하는 이유 결측치를 처리해야 하는 이유 결측치 대체하기 평균으로 대체하기 완전 제거하기 회귀대체법 💭 느낀 점 🔗 프로그래머스 데이터 분석 데브코스|Week2 |2주차 회고 🌳 결측치 결측치(Missing Value)란? 0이 아닌 값 NA(Not Available) : 유효하지 않음 NaN(Not a Number) : 숫자가 아님 Null : 아무것도 존재하지 않음 결측치가 발생하는 이유 실제로 값을 입력하지 않은 경우 설문조사 특정 질문에 미응답 데이터의 오류 결측치를 처리해야 하는 이유 결측치는 데이터의 손실을 불러올 수 있음 결측치 대체에 따라 데이터에서 편향이 생길 수 있음 결측치 처리에 따라 분석 결과가 매우 달라질 수 있음 🌳 결측치 대체하기 평균으로 ..
윰 yumm
'🐥 Education/프로그래머스 데이터분석데브코스' 카테고리의 글 목록