728x90
728x90
SMALL
💡 요약
- 데이터 기반 의사결정이란?
- 데이터 분석 케이스
- 데이터 분석가의 역할 · 스킬셋 · 딜레마
- 데이터 팀 조직 구조
- 중앙 집중 구조
- 분산 구조
- 하이브리드 구조
- 데이터 조직의 일주일
- 애자일 개발 방법론
- 좋은 지표(KPI)란?
- KPI · 지표
- KPI 기준
- 선행 / 후행 지표
- 시각화 대시보드 툴
💭 느낀 점
오늘 배운 내용들은 지난 달에 ADsP를 준비할 때 공부했던 내용들이어서 이해하기 어렵지 않았다.
그래서 원론적인 내용보다는 실제로 어떤 모습으로 데이터 팀이 이루어져 있을지가 궁금했는데, 강사님께서 '데이터 조직의 일주일' 이라는 주제로 실제 경험하신 데이터 팀의 업무를 소개해 주셨다. 이 부분에서 역시 회의가 굉장히 많고, 데이터 분석가는 협업으로 돌아가는 직무라는 것, 하드스킬 뿐 아니라 소프트 스킬도 굉장히 중요한 직무라는 걸 느낄 수 있었다.
그리고 오늘 처음으로 실습을 해봤다. Tableau를 사용해보는 아주 간단한 실습이었는데, 그동안 채용공고랑 부트캠프들의 커리큘럼들에서 수없이 봐오던 툴을 직접 사용해보니 신기했다. 무엇보다 눈으로 직접 봐보니 결과물을 굉장히 효율적으로 전달할 수 있는 툴이라는 것을 단번에 알 수 있었다. 이전 직장에서는 결과물을 보고서 1~2장에 글로 풀어내느라 애를 많이 썼었는데, 앞으로 수많은 데이터들을 Tableau로 시각화하기까지 효율적인 스킬들을 알아가는 재미가 있을 것 같다.
🌳 데이터 기반 의사결정이란?
데이터에서 인사이트 찾기
- 중요 지표를 데이터 기반으로 정의 · 시각화
- 가설을 바탕으로 실제 데이터 확인 (A/B 테스트)
데이터 분석 케이스
- 중요 지표 대시보드 만들기
- 고객 이탈/잔존률 분석 → 보통 코호트 분석으로 진행
- 코호트 : 동일한 특성을 갖는 고객 그룹
(ex) 23년 1월에 가입한 사용자들이 2월에 몇 명이나 재방문 하는지? 11월에는 몇 명이나 아직도 서비스를 사용하는지?
- 코호트 : 동일한 특성을 갖는 고객 그룹
- 마케팅 기여도 분석
- 다양한 광고 마케팅을 디지털 미디어 기반으로 수행
데이터 분석가의 역할
- 비즈니스 인텔리전스를 책임짐 (중요 지표 정의 → 시각화)
- 대시보드 : Tableau, Looker
- 오픈소스 : Superset
- 현업 팀들의 데이터 관련 질문에 대답
데이터 분석가의 스킬셋
- SQL, 파이썬
- 데이터 모델링, ELT, DBT툴
- 통계적 지식
- A/B 테스트 지식과 경험
- 지표 정의, 대시보드
- 비즈니스 도메인에 관한 깊은 지식
데이터 분석가의 딜레마
- 많은 수의 긴급한 데이터 관련 질문들에 시달림
- 현업팀에 소속되기도 함 → 소속감 불분명
🌳 데이터 팀 조직 구조 - 중앙 집중 구조
특징
- 모든 데이터 팀원들이 한 팀에 소속
- 일의 우선순위를 중앙 데이터 팀이 최종 결정
장점
- 데이터 팀원들 간의 협업이 수월
- 데이터 팀 내에서 커리어 패스가 생김
단점
- 현업 부서들의 만족도는 상대적으로 떨어짐
🌳 데이터 팀 조직 구조 - 분산 구조
특징
- 데이터 분석가, 과학자가 현업 조직 밑에 소속됨
- 데이터 엔지니어는 중앙에 있는 것이 일반적
- 일의 우선순위를 각 팀 별로 결정
- 2가지 형태
- 중앙 집중 구조 → 조직 개편을 통해 분산 구조화
- 자생적으로 데이터 인력을 키우거나 인수합병을 통해 조직별 데이터 팀이 존재
- 신뢰할 수 있는 데이터를 바탕으로 부가 가치 생성
장점
- 현업 부서들의 만족도 올라감
단점
- 데이터 팀원 간 지식 공유가 어려움
- 데이터 팀원들의 커리어 방향성을 잃게 됨
- 부서별로 업무가 중복될 확률이 높아짐
- 보안/규제 관련 이슈 발생 가능성 증가
개선 방안
- 데이터 메쉬 (Data Mesh) : 중앙 관리 표준을 염두에 둔 분산 데이터 아키텍처
- 조직별로 데이터 시스템을 별도로 구성해서 속도 및 효율을 높이되, 각 조직이 가지고 있는 데이터가 무엇인지 공유
- 아직은 기술이라기 보단 개념에 가까움 → 규모 및 성숙도가 준비된 조직에서 가능한 개념
🌳 데이터 팀 조직 구조 - 하이브리드 구조
- 가장 이상적인 조직 구조
- 중앙 데이터 팀에 소속된 팀원들이 파견 형태로 현업부서와 밀접하게 협업
🌳 데이터 조직의 일주일
애자일 개발 방법론
- 스프린트(Sprint) : 짧은 사이클(1~3주)
- 스프린트를 반복하는 방법론
- 매 스프린트 마다 작은 기능들을 바로 쓸 수 있도록 구현
- 스프린트마다 수행하는 업무 종류
- 플래닝 미팅 : 스프린트 동안 무엇을 할지 결정
- 스탠드업 미팅 : 매일 짧게 만나서 경과 보고
- 데모/회고 미팅 : 스프린트 마지막에 만나서 성과 공유 후 토론
- 스프린트 관리 : 애자일/스크럼 보드
- JIRA (가장 많이 사용)
- Swit, ClickUp 등
🌳 좋은 지표(KPI)란?
KPI (Key Performance Indicator)
- 조직 내에서 달성하고자 하는 중요한 목표
- 보통 정량적인 숫자 선호 (ex) 매출액, 유료 회원 비율
- 명확한 정의가 중요 → 지표 사전 필요
- KPI의 수는 적을수록 좋음
- 잘 정의된 KPI → 현재 상황을 알고 더 나은 계획 가능
- 정량적이기 때문에 시간에 따른 성과 추적 가능
- OKR과 같은 목표 설정 프레임워크의 중요한 포인트
지표(Metrics)란?
- KPI는 지표의 부분집합
- KPI : 회사에서 중요한 지표
- 팀 / 개인별로 중요한 성과 목표를 정량적으로 갖는 것이 중요
- 데이터 문해력(Data Literacy)의 시작점
KPI 기준
- Represent delivery of real value : KPI가 어떤 가치를 나타내야 함
ex) Total revenue : 매출 (‘등록 회원 수’는 가치 X) - Captures recurring value : 계속해서 재발생 되는 가치인가?
ex) MRR (Monthly Reccurring Revenue) - Lagging indicator : 후행지표
- 예측이 아닌 모든 일이 벌어지고 나서 최종적인 결과를 보여주는 지표
- ↔ 선행지표
- 보통 KPI는 후행지표 BUT 중요한 선행지표는 별도로 모니터링 할 필요가 있음
- Usable feedback mechanism : 현재 의미있는 서비스인지 피드백
ex) WAU, MAU
🌳 선행/후행 지표
Controllable Input Metrics VS Output Metrics
- Input metrics
- 선행 지표(Leading Indicator), 후행지표를 움직이는 지표, 직접 통제 가능한 지표
ex) 제품 다양성, 가격, 편의성, 새로운 강의 등
- 선행 지표(Leading Indicator), 후행지표를 움직이는 지표, 직접 통제 가능한 지표
- Ouput Metrics
- 후행 지표(Lagging Indicator), 선행지표의 결과, 직접 통제 불가능한 것
ex) MAU, 판매량, 계약건수, 매출, 이익 등
- 후행 지표(Lagging Indicator), 선행지표의 결과, 직접 통제 불가능한 것
- KPI에 영향을 주는 선행지표를 파악해서 개선하려고 해야 함
- 매출 = 가격(P) * 판매량(Q)
→ P가 고정되었다는 전제 하에 Q를 늘릴 방법을 찾아야 함
- 매출 = 가격(P) * 판매량(Q)
두 가지 중요한 KPI
- 매출
- 보통 매출이 훨씬 더 중요한 지표
- 서비스 사용 고객 수 (DAU, WAU, MAU)
- ‘서비스 사용(Active)’의 정의가 중요
- Active : 어떤 행동을 했을 때 활성화된 사용자라고 볼 것인가 (ex) 유료 / 무료, 공급자 / 소비자
- ‘서비스 사용(Active)’의 정의가 중요
🌳 시각화 대시보드 툴
시각화 툴이란?
- 대시보드, BI(Business Intelligence) 툴이라고 부름
- 중요한 정보(KPI, 지표)를 시간의 흐름으로 쉽게 볼 수 있게 해줌
- 결정권자들이 데이터 기반 의사결정을 할 수 있게 해줌
시각화 툴 종류
- Excel, Google Spreadsheet
- Python : 데이터 특성 분석(EDA)에 적합
- Looker (구글)
- Tableau (세일즈포스)
- Power BI (마이크로소프트)
- Apache Superset (오픈소스)
- Mode Analytics, ReDash
- Google Studio
- AWS Quicksight
🌳 [실습] 지표 정의하고 차트 만들어보기
Tableau 제품군
- Tableau Desktop
- Tableau Server
- Tableau Online
- Tableau Prep
- Tableau Public
- Tableau Mobile
Tableau Public
- 장점 : 무료
- 단점
- 추출된 데이터 원본(CSV 파일)만 데이터 소스로 지원
- 대시보드가 모두에게 공개됨 → 포트폴리오로 사용 가능
실습
- x축 : 시간 (Column)
- y축 : 실제로 알고 싶은 지표 (Row)
본 내용은 프로그래머스 '데이터 분석 데브코스' 를 수강하며 작성한 내용입니다.
728x90
728x90
SMALL
'🐥 Education > 프로그래머스 데이터분석데브코스' 카테고리의 다른 글
프로그래머스 데이터 분석 데브코스|Week1|1주차 회고 (0) | 2023.11.24 |
---|---|
[TIL] 프로그래머스 데이터 분석 데브코스|Week1|데이터 활용 시 고려할 점 (0) | 2023.11.24 |
[TIL] 프로그래머스 데이터 분석 데브코스|Week1|Gen AI를 이용한 생산성 증대 (1) | 2023.11.23 |
[TIL] 프로그래머스 데이터 분석 데브코스|Week1|데이터 기반 제품 개선 (1) | 2023.11.23 |
[TIL] 프로그래머스 데이터 분석 데브코스|Week1|데이터 문해력이란? (0) | 2023.11.21 |