728x90
728x90
SMALL
💡 요약
- 데이터 관련 주의해야 할 이슈들
- 데이터 관련 최근 변화
- 다양한 데이터 관련 이슈
- 개인정보와 보호
- 개인 식별 정보
- 개인 식별 정보의 정의
- 개인정보 보호란?
- 개인정보 보호
- 개인정보 보호법
- 개인정보 법률 요약
- 내부 · 외부 위협
- 개인정보 보호법
- EU의 GDPR
- 미국의 CCPR, CCPA
- 미국의 HIPAA
💭 1주차 회고
🔗 프로그래머스 데이터 분석 데브코스|Week1 |1주차 회고
🌳 데이터 관련 주의해야 할 이슈들
데이터 관련 최근 변화
- 데이터 소스, 양의 폭발적 증가
- Data Warehouse → Data Lake
- Data Warehouse → Data Lake
- 모든 조직에서 데이터 생성과 사용 증가
- Data Decentralization : 데이터 조직의 분산
- Data Decentralization : 데이터 조직의 분산
- 데이터 사용자의 폭발적 증가
- Data Democratization : 데이터 민주화 → 필요한 사람이 접근
- SQL / Dashboard skill
- 클라우드 기본 사용
- 개인정보 보호법의 강화
다양한 데이터 관련 이슈
- 무분별한 개인정보 전파
- 한 번 테이블에 노출되면 불필요한 악순환 발생
- 해법
- 개인 정보 정의(PII)와 개인정보 생성 시점부터 태깅
- 개인정보 접근 권한 제어 · 로깅 → 감사 가능
- 특정 개인정보 추출 · 삭제 자동화
- 같은 데이터, 다른 해석
- 해법
- 지표 등의 정확한 정의 사전 필요 → 데이터 사전, 데이터 용어집
- 같은 데이터를 기반으로 사용해야 함
- 해법
- 너무 많은 대시보드, 비슷한 테이블들
- Data Democratization → 정보 과잉으로 이어지기 쉬움
- Data Discovery 이슈
- Data Infra 비용 증가
- 해법
- Data Catalog 도입
- 자동화 솔루션을 통해 메타 데이터부터 관리
- 데이터셋 오너 지정
- 주기적인 데이터 / 대시보드 청소 작업
- Data Catalog 도입
- 불분명한 데이터 오너십
- 데이터 양의 증가 → 데이터 품질 이슈로 이어짐
- 데이터 품질 이슈 : 데이터셋의 불분명한 오너십과 밀접한 관련
- 해법
- 메타 데이터부터 관리 시작
- 메타 데이터부터 관리 시작
- 데이터 양의 증가 → 데이터 품질 이슈로 이어짐
- 메타 데이터의 부족
- 메타 데이터 : 데이터에 대한 데이터
- 해법
- 중요 데이터별로 오너 지정
- 데이터별로 다양한 태그 · 분류체계 적용 (ex) PII
- 데이터 리니지 자동 파악 (데이터 계승도 관리)
- 조직이 커지며 Data Silo 발생
- 데이터 조직이 잘못 분산되면 데이터를 서로 공유하지 않는 현상 발생
- 동일 데이터를 여러 조직에서 중복 수집 · 처리
- 데이터 독점이 권력이 되기도 함
- 해법
- 조직 전반에 걸친 메타 데이터 관리 · 유지
- Data Mesh : 팀별로 데이터 시스템 유지하되 사용 데이터가 모든 팀에 공유되어야 함 (아직 초기 단계의 기술)
🌳 개인정보와 보호
개인 식별 정보
- PII (Personally Identifiable Information)
- 성명, 이메일주소, 전화번호, 주소, 신용카드 정보 등
- 준식별자
- 각각 보면 누군지 알 수 없지만 데이터를 조합했을 때 누군지 식별 가능한 정보 (ex) 나이, 직장 등
개인 식별 정보의 정의
- 개인정보보호법 제2조 1항
- ‘개인정보’란 살아 있는 개인에 관한 정보로서 성명, 주민등록번호 및 영상 등을 통하여 개인을 알아볼 수 있는 정보(해당 정보만으로는 특정 개인을 알아볼 수 없더라도 다른 정보와 쉽게 결합하여 알아볼 수 있는 것을 포함한다)를 말한다.
- ‘개인정보’란 살아 있는 개인에 관한 정보로서 성명, 주민등록번호 및 영상 등을 통하여 개인을 알아볼 수 있는 정보(해당 정보만으로는 특정 개인을 알아볼 수 없더라도 다른 정보와 쉽게 결합하여 알아볼 수 있는 것을 포함한다)를 말한다.
- 정보통신망법 제2조 6항
- ‘개인정보’란 생존하는 개인에 관한 정보로서 성명ᆞ주민등록번호등에 의하여 특정한 개인을 알아볼 수 있는 부호ᆞ문자ᆞ 음성ᆞ음향 및 영상 등의 정보(해당 정보만으로는 특정 개인을 알아볼 수 없어 다른 정보와 쉽게 결합하여 알아볼 수 있는 경우에는 그 정보를 포함한다)를 말한다.
- ‘개인정보’란 생존하는 개인에 관한 정보로서 성명ᆞ주민등록번호등에 의하여 특정한 개인을 알아볼 수 있는 부호ᆞ문자ᆞ 음성ᆞ음향 및 영상 등의 정보(해당 정보만으로는 특정 개인을 알아볼 수 없어 다른 정보와 쉽게 결합하여 알아볼 수 있는 경우에는 그 정보를 포함한다)를 말한다.
- 미국 CCPA : 미국 캘리포니아의 개인정보 보호법
- 개인으로만 국한되지 않고 가정(household) 등도 포함
🌳 개인정보 보호란?
개인정보 보호
- 개인의 정보를 적절한 동의 없이 저장 · 사용하지 않는 것
- 개인의 정보를 동의 없이 노출 · 배포하지 않는 것
- 기존에 동의 받은 개인정보 약관과 다른 행위를 하지 않는 것
- 기업의 데이터 카탈로그 / 거버넌스 도입의 가장 큰 이유
개인정보 보호법
- 국내
- 개인정보 보호법
- 통신사업자 대상의 정보통신망법
- 클라우드 컴퓨팅법
- 미국
- CCPA(California Consumer Privacy Act) → 개정 : CPRA(California Privacy Rights Act)
- HIPAA(Health Insurance Portability and Accountability Act)
- Cloud Act, Honest Ads Act, FOSTA, FCC Regulation
- 유럽연합
- GDPR
개인정보 법률 요약
- 특정 개인을 알아보기 어려운 정보는 개인정보가 아님
- 의무 수행 시 클라우드에도 개인정보 적재 및 처리 가능
- 개인정보 수집 방법, 내용, 목적, 사전 고지 및 동의
- 개인정보 위탁(AWS, GCP 등)에 대한 사전 고지
- 데이터 해외 이전 시 추가 고지 (국내 이전 시 불필요)
- 저장 · 전송 시 암호화가 필요한 정보
- 비밀번호, 바이오 정보, 주민번호, 신용카드번호, 계좌정보, 여권번호, 외국인 등록번호 등
내부 · 외부 위협
- 내부 위협 : 내부 사람들의 단순한 실수에서 비롯된 Data Leak
- 기관에 따라 14~37%로 예측 (ex) 구글 문서 공유 세팅 실수
- 위부 위협 : 해커, 랜섬웨어, 사이버 범죄조직, 국가 후원조직 등
🌳 개인정보 보호법 - EU의 GDPR
GDPR이란?
- 2018년 5월 25일부터 시행된 유럽연합의 개인정보 보호 법령
- 유렵연합 내 모든 회원국에 일괄 적용
- 적용 대상 기업
- 유럽연합 내의 회사가 아니어도 EU 사용자가 있는 웹서비스의 경우
- 글로벌 회사들이 GDPR 준수를 위해 많은 노력 → 데이터 카탈로그, 데이터 거버넌스
GDPR 위반 시 페널티
- 레벨1 : 일반적 위반사항
- 대리인 미지정 위반, 유출 통지 위반, 개인정보 처리활동 기록 위반 등
- 전 세계 매출액 2% (전년도 기준) or 1천만 유로 중 높은 금액
- 레벨2 : 중요한 위반 사항
- 국외이전 규정 위반, 개인정보 처리 기본원칙 위반, 정보주체의 권리 보장 의무 위반 등
- 전 세계 매출액 4% (전년도 기준) or 2천만 유로 중 높은 금액
GDPR 세부사항
- 이전보다 동의 요건 강화, 아동정보에 대해 더 강한 보호
- 민감정보의 처리는 원칙적으로 금지 (회원국에 따라 달라짐)
- 정보주체의 권리 강화 → 회사들은 30일 내에 응답해야 함
- 삭제권 : 정보주체는 본인에 관한 개인정보 삭제를 요구할 권리를 가짐
- 프로파일링 거부권 : 정보주체는 본인에게 중대한 영향을 미치는 사안을 프로파일링 등 자동화된 처리에
의해서만 결정하는 것에 반대할 권리를 가짐 - 처리제한권(신설) : 정보주체는 본인에 관한 개인정보의 처리를 차단하거나 제한을 요구할 권리를 가짐
- 정보이동권(신설) : 정보주체는 본인의 개인정보를 본인 또는 다른 사업자에게 전송토록 요구할 권리를 가짐
🌳 개인정보 보호법 - 미국의 CCPR, CCPA
CCPA
- 미국 캘리포니아의 개인정보 보호법
- 2020년 1월 1일부터 효력 발효
- 개인정보를 개인으로만 국한된 것이 아니라 가구(household)까지 확대
CPRA
- 2023년 1월 CCPA → CPRA로 개정
- GDPR과 비슷하게 개인의 정보주체권을 강조
🌳 개인정보 보호법 - 미국의 HIPAA
HIPAA
- 개인 의료 정보 보호를 목적으로 1996년부터 효력 발효
- ePHI(electronic Protected Health Information)
- EHR(개인 의료정보 보관 시스템)에서 발행하는 식별자
- EHR(Electronic health record) / EMR (Electronic Medical record) : 개인의 진찰, 처방, 입원 기록
HIPAA 위반 시 페널티
- Reasonable Cause : 이유가 있는 경우
- 사건마다 $100~$50,000
- 사건마다 $100~$50,000
- Willful Neglect : 고의적 책임이 있는 경우
- 사건마다 $10,000~$50,000 + 처벌
본 내용은 프로그래머스 '데이터 분석 데브코스' 를 수강하며 작성한 내용입니다.
728x90
728x90
SMALL
'🐥 Education > 프로그래머스 데이터분석데브코스' 카테고리의 다른 글
[TIL] 프로그래머스 데이터 분석 데브코스|Week2|Excel|데이터란 무엇인가 (0) | 2023.11.27 |
---|---|
프로그래머스 데이터 분석 데브코스|Week1|1주차 회고 (0) | 2023.11.24 |
[TIL] 프로그래머스 데이터 분석 데브코스|Week1|Gen AI를 이용한 생산성 증대 (1) | 2023.11.23 |
[TIL] 프로그래머스 데이터 분석 데브코스|Week1|데이터 기반 제품 개선 (1) | 2023.11.23 |
[TIL] 프로그래머스 데이터 분석 데브코스|Week1|데이터 기반 의사결정 (1) | 2023.11.21 |