문제8) 빅데이터 분석에서 상관관계 (Correlation) 와 인과관계 (Causation) 에 대하여 비교하여 설명하시오
답)
1. 두 결과의 관계 분석. 상관관계(Correlation)와 인과관계(Causation) 개념 비교
구분
|
상관관계(Correlation)
|
인과관계(Causation)
|
개념
|
변수간의 선형 관계(양/음/무의 관계)를 표현하는 수학적 함수관계
|
선행하는 한 변인이 후행하는 다른 변인의 원인이 되고 있다고 믿어지는 실험적 관계
|
개념도
|
|
|
|
2. 상관관계(Correlation)와 인과관계(Causation) 상세 비교
구분
|
상관관계(Correlation)
|
인과관계(Causation)
|
분석목적
|
두 가지 현상 가운데 한쪽이 변화하면
다른 한쪽도 따라서 변화하는 관계 분석 |
한 현상은 다른 현상의 원인이 되고 그 다른
현상은 먼저의 현상의 결과가 되는 관계 분석 |
관계분석
|
두 변수 간 선형적 관계
(양/음/무의 상관관계) |
선행 사건에 따라 후행 사건에 영향을 주는
비대칭적 관계 |
원인결과
관련성 |
원인과 결과의 관련성 없음
|
원인과 결과는 관련성 있음
|
시간성
|
결과 도출 시 변수 연관성
|
원인은 결과보다 시간적으로 앞섬
|
관리지표
|
선행지표, 후행지표
|
선행 지표
|
분석기법
|
시계열분석, 생존분석
|
회귀분석, 이준치분석법, A/B 테스트
|
도출모형
|
상관계수(피어슨, 스피어만)
|
기준선 모형
|
|
3. 상관관계(Correlation)와 인과관계(Causation) 의사결정 활용 비교
구분
|
상관관계(Correlation)
|
인과관계(Causation)
|
상황
|
아이스크림 판매량 증가시기와 익사사고 발생 증가시기가 유사
|
|
목적
|
예측
|
설명
|
주 분야
|
경제학, 경영학, 데이터과학 등 상경계열
|
의학, 약학, 심리학 등 상경계열을 제외한 일반계열
|
수준
|
상관관계로 충분, 빅데이터 시대에 따라
아이스크림 판매량이 늘어날 때쯤 익사사고 발생건수 증가 예측 가능 |
상관관계 이상의 인과관계를 설득하기 위해
비허위성이 반드시 필요함. 아이스크림 판매량과 익사사고 사례처럼 잘못된 인과관계 극도로 경계 |
|
공감과 댓글은 아이티신비에게 큰 힘이 됩니다.
블로그 글이 유용하다면 블로그를 구독해주세요.♥
'정보관리기술 > 통계확률' 카테고리의 다른 글
정규분포 특징 (24) | 2024.04.06 |
---|---|
추정통계의 표본과 불편 추정량 / ① (27) | 2024.04.05 |
귀납적사고와 기계학습 (23) | 2024.04.05 |
베르누이 분포, 기하 분포 / ① (24) | 2024.04.04 |
t-검정(t-test) / ① (25) | 2024.04.01 |