정보관리기술/통계확률

빅데이터 분석(상관관계 vs 인과관계)

아이티신비 2024. 4. 4. 09:30

문제8) 빅데이터 분석에서 상관관계 (Correlation) 와 인과관계 (Causation) 에 대하여 비교하여 설명하시오

답)

 

1. 두 결과의 관계 분석. 상관관계(Correlation)와 인과관계(Causation) 개념 비교

구분
상관관계(Correlation)
인과관계(Causation)
개념
변수간의 선형 관계(양/음/무의 관계)를 표현하는 수학적 함수관계
선행하는 한 변인이 후행하는 다른 변인의 원인이 되고 있다고 믿어지는 실험적 관계
개념도
  • 상관관계는 원인이 아닌 다른 변수에 의한 변화에 초점, 인과관계는 결과도출시 원인에 초점

 

2. 상관관계(Correlation)와 인과관계(Causation) 상세 비교

구분
상관관계(Correlation)
인과관계(Causation)
분석목적
두 가지 현상 가운데 한쪽이 변화하면
다른 한쪽도 따라서 변화하는 관계 분석
한 현상은 다른 현상의 원인이 되고 그 다른
현상은 먼저의 현상의 결과가 되는 관계 분석
관계분석
두 변수 간 선형적 관계
(양/음/무의 상관관계)
선행 사건에 따라 후행 사건에 영향을 주는
비대칭적 관계
원인결과
관련성
원인과 결과의 관련성 없음
원인과 결과는 관련성 있음
시간성
결과 도출 시 변수 연관성
원인은 결과보다 시간적으로 앞섬
관리지표
선행지표, 후행지표
선행 지표
분석기법
시계열분석, 생존분석
회귀분석, 이준치분석법, A/B 테스트
도출모형
상관계수(피어슨, 스피어만)
기준선 모형
  • 상관관계는 인과관계의 필요조건이 될 수 있으나, 충분조건이 될 수 없음

 

3. 상관관계(Correlation)와 인과관계(Causation) 의사결정 활용 비교

구분
상관관계(Correlation)
인과관계(Causation)
상황
아이스크림 판매량 증가시기와 익사사고 발생 증가시기가 유사
목적
예측
설명
주 분야
경제학, 경영학, 데이터과학 등 상경계열
의학, 약학, 심리학 등 상경계열을 제외한 일반계열
수준
상관관계로 충분, 빅데이터 시대에 따라
아이스크림 판매량이 늘어날 때쯤
익사사고 발생건수 증가 예측 가능
상관관계 이상의 인과관계를 설득하기 위해
비허위성이 반드시 필요함.
아이스크림 판매량과 익사사고 사례처럼
잘못된 인과관계 극도로 경계
  • 문제 해결을 위해 설명모형 혹은 예측모형 중 어느 모형이 적합한지 확인하고 적용 필요

 


 

공감과 댓글은 아이티신비에게 큰 힘이 됩니다.

블로그 글이 유용하다면 블로그를 구독해주세요.♥

 

 

'정보관리기술 > 통계확률' 카테고리의 다른 글

정규분포 특징  (24) 2024.04.06
추정통계의 표본과 불편 추정량 / ①  (27) 2024.04.05
귀납적사고와 기계학습  (23) 2024.04.05
베르누이 분포, 기하 분포 / ①  (24) 2024.04.04
t-검정(t-test) / ①  (25) 2024.04.01