일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 모두의연구소
- 생존코딩
- 모두의 연구소 # 오준석의생존코딩# 오름캠프
- 오준석의 생존코딩
- 오름캠프플러터
- ㅇ
- 오름캠프
- 패스트 캠퍼스
- 오준석의생존코딩
- #패스트캠퍼스 #내일배움카드 #국비지원 #K디지털기초역량훈련 #바이트디그리 #자바인강
- 모두연구소
- 오존석의 생존코딩
- Tag #패스트캠퍼스 #내일배움카드 #국비지원 #K디지털기초역량훈련 #바이트디그리 #자바인강
- 플러터
- 모두의연구소 오준석생존코딩 오름캠프
- Today
- Total
꾸준히 하고싶은 개발자
상관 분석+히트맵 본문
상관관계(correlation analysis)
상관분석 두변수 가 어떤 선형적 관계에 있는지를 분석하는 방법이다.
두 변수는 서로 독립적이거나 상관 된 관계일 수있는데 , 두 변수의 관계의 강도를 상관관계라고 한다.
상관 분석에서는 상관관계의 정도를 나타내는 단위로 모상관 계수 P를 사용한다.
인과 관계를 분석하는 회귀 분석과 달리 상관 계수 correlation coefficient 두변수 연관된 정도를 나타낼뿐 인과 관계를 설명하지 않으므로 정확한 예측치를 계산할 수없다.
단순 상관분석 simple correlation analysis : 두변수가 어느정도 강한 관계에 있는지 측정한다.
다중 상관분석multiple corrlation analysis: 새개 이상의 변수 간 관계의 강도를 측정한다.
편상관 분석partial correlation analysis :다른 변수와의 관계를 고정하고 두변수 간 관계의 강도를 나타내는 것이다.
상관관계 P
상관 계수는 P는 변수 간 관계의 정도(0~1)와 방향(+,-)을 하나의 수치로 요약해주는 지수로 -1~+1사이의 값을 가진다. 상관계수 가 +이면 양의 상관관계이며 한 변수가 증가하면 다른 변수도 증가한다. 상관계수가 -면 음의 상관관계이며 한 변수가 증가 할 때 다른 변수는 감소한다.
상관계수에 대한 해석은 분야에 따라 다르지만 일반적으로 다음과 같다.
- 0.0~0.2상관관계가 거의 없다.
- 0.2~0.4:약한 상관관계가 있다.
- 0.4~0.6:상관관계가 있다.
- 0.6~0.8:강한 상관관계가있다.
- 0.8~1.0:매우 강한 상관관계가있다.
피어슨 상관관계
상관계수 중에서 많이 사용하는 것은 피어슨 상관계수 pearson correlation coefficient 또는 Pearson's이다. 피어슨 상관계수는 r로 표현
상관분석 결과의 시각화
상관분석 결과를 시각화 할때는 두변수의 관계를 보여주는 산점도나 히트맵을 많이 사용한다.
타이타닉 상관관계분석하기
'python > BigdataAnalysis' 카테고리의 다른 글
로지스틱 회귀 분석 (0) | 2022.09.27 |
---|---|
텍스트 빈도 분석(영어) (0) | 2022.09.27 |
통계분석(기술통계분석+ 그래프) (0) | 2022.09.20 |
pandas (0) | 2022.09.19 |
numpy (0) | 2022.09.18 |