본문 바로가기
About Statistics (통계)

회귀분석, R squared (설명력??) 의 의미

by 용스토리랜드 2024. 8. 8.
R-squared: 0.952
Adj. R-squared: 0.936
F-statistic: 59.41
Prob (F-statistic): 0.00454

coef
Intercept: -27.8
X: 0.426

 

회귀모형이 얼마나 설명력을 갖는가? -> R_squared 확인

회귀모형이 통계적으로 유의한지, 유효한? -> F검정과 유의확률 (p(robability) value) 확인

회귀계수가 유의한지 ? -> 회귀계수의 t 값과 유의확률 (p value) 확인

 

R squared

- 결정계수

- 설명력

- target ( y ) 의 분산 (흩어진 정도) 를 95.2% 설명한다 ??

- 설명한다라는 말이 무슨뜻일까? 

- 회귀식과 자료간의 fit(적합도)의 수치화

- 설명력 = 적합도 

 

이미지 출처 : https://recipesds.tistory.com/entry/

 

 

우리가 예상할 수 있는 가장 쉬운 방법의 회귀선은 관측값들의 평균으로 예측해버리는 것 (엉망진창 회귀선)

 

이미지 출처 : https://recipesds.tistory.com/entry/

 

관측값에서 평균까지의 거리 : 관측값의 분산(편차,변동성)

 

분산 : (관측값 - 평균) 제곱합

 

SST : 관측값에서 관측값들의 평균까지의 거리 제곱 합

SSR : 회귀선에서 관측값들의 평균까지의 거리 제곱 합 

SSE : 관측값에서 회귀선까지의 거리 제곱 합

 

회귀선을 통해서 엉망진창 (평균 예측) 에서 SSR 만큼 개선했다.

 

이미지 출처 : https://recipesds.tistory.com/entry/

 

따라서, 엉망진창 회귀선으로부터 변동을 얼마나 개선했는가 , 설명했는가, 찾아낸 회귀선이 얼마나 잔차를 줄였느냐 와 같은 말.

R squared 0.952 :편차의 대부분 95.2%을 커버하고 있다.

 

반응형

'About Statistics (통계)' 카테고리의 다른 글

A/B 테스트(검정)란?  (0) 2024.08.07
통계 분포  (0) 2024.08.07
표본오차와 신뢰구간  (0) 2024.08.07
상관관계와 인과관계 | Correlation does not imply causation  (0) 2024.08.01
기술통계와 추론통계  (0) 2024.08.01