02. 표준편차와 자유도

2025. 3. 9. 19:00·통계학

제곱근-평균-제곱 (Root Mean Square)

계산은 표현의 역순 (제곱 후 평균, 최종적으로 제곱근)

  • 제곱(S) : 모든 수를 제곱하여 부호를 없앤다.
  • 평균(M) : 제곱된 값들의 평균을 구한다.
  • 제곱근(R) : 제곱-평균된 값에 제곱근을 취한다

$RMS = \sqrt{숫자들의 제곱의  평균}$

 

표준편차 : $S_{y}$ / $SD_{y}$

표준편차의 계산

  • 표준편차(SD)는 "평균으로부터의 편차들"의 RMS와 "대략" 비슷
  • 표본 분산 및 표본 표준편차는 아래와 같다.
  • $S = \sqrt{\frac{1}{n-1}\sum_{i=1}^{n}(X_{i}-\overline{X})^{2}}$

-1과 관련된 개념이 자유도(degrees of freedom : 주어진 조건 하에서 자유롭게 변화할 수 있는 개수)

 

자유도의 정의

  • 자유도는 합쳐진 값들 중에서 실질적으로 독립인 값들의 개수
  • 표준편차 계산하는 경우의 자유도는 "자료의 개수 - 1"
  • 표준편차 계산의 대상이 되는 편차들의 합은 0이 됨. 편차들의 합이 0이 된다는 하나의 제약 조건이 자유도를 1만큼 감소시킨 것임

<자유도의 추가적인 배경 설명>

더보기
편차 = 평균으로부터의 편차!
대표값이 평균
개개인의 관측치가 평균으로부터 얼마나 떨어져 있는가
편차를 다 더하면 0이 됨.
9개의 편차를 알면 10번째를 알 수 있기에, 자유로운 것은 9개다. 그래서  관측치의 개수 -1을 하자.

값이 1개인 경우, 평균은 그 값 자체이며, 편차는 0이 됨
편차는 불확실성을 보고 싶어서 보는데, 이의 평균을 위하여 RMS를 계산 = 0.
투자를 한다는 가정 하에 이렇게 보게 되면, 위험도가 없고 무조건 수익이 나는구나! 이는 착각이 된다.

이를 표준편차로 보게 되면, n-1을 하기 때문에 0/0 = 부정형이 되어 성립하지 않는다.
즉, 위험을 모른다. 알 수 없다가 답이 된다.

 

표준편차의 의미

  • 표준편차는 관측치들이 평균으로부터 얼마나 떨어져 있는지 알려줌
  • 68-95 법칙
    • 관측치들의 약 68% 정도가 평균으로부터 1 표준편차 ($1\sigma $) 이내로 떨어져 있다.
    • 관측치들의 약 95% 정도가 평균으로부터 2 표준편차 ($2\sigma $) 이내로 떨어져 있다.
    • 전제조건
      1. 히스토그램의 모양이 봉우리가 하나
      2. 히스토그램이 좌우 대칭
      3. 양쪽으로 갈수록 감소하는 종모양

https://ko.wikipedia.org/wiki/68-95-99.7_%EA%B7%9C%EC%B9%99

 

 

즉, 분포의 전반적인 모습, 중심, 개별 관측치와의 거리만 알면 근사하게 특정 수치의 위치를 알 수 있다.

 = 숫자 몇 개만으로 전체의 그림을 요약하여 볼 수 있는 힘이 있다

 

 

측정 오차 (measurement error)

  • 관측치와 실제 값의 차이
  • 측정오차가 존재하면, (관측치) = (실제 값) + (측정오차)
  • 측정오차의 대략적인 크기는 관측치들의 표준편차(SD)를 통해 알 수 있음
  • 표준편차(SD)의 크기는 한 번의 관측에서 측정오차가 어느 정도 될지 알려 줌

 

편의 (bias)

  • 방향성을 갖는 하나의 세계적인 오차
  • 측정오차와 함께 편의가 있으면, (관측치) = (실제 값) + (편의) + (측정오차)

 

이탈값 (outlier)

  • 극단적인 관측치

 

 

출처 : 류근관의 통계 특강 / 서울대학교 경제통계학 / 제6강 표준편차와 자유도

 

'통계학' 카테고리의 다른 글

05. 회귀분석  (0) 2025.03.14
04. 상관관계와 회귀직선  (0) 2025.03.12
03. 정규분포로의 근사 (백분위수, 사분위수)  (0) 2025.03.10
01. 평균과 중앙값  (0) 2025.03.09
'통계학' 카테고리의 다른 글
  • 05. 회귀분석
  • 04. 상관관계와 회귀직선
  • 03. 정규분포로의 근사 (백분위수, 사분위수)
  • 01. 평균과 중앙값
infinity-epoch
infinity-epoch
과거에 했던 공부와 앞으로 공부할 내용을 정리해보고자 블로그를 시작하게 되었습니다 일주일에 3개정도는 포스팅하는게 목표입니다 :-)
  • infinity-epoch
    infinity-epoch
    infinity-epoch
  • 전체
    오늘
    어제
    • 분류 전체보기 (7)
      • 통계학 (7)
      • Backend (0)
      • AI (0)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
    • 관리 페이지
    • 글쓰기
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    degrees of freedom
    백분위수
    요인 통제
    사분위수
    homoskedestic
    산포도
    변동의 분해
    변수 변환
    회귀오류
    등분산성
    median
    normal distribution
    최빈치
    확률밀도함수
    rmse
    회귀직선
    joint distribution
    Percentile
    Probability density function
    root mean square error
    결합분포
    IQR
    statiscits
    오차
    density function
    회귀효과
    simpson's paradox
    중회귀분석
    로그변환
    r square
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
infinity-epoch
02. 표준편차와 자유도
상단으로

티스토리툴바