02. 표준편차와 자유도

2025. 3. 9. 19:00·통계학

제곱근-평균-제곱 (Root Mean Square)

계산은 표현의 역순 (제곱 후 평균, 최종적으로 제곱근)

  • 제곱(S) : 모든 수를 제곱하여 부호를 없앤다.
  • 평균(M) : 제곱된 값들의 평균을 구한다.
  • 제곱근(R) : 제곱-평균된 값에 제곱근을 취한다

$RMS = \sqrt{숫자들의 제곱의  평균}$

 

표준편차 : $S_{y}$ / $SD_{y}$

표준편차의 계산

  • 표준편차(SD)는 "평균으로부터의 편차들"의 RMS와 "대략" 비슷
  • 표본 분산 및 표본 표준편차는 아래와 같다.
  • $S = \sqrt{\frac{1}{n-1}\sum_{i=1}^{n}(X_{i}-\overline{X})^{2}}$

-1과 관련된 개념이 자유도(degrees of freedom : 주어진 조건 하에서 자유롭게 변화할 수 있는 개수)

 

자유도의 정의

  • 자유도는 합쳐진 값들 중에서 실질적으로 독립인 값들의 개수
  • 표준편차 계산하는 경우의 자유도는 "자료의 개수 - 1"
  • 표준편차 계산의 대상이 되는 편차들의 합은 0이 됨. 편차들의 합이 0이 된다는 하나의 제약 조건이 자유도를 1만큼 감소시킨 것임

<자유도의 추가적인 배경 설명>

더보기
편차 = 평균으로부터의 편차!
대표값이 평균
개개인의 관측치가 평균으로부터 얼마나 떨어져 있는가
편차를 다 더하면 0이 됨.
9개의 편차를 알면 10번째를 알 수 있기에, 자유로운 것은 9개다. 그래서  관측치의 개수 -1을 하자.

값이 1개인 경우, 평균은 그 값 자체이며, 편차는 0이 됨
편차는 불확실성을 보고 싶어서 보는데, 이의 평균을 위하여 RMS를 계산 = 0.
투자를 한다는 가정 하에 이렇게 보게 되면, 위험도가 없고 무조건 수익이 나는구나! 이는 착각이 된다.

이를 표준편차로 보게 되면, n-1을 하기 때문에 0/0 = 부정형이 되어 성립하지 않는다.
즉, 위험을 모른다. 알 수 없다가 답이 된다.

 

표준편차의 의미

  • 표준편차는 관측치들이 평균으로부터 얼마나 떨어져 있는지 알려줌
  • 68-95 법칙
    • 관측치들의 약 68% 정도가 평균으로부터 1 표준편차 ($1\sigma $) 이내로 떨어져 있다.
    • 관측치들의 약 95% 정도가 평균으로부터 2 표준편차 ($2\sigma $) 이내로 떨어져 있다.
    • 전제조건
      1. 히스토그램의 모양이 봉우리가 하나
      2. 히스토그램이 좌우 대칭
      3. 양쪽으로 갈수록 감소하는 종모양

https://ko.wikipedia.org/wiki/68-95-99.7_%EA%B7%9C%EC%B9%99

 

 

즉, 분포의 전반적인 모습, 중심, 개별 관측치와의 거리만 알면 근사하게 특정 수치의 위치를 알 수 있다.

 = 숫자 몇 개만으로 전체의 그림을 요약하여 볼 수 있는 힘이 있다

 

 

측정 오차 (measurement error)

  • 관측치와 실제 값의 차이
  • 측정오차가 존재하면, (관측치) = (실제 값) + (측정오차)
  • 측정오차의 대략적인 크기는 관측치들의 표준편차(SD)를 통해 알 수 있음
  • 표준편차(SD)의 크기는 한 번의 관측에서 측정오차가 어느 정도 될지 알려 줌

 

편의 (bias)

  • 방향성을 갖는 하나의 세계적인 오차
  • 측정오차와 함께 편의가 있으면, (관측치) = (실제 값) + (편의) + (측정오차)

 

이탈값 (outlier)

  • 극단적인 관측치

 

 

출처 : 류근관의 통계 특강 / 서울대학교 경제통계학 / 제6강 표준편차와 자유도

 

'통계학' 카테고리의 다른 글

05. 회귀분석  (0) 2025.03.14
04. 상관관계와 회귀직선  (0) 2025.03.12
03. 정규분포로의 근사 (백분위수, 사분위수)  (0) 2025.03.10
01. 평균과 중앙값  (0) 2025.03.09
'통계학' 카테고리의 다른 글
  • 05. 회귀분석
  • 04. 상관관계와 회귀직선
  • 03. 정규분포로의 근사 (백분위수, 사분위수)
  • 01. 평균과 중앙값
infinity-epoch
infinity-epoch
과거에 했던 공부와 앞으로 공부할 내용을 정리해보고자 블로그를 시작하게 되었습니다 일주일에 3개정도는 포스팅하는게 목표입니다 :-)
  • infinity-epoch
    infinity-epoch
    infinity-epoch
  • 전체
    오늘
    어제
    • 분류 전체보기 (7)
      • 통계학 (7)
      • Backend (0)
      • AI (0)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
    • 관리 페이지
    • 글쓰기
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    중회귀분석
    산포도
    변동의 분해
    백분위수
    확률밀도함수
    rmse
    회귀효과
    결합분포
    Percentile
    변수 변환
    simpson's paradox
    회귀오류
    statiscits
    최빈치
    등분산성
    r square
    Probability density function
    IQR
    root mean square error
    요인 통제
    normal distribution
    오차
    로그변환
    median
    사분위수
    homoskedestic
    density function
    degrees of freedom
    joint distribution
    회귀직선
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
infinity-epoch
02. 표준편차와 자유도
상단으로

티스토리툴바