제곱근-평균-제곱 (Root Mean Square)
계산은 표현의 역순 (제곱 후 평균, 최종적으로 제곱근)
- 제곱(S) : 모든 수를 제곱하여 부호를 없앤다.
- 평균(M) : 제곱된 값들의 평균을 구한다.
- 제곱근(R) : 제곱-평균된 값에 제곱근을 취한다
$RMS = \sqrt{숫자들의 제곱의 평균}$
표준편차 : $S_{y}$ / $SD_{y}$
표준편차의 계산
- 표준편차(SD)는 "평균으로부터의 편차들"의 RMS와 "대략" 비슷
- 표본 분산 및 표본 표준편차는 아래와 같다.
- $S = \sqrt{\frac{1}{n-1}\sum_{i=1}^{n}(X_{i}-\overline{X})^{2}}$
-1과 관련된 개념이 자유도(degrees of freedom : 주어진 조건 하에서 자유롭게 변화할 수 있는 개수)
자유도의 정의
- 자유도는 합쳐진 값들 중에서 실질적으로 독립인 값들의 개수
- 표준편차 계산하는 경우의 자유도는 "자료의 개수 - 1"
- 표준편차 계산의 대상이 되는 편차들의 합은 0이 됨. 편차들의 합이 0이 된다는 하나의 제약 조건이 자유도를 1만큼 감소시킨 것임
<자유도의 추가적인 배경 설명>
더보기
편차 = 평균으로부터의 편차!
대표값이 평균
개개인의 관측치가 평균으로부터 얼마나 떨어져 있는가
편차를 다 더하면 0이 됨.
9개의 편차를 알면 10번째를 알 수 있기에, 자유로운 것은 9개다. 그래서 관측치의 개수 -1을 하자.
값이 1개인 경우, 평균은 그 값 자체이며, 편차는 0이 됨
편차는 불확실성을 보고 싶어서 보는데, 이의 평균을 위하여 RMS를 계산 = 0.
투자를 한다는 가정 하에 이렇게 보게 되면, 위험도가 없고 무조건 수익이 나는구나! 이는 착각이 된다.
이를 표준편차로 보게 되면, n-1을 하기 때문에 0/0 = 부정형이 되어 성립하지 않는다.
즉, 위험을 모른다. 알 수 없다가 답이 된다.
표준편차의 의미
- 표준편차는 관측치들이 평균으로부터 얼마나 떨어져 있는지 알려줌
- 68-95 법칙
- 관측치들의 약 68% 정도가 평균으로부터 1 표준편차 ($1\sigma $) 이내로 떨어져 있다.
- 관측치들의 약 95% 정도가 평균으로부터 2 표준편차 ($2\sigma $) 이내로 떨어져 있다.
- 전제조건
- 히스토그램의 모양이 봉우리가 하나
- 히스토그램이 좌우 대칭
- 양쪽으로 갈수록 감소하는 종모양
즉, 분포의 전반적인 모습, 중심, 개별 관측치와의 거리만 알면 근사하게 특정 수치의 위치를 알 수 있다.
= 숫자 몇 개만으로 전체의 그림을 요약하여 볼 수 있는 힘이 있다
측정 오차 (measurement error)
- 관측치와 실제 값의 차이
- 측정오차가 존재하면, (관측치) = (실제 값) + (측정오차)
- 측정오차의 대략적인 크기는 관측치들의 표준편차(SD)를 통해 알 수 있음
- 표준편차(SD)의 크기는 한 번의 관측에서 측정오차가 어느 정도 될지 알려 줌
편의 (bias)
- 방향성을 갖는 하나의 세계적인 오차
- 측정오차와 함께 편의가 있으면, (관측치) = (실제 값) + (편의) + (측정오차)
이탈값 (outlier)
- 극단적인 관측치
출처 : 류근관의 통계 특강 / 서울대학교 경제통계학 / 제6강 표준편차와 자유도
'통계학' 카테고리의 다른 글
05. 회귀분석 (0) | 2025.03.14 |
---|---|
04. 상관관계와 회귀직선 (0) | 2025.03.12 |
03. 정규분포로의 근사 (백분위수, 사분위수) (0) | 2025.03.10 |
01. 평균과 중앙값 (0) | 2025.03.09 |