주식투자

[초급 6] S&P 500의 수익률 분포는 정규 분포와 유사할까? (정규 분포로 보는 큰 수의 법칙)

오렌지사과키위 2024. 11. 4. 14:17

이제 투자 성과 분석에 활용할 수 있는 정규 분포라는 강력한 도구를 손에 넣었습니다. 이 도구는 양날의 검과 비슷합니다. 자산의 수익률을 간결하게 모델링할 수 있지만, 현실과의 오차는 클 수 있습니다. 마치 고장 난 공학 계산기 같은 것입니다. 2 + 2 = 3.7로,  + 2 + 2 = 6.3으로 계산해 줍니다. 더하는 항이 늘어날수록 오차는 커집니다. 여러분이 피타고라스 학파라면 계산기에 문제가 있는 것이 아니라, 현실에 문제가 있다고 생각할 수도 있습니다. 지난 글: 투자 성과 분석의 초급 - 5. 정규 분포의 성질과 투자에서의 활용 예

아래는 S&P 500 지수의 1988년 1월 4일부터 2024년 11월 1일까지 약 36년간의 수익률 그래프입니다. 배당 재투자를 가정하였습니다.

S&P 500 지수의 TR 수익률
S&P 500 지수의 TR 수익률

아름답습니다. 이 그래프에서 수학적 아름다움을 느끼지 못한다면, 당신은 피타고라스 학파의 일원이 아닐 수 있습니다.

주의: 이 글은 특정 상품 또는 특정 전략에 대한 추천의 의도가 없습니다. 이 글에서 제시하는 수치는 과거에 그랬다는 기록이지, 앞으로도 그럴 거라는 예상이 아닙니다. 분석 대상, 기간, 방법에 따라 전혀 다른 결과가 나올 수 있습니다. 데이터 수집, 가공, 해석 단계에서 의도하지 않은 오류가 있을 수 있습니다. 일부 설명은 편의상 현재형으로 기술하지만, 데이터 분석에 대한 설명은 모두 과거형으로 이해해야 합니다.

S&P 500 TR 지수의 정규 분포 모델

아래는 S&P 500 TR 지수의 1달(20거래일)과 1년(240거래일) 수익률 분포와 이에 대응하는 정규 분포를 함께 나타낸 그래프입니다.

S&P 500 지수의 1달 수익률 분포S&P 500 지수의 1년 수익률 분포
S&P 500 지수의 1달 또는 1년 수익률 분포

여전히 아름답습니다. 지금이라도 수학의 오묘함은 느꼈다면, 당신은 피타고스파 학파 입문의 기본 자격 조건을 갖춘 것입니다. 아이돌 팬클럽이 그렇지 않습니까? 아이돌에 대해 매력을 느껴야 자격이 생깁니다.

실제 수익률 분포와 정규 분포가 조금 다르긴 하지만, 대충 비슷하다고 보겠습니다. 1달 평균 수익률은 0.95%였습니다. 1년 평균 수익률은 0.95% × 12 = 11.40%로 추정할 수 있는데, 오른쪽의 11.68%와 비슷합니다. 참고: 이 글은 설명의 편의를 위해 단리로 계산합니다.

표준 편차는 4.34%였습니다. 서로 독립이면서 동일한 두 정규 분포를 합하면 아래와 같습니다. 참고: 현실의 수익률은 독립적이지 않습니다.

N(µ, σ²) + N(µ, σ²) = N(2µ, 2σ²)

평균과 분산 모두 2배가 됩니다. 표준 편차는 분산의 양의 제곱근이니 √2배가 됩니다. 12달치를 더하면 평균은 12배, 표준 편차는 √12 ≒ 3.46배 정도가 됩니다. 4.34% × √12 ≒ 15.02%입니다. 오른쪽의 15.78%와 비슷합니다.

신기하지 않습니까? 아직 늦지 않았습니다. 피타고라스 학파의 문은 항상 여러분에게 열려 있습니다. 현실은 정규 분포와 꽤 다르지만, 어느 정도는 설명 가능하다고 볼 수 있습니다. 참고: 기간이 길어지면 오차가 증폭될 수 있습니다.

정규 분포로 보는 장기 투자에서의 위험 감소

k개월 연달아 투자하면 기대 수익률은 k배 증가합니다. 표준 편차는 √k배 증가합니다. 무슨 의미일까요?

연 수익률이 N(10%, 20%²) 정규 분포를 따르는 이상적인(비현실적인) 자산이 있다고 하겠습니다. 1년간 투자하면 수익률이 10% ± 20% = [-10%, 30%]인 1 표준 편차 구간에 속할 확률은 아래 그래프에서 보듯 대략 68%입니다. 참고: 이 연재는 순차적으로 보는 것이 이해에 도움이 됩니다.

정규 분포에서 표준 편차에 따른 확률 [출처: 위키백과]

4년간 투자하면 어떻게 될까요? 기대 수익률은 10% × 4 = 40%가 됩니다. 표준 편차는 20% × √4 = 20% × 2 = 40%가 됩니다. 투자 수익률이 40% ± 40% = [0%, 80%]인 1 표준 편차 구간에 속할 확률이 68%입니다.

1년간 투자하면 원금 손실 가능성이 (100% - 68%) / 2 = 16% 이상이었습니다. 4년간 투자하면 그 확률이 16%가 됩니다. 참고: 정규 분포는 좌우 대칭이므로 한쪽만 보면 확률이 절반이 됩니다. 

16년간 투자하면 어떻게 될까요? 기대 수익률은 10% × 16 = 160%가 됩니다. 표준 편차는 20% × √16 = 20% × 4 = 80%가 됩니다. 투자 수익률이 160% ± 80% = [80%, 240%]인 1 표준 편차 구간에 속할 확률이 68%입니다. 원금 손실 가능성은 16% 이하가 됩니다. 참고: 1년의 경우 -1σ의 위치가 -10% < 0%이고, 4년은 0% = 0%이고, 16년은 80% > 0%이기 때문입니다.

16년간 투자했을 때 2 표준 편차 구간은 160% ± 80% × 2 = [0%, 320%]입니다. 이제 원금 손실이 발생할 가능성은 2.3% 이하가 됩니다. 참고: 위의 그림에서 왼쪽 끝에 있는 0.1% + 2.1%를 더하면 됩니다. 그림의 수치는 근사치입니다.

투자 기간이 점차 길어질수록 평균 수익률 대비 표준 편차가 줄어듭니다. 1년은 10% / 20% = 0.5였지만, 4년은 40% / 40% = 1이 되었고, 16년은 160% / 80% = 2가 되었습니다.

수익률을 표준 편차로 나누는 수식 µ / σ는 어디서 본 듯하지 않습니까? 무위험 수익률이나 벤치마크 수익률을 고려하면 샤프 비율(Sharpe Ratio)이 됩니다. 샤프 비율과 같은 투자 효율 지표도 투자 기간에 영향을 받을 수 있으니 해석에 유의해야 한다는 의미가 됩니다. 여기에 대해서는 다른 글에서 다시 살펴봅니다. 관련 글: 투자 성과 분석의 기초 - 14. 투자 효율 = 수익과 위험의 비 (샤프 비율 = 수익률 / 표준편차)

S&P 500 TR의 연평균 수익률과 표준 편차로 모델링한 N(11.68%, 15.78%²)의 최대 20년까지의 연속 투자 성과를 그래프로 나타내 보면 다음과 같습니다. 참고: 이해의 편의를 위해 누적 수익률을 산술합으로 계산했습니다. 매년 동일한 금액을 유지하면서 단리 투자하는 경우에 해당됩니다.

S&amp;P 500 TR의 1년 수익률 정규 분포 N(11.68%&amp;#44; 15.78%&sup2;)의 다년 투자 결과 (수익률)S&amp;P 500 TR의 1년 수익률 정규 분포 N(11.68%&amp;#44; 15.78%&sup2;)의 다년 투자 결과 (연평균 수익률)
S&P 500 TR의 1년 수익률 정규 분포 N(11.68%, 15.78%²)의 다년 투자 결과

중앙값(Median)을 포함하여 1 또는 2 표준 편차에 해당되는 순위로 함께 표시했습니다. 왼쪽 그래프를 보면 상위 97%(하위 3%) 순위에 해당되는 투자의 경우에도 7년 정도가 지나면 원금 손실 가능성이 없어졌습니다. 7년 투자 시 원금 손실 가능성이 3% 이하라는 뜻이 됩니다.

오른쪽 그래프는 산술 연평균 수익률입니다. 이전 글에서 여러 번 등장한 장기 투자 시 기대 수익률로 수렴하는 큰 수의 법칙 현상이 나타남을 보여주고 있습니다.

정규 분포와 현실

현실과는 어느 정도 비슷할까요? 상위 5%, 25%, 50%(중앙값), 75%, 95% 순위 수익률을 정규 분포로 모델링한 경우와 S&P 500 투자 결과를 함께 그려 비교해 봅니다.

왼쪽 그래프에서 실선은 S&P 500에 매년 동일한 금액으로 단리 투자한 결과입니다. 첫 해에 100만원을 투자했다면, 다음 해에도 전년도 손익에 관계없이 다시 100만원으로 투자금을 맞춥니다.

전년도에 수익이 발생했다면 일부 수익 실현을 하고, 손실이 생겼다면 투자금을 추가합니다. 2년을 투자한다면, 첫 해와 두 번째 해의 수익률을 합하면 총 수익률이 됩니다.

단리 투자를 가정한 이유는 복리 투자 모델링에는 정규 분포보다 로그 정규 분포가 적절하기 때문입니다. 로그 정규 분포의 특성은 직관적으로 이해하기 어려울 수 있기에, 이 글에서는 단리 투자와 정규 분포로 설명합니다.

왼쪽 그래프를 보면, 대략 8년 정도까지 꽤 유사합니다. 이후로는 수익률이 높을수록 모델과 현실의 차이가 커지는 듯합니다. 차이의 일부는 S&P 500의 긴 횡보 기간 때문입니다.

S&P 500은 2000년부터 2012년쯤까지 12년 정도 횡보했습니다. 횡보 기간은 전체 기간 36년의 가운데쯤 위치해 있습니다. 투자 기간이 10년 정도를 넘어가면 횡보 기간이 일부라도 포함된 투자 사례가 상대적으로 늘어납니다. 이 때문에 투자 기간이 길어지면 상위 순위의 수익률이 모델의 추정치보다 낮아질 수 있습니다.

정규 분포는 여러 한계가 있지만, 어느 정도 현실과 유사한 면도 있기에 간편한 모델링 도구가 될 수 있습니다.

정리하며

정규 분포를 이용하여 S&P 500 지수를 모델링해 보았습니다. 현실과 비슷한 면도 있지만 다른 면도 있습니다. 차이가 발생할 수 있다는 사실을 어느 정도 감안하고 사용한다면 괜찮은 도구가 될 수 있습니다.

정규 분포는 평균과 표준 편차로 정의됩니다. 연속된 투자는 두 정규 분포를 더하는 것으로 간주할 수 있습니다. 두 평균이 플러스 값이라면, 합해진 정규 분포의 평균과 표준 편차 모두 늘어납니다.

평균이 늘어나는 정도에 비해 표준 편차는 더디게 증가합니다. 장기 투자 시 상대적인 위험이 감소하는 현상에 대한 수학적 설명입니다. 조금 더 직관적으로 설명한다면, 연속된 투자에서 수익과 손실이 시간상으로 일부 서로 상쇄되기 때문입니다.

주의: 아무리 복잡하고 세련된 방법을 사용하더라도 과거 데이터에서 추출한 통계량은 과거에 대한 요약일 뿐입니다. 도출한 정규 분포는 미래에 대한 예측이 아닙니다. 다만 과거와 미래는 단절된 것이 아니기에, 통계량의 경향이나 특성이 미래에도 어느 정도 나타날 가능성이 있을 뿐입니다.

이어지는 글: 투자 성과 분석의 초급 - 7. 정규 분포에서 표준 편차가 변하면 장기 투자에 어떤 현상이 발생할까?

함께 읽으면 좋은 글:

도움이 되었다면, 이 글을 친구와 공유하는 건 어떻까요?

facebook twitter kakaoTalk naver band