주식투자

[데이터 분석 6] 수익률 분포를 정규 분포로 모델링하여 위험을 추정해 보자 (구글 시트 편)

오렌지사과키위 2025. 1. 7. 13:15
반응형

이전 글에서 SPY의 1년 수익률 분포를 정규 분포와 비교해 보았습니다. SPY 수익률 분포는 정규 분포와 비슷한 면도 있었고, 그렇지 않은 점도 있었습니다. SPY 수익률 분포는 정규 분포에 비해 중앙에 분포가 더 밀집되어 있었고, 큰 손실이 발생하는 빈도는 정규 분포에 비해 높았습니다. 이전 글: [데이터 분석 5] 수익률 분포를 정규 분포와 함께 그려보자 (구글 시트 편)

자산의 수익률 분포는 정규 분포와 다른 점이 꽤 있지만, 정규 분포는 현실적으로 손쉽게 데이터 분석에 사용할 수 있는 유용한 모델 중에 하나입니다. 투자자는 정규 분포를 가정하여 분석할 때 기반이 되는 과거 데이터는 정규 분포와 다를 수 있으며, 경우에 따라서는 위험이 과소 평가될 수도 있음을 인지하고 있어야 합니다. 참고: [초급 4] 투자에서 수익률 모델로 왜 정규 분포를 사용할까?

자산의 수익률 분포를 정규 분포로, 매년 수익률 분포가 서로 독립이라 가정했을 때, 장기 투자를 하면 위험이 어떻게 변하는지 그래프로 그려봅니다. 참고: [초급 13] 장기 투자에서의 위험의 변화를 쉽게 표현하고 비교하는 방법은 무엇일까?

주의: 이 글은 특정 상품 또는 특정 전략에 대한 추천의 의도가 없습니다. 이 글에서 제시하는 수치는 과거에 그랬다는 기록이지, 앞으로도 그럴 거라는 예상이 아닙니다. 분석 대상, 기간, 방법에 따라 전혀 다른 결과가 나올 수 있습니다. 데이터 수집, 가공, 해석 단계에서 의도하지 않은 오류가 있을 수 있습니다. 일부 설명은 편의상 현재형으로 기술하지만, 데이터 분석에 대한 설명은 모두 과거형으로 이해해야 합니다.

SPY에 장기 투자했을 때의 수익률 분포 추정

SPY의 1년(250거래일) 평균 수익률은 11.7%였고, 표준 편차는 16.9%였습니다. 정규 분포로 모델링하면 N(11.7%, 16.9%²)으로 표현할 수 있습니다. 아래는 이전 글에서 살펴본 표준 편차를 계산하는 구글 시트와 SPY 수익률 분포를 정규 분포와 함께 표시한 그림입니다.

SPY의 1년(250거래일) 수익률에 대한 평균과 표준 편차 및 정규 분포 모델

매년 수익률이 정규 분포를 따르고, 수익률 분포가 서로 독립이라면, k년 투자 시 수익률은 평균과 분산 모두 k배가 됩니다. 표준 편차는 분산의 양의 제곱근이니 √k배가 됩니다. 참고: [초급 7] 정규 분포에서 표준 편차가 변하면 장기 투자에 어떤 현상이 발생할까?

k × N(μ, σ²) = N(, kσ²)

이러한 가정하에서, SPY 투자 기간에 따른 수익률의 정규 분포를 추정할 수 있습니다. SPY의 과거 데이터를 요약하여 생성한 1년 수익률 분포가 정규 분포를 따른다는 가정하에서 분석하는 것입니다. 실제와 상당히 다를 수 있으며, 실제와 유사하더라도 이는 동일한 데이터에 기반해서 통계량을 추출했기 때문에 자연스러운 현상입니다. 참고: [초급 부록 A3] 레버리지 ETF는 기초 자산(본주)보다 얼마나 위험할까? (SPY vs SSO = SPY ×2)

SPY의 1년 수익률과 표준 편차를 참조로 가져오고, 투자 기간에 따른 평균과 표준 편차를 계산합니다. 1년 평균 수익률은 k배로, 표준 편차는 √k배를 하면 됩니다. SQRT() 함수를 사용할 수 있습니다.

정규 분포로 모델링한 SPY의 투자 기간별 평균 수익률과 표준 편차

그림에서 투자 기간(Years) 옆에 있는 평균(Mean)은 말 그대로 평균입니다. 정규 분포를 가정했기에 좌우대칭으로 수익률이 분포하기에 이 경우 평균은 중앙값이 됩니다. 101명이 투자했다면 수익률 순위 51등에 해당되는 투자자가 얻을 거라 추정한 수익률로 볼 수 있습니다.

대개의 투자자가 관심을 가지는 것은 위험입니다. SPY의 장기 수익률이 높을 거라 기대하지만, 운이 나쁘면 손실이 어느 정도 발생할 수 있는지 궁금할 수 있습니다. 정규 분포에서 특정 누적 확률에 해당하는 값을 구하는 함수는 NORMINV()  함수입니다. 이 함수를 이용하면, 다음의 왼쪽 그림과 같이 특정 순위에 해당되는 수익률을 추정할 수 있습니다.

SPY의 투자 기간에 따른 추정 누적 수익률 (정규 분포 가정)

중앙값(Mean, 여기서는 정규 분포이기에 평균이 중앙값이 됩니다), 하위 25%, 하위 5%에 대해 추정한 수익률로 그래프를 그린 결과가 오른쪽 그림입니다.

연평균 수익률로 살펴본 장기 투자 시 수익률 변화

그래프가 그려지기는 하지만 한눈에 파악하기 어렵습니다. 다음은 누적 수익률을 1년 평균 수익률로 환산해서 다시 그린 그림입니다.

오른쪽 그래프는 y축 최소값과 최대값을 각각 -20%(-0.2)와 20%(0.2)로 설정하고, 세로축 눈금이 5% 단위로 나타나도록 세로 격자선 개수를 9개로 설정한 결과입니다.

이제 대략적인 위험을 추정해 볼 수 있습니다. 빨간색 선으로 표시된 하위 25%, 즉 75% 확률로 1년 투자 시 손실이 발생하지 않았다고 추정되었습니다. 노란색 선으로 표시된 운이 나쁜 하위 5% 순위의 투자자의 경우 대략 6년간 투자했다면, 원금 손실이 사라졌다고 추정되었습니다. 다르게 말하면 6년간 투자하면 95% 확률로 원금 손실이 없어졌다고 볼 수 있습니다.

그래프에서 볼 수 있듯, 장기 투자 시 순위에 관계없이 모든 1년 평균 수익률이 평균(11.7%)으로 수렴하는 큰 수의 법칙과 비슷한 현상이 나타납니다. 수익률 분포를 서로 독립인 정규 분포로 가정했기 때문에 통계학적으로 자연스러운 현상입니다. 정규 분포와 다소 다른 면이 있는 시장 지수 ETF의 수익률도 이러한 현상이 상당 부분 나타납니다. 참고: [기초 15 마지막 편] 장기 투자는 왜 위험이 줄어드는가? (불확실성이 누적될수록 확실해진다고?)

주의: SPY의 과거 수익률 분포를 정규 분포로 모델링해서 쉽게 이해할 수 있도록 표현하여 해석하는 것입니다. 정규 분포는 과거 데이터를 충분히 정확하게 요약한 모델이 아닐 수 있으며, 미래에 대한 예측 또한 아닙니다. 모든 통계량은 과거 데이터를 축약한 값입니다.

예금과의 비교

투자자가 3% 이자를 받을 수 있는 예금에도 가입할 수 있다고 하고, 함께 비교해 볼 수도 있습니다.

SPY 수익률과 예금의 비교 (SPY 수익률은 정규 분포로 모델링)

왼쪽은 연평균 수익률이 3%인 예금을 정의한 것이고, 오른쪽은 그래프에 함께 나타낸 것입니다. SPY에 대략 10년 정도 투자하면 95% 확률로 예금보다 나은 성과를 얻을 수 있었다고 추정되었습니다.

참고: 이 연재에서는 단리 투자를 가정하고 분석합니다. 이후 평균-분산 그래프를 이용한 분석에서 자산의 특성 및 자산의 혼합을 선형적으로 쉽게 해석하기 위해서입니다. 현실에서 투자자는 복리 투자를 할 가능성이 높기에 분석 결과와 다소 차이가 발생할 수 있습니다. 하지만 대략적인 경향을 파악하는 데는 큰 무리가 없습니다.

정리하며

SPY의 1년 수익률 분포를 정규 분포로 가정하고, 장기 투자에서의 위험 감소 경향을 살펴보았습니다.

이어지는 글: [데이터 분석 7] 자산과 예금의 혼합을 평균-분산 그래프에 나타내 보자 (구글 시트 편)

목록: 자산 배분 분석 방법과 사례 글 모음 [목록] (순서대로 차근차근 읽기를 권합니다)

출간 안내: 연재를 묶어 읽기 쉽게 보완하여 편집한 책이 종이책(교보문고)과 전자책(리디북스, 교보문고, Yes24, 곧 알라딘)으로 출간되었습니다. 책 소개: 구글 시트로 시작하는 투자 포트폴리오 분석 (오렌지사과의 불친절한 워크북) 출간에 부쳐 (샘플북 포함)

참고 서적: <왜 위험한 주식에 투자하라는 걸까? - 장기 투자와 분산 투자에 대한 통계학적 시각- 이 연재에서 소개하는 각종 분석 방법의 의미를 소개합니다.

함께 읽으면 좋은 글:

 

반응형
도움이 되었다면, 이 글을 친구와 공유하는 건 어떻까요?

facebook twitter kakaoTalk naver band