주식투자

[데이터 분석 5] 수익률 분포를 정규 분포와 함께 그려보자 (구글 시트 편)

오렌지사과키위 2025. 1. 6. 16:55

 

자산의 1년 수익률 분포를 그려보고 정규 분포(normal distribution)와 비교해 보겠습니다. 평균-분산(Mean-Variance) 그래프에서 사용하는 값이 정규 분포로 모델링한 평균 수익률과 표준 편차(standard deviation)이기 때문입니다.

참고: 이 연재는 책 <왜 위험한 주식에 투자하라는 걸까? - 장기 투자와 분산 투자에 대한 통계학적 시각>에서 소개한 주요 분석 방법을 구글 시트로 적용해 보는 부록의 성격을 가집니다. 책의 초고에 해당되는 블로그 글이나 읽기 편하게 정리하고 편집한 책을 한두 번 차근차근 읽어 분석 방법의 의미를 이해한 후에 보면 더욱 좋습니다. 연재 그 자체만으로도 따라 하기에 별 무리가 없는 수준으로 설명하려고 하지만, 세부적인 설명이 일부 생략되어 있을 수 있고, 분석 방법의 의의를 이해한 상태에서 보면 좀 더 도움이 될 수 있기 때문입니다.

주의: 이 글은 특정 상품 또는 특정 전략에 대한 추천의 의도가 없습니다. 이 글에서 제시하는 수치는 과거에 그랬다는 기록이지, 앞으로도 그럴 거라는 예상이 아닙니다. 분석 대상, 기간, 방법에 따라 전혀 다른 결과가 나올 수 있습니다. 데이터 수집, 가공, 해석 단계에서 의도하지 않은 오류가 있을 수 있습니다. 일부 설명은 편의상 현재형으로 기술하지만, 데이터 분석에 대한 설명은 모두 과거형으로 이해해야 합니다.

SPY의 수익률 분포 그래프

왼쪽 그림은 지난 글에서 계산한 SPY의 1년(250거래일) 수익률로 선택해서 히스토그램을 그리는 과정입니다. SPY(250) 칼럼입니다. 오른쪽은 이렇게 만든 히스토그램입니다. 지난 글: [데이터 분석 3] 주가 데이터에서 수익률 통계량을 뽑아보자 (구글 시트 편)

SPY 1년(250거래일) 수익률의 히스토그램

구글 시트의 히스토그램은 기본적인 기능은 어느 정도 제공하지만, 세세한 세부 설정에는 한계가 있습니다. 히스토그램 그래프를 보면 x축의 경우 불필요하게 많은 값들이 나열되어 있습니다. y축은 확률 또는 확률 밀도가 아닌 빈도로 표시되고 있습니다.

좀 더 그럴듯하게 수익률 분포를 표시하려면 히스토그램 그래프를 사용하지 않고, 막대그래프로 그리는 방법이 있습니다. 먼저 구간을 정의하고, 각 구간별로 라벨을 지정한 다음, COUNTIFS() 함수를 이용하여 구간에 속한 수익률의 개수를 세고, 확률로 변환합니다.

구간별 도수를 구해 막대 그래프로 나타낸 SPY 1년(250거래일) 수익률 분포

왼쪽 그래프에서 수식은 =COUNTIFS(D$7:D$9999,">" & F7, D$7:D$9999, "<=" & G7)입니다. 이 함수를 이용하여 (MIN, MAX] 구간의 수익률 개수를 셉니다. 전체 개수(Count Sum)를 구해 확률로 변환하여 막대그래프로 나타내면 오른쪽 그림과 같이 됩니다.

정규 분포와 함께 나타내기

SPY의 수익률 분포가 정규 분포(normal distribution)와 얼마나 비슷했는지 함께 비교해 보겠습니다. 1년 수익률의 평균은 이전 글에서 구했고 표준 편차는 STDEV() 함수를 이용하면 됩니다.

SPY 1년(250거래일) 표준 편차와 정규 분포를 가정했을 때의 구간 확률 구하기

평균은 11.7%, 표준 편차는 16.9%입니다. 이 수치를 이용해서 오른쪽 그림과 같이 각 구간의 정규 분포 확률을 NORMDIST() 함수로 구할 수 있습니다. 첫 번째 NORMDIST()는 각 구간의 최대치까지의 누적 확률이고, 두 번째 NORMDIST()는 최소치까지의 누적 확률입니다. 두 값을 빼면 해당 구간의 확률을 구할 수 있습니다. 함수의 마지막 TRUE 인자는 누적 확률을 구하겠다는 의미입니다.

SPY의 1년 수익률 분포와 정규 분포를 함께 그리면 아래와 같은 그림이 됩니다. 차트 종류는 막대그래프와 선그래프를 함께 표시하는 콤보 차트로 설정했습니다.

SPY의 1년 수익률 분포와 정규 분포 (콤보 차트)
SPY의 1년 수익률 분포와 정규 분포 (콤보 차트)

파란색으로 표시된 SPY의 1년 수익률 분포는 빨간색으로 표시된 정규 분포와 비슷한 부분도 있고, 다른 부분도 있습니다. 가운데는 조금 더 뾰죡하고, 왼쪽을 보면 낮은 수익률이 발생했던 빈도가 꽤 높았음을 알 수 있습니다.

정리하며

SPY 1년 수익률 데이터를 이용하여 확률 분포를 그려 보았습니다. 대응하는 정규 분포와도 비교해 보니 비슷해 보이는 부분도 있었고, 달라 보이는 부분도 있었습니다.

이어지는 글: [데이터 분석 6] 수익률 분포를 정규 분포로 모델링하고 위험을 추정해 보자 (구글 시트 편)

목록: 자산 배분 분석 방법과 사례 글 모음 [목록] (순서대로 차근차근 읽기를 권합니다)

함께 읽으면 좋은 글:

도움이 되었다면, 이 글을 친구와 공유하는 건 어떻까요?

facebook twitter kakaoTalk naver band