주식투자

[데이터 분석 5] 수익률 분포를 정규 분포와 함께 그려보자 (구글 시트 편)

오렌지사과키위 2025. 1. 6. 16:55
반응형

자산의 1년 수익률 분포를 그려보고 정규 분포(normal distribution)와 비교해 봅니다. 평균-분산(Mean-Variance) 그래프에서 사용하는 값이 정규 분포로 모델링한 평균 수익률과 표준 편차(standard deviation)이기 때문입니다.

주의: 이 글은 특정 상품 또는 특정 전략에 대한 추천의 의도가 없습니다. 이 글에서 제시하는 수치는 과거에 그랬다는 기록이지, 앞으로도 그럴 거라는 예상이 아닙니다. 분석 대상, 기간, 방법에 따라 전혀 다른 결과가 나올 수 있습니다. 데이터 수집, 가공, 해석 단계에서 의도하지 않은 오류가 있을 수 있습니다. 일부 설명은 편의상 현재형으로 기술하지만, 데이터 분석에 대한 설명은 모두 과거형으로 이해해야 합니다.

SPY의 수익률 분포 그래프

왼쪽 그림은 지난 글에서 계산한 SPY의 1년(250거래일) 수익률로 히스토그램을 그리는 과정입니다. 그림에서 SPY(250) 칼럼이 1년 수익률입니다. 오른쪽은 이 데이터로 만든 히스토그램입니다. 지난 글: [데이터 분석 3] 주가 데이터에서 수익률 통계량을 뽑아보자 (구글 시트 편)

SPY 1년(250거래일) 수익률의 히스토그램

구글 시트의 히스토그램은 기본적인 기능은 어느 정도 제공하지만, 세세한 세부 설정에 한계가 있습니다. 히스토그램의 x축을 보면 불필요하게 많은 값들이 나열되어 있습니다. y축 또한 확률 또는 확률 밀도가 아닌 빈도로 표시되고 있습니다.

좀 더 이해하기 쉽게 수익률 분포를 나타내려면 히스토그램 대신, 막대그래프를 이용하는 방법이 있습니다. 먼저 구간을 정의하고, 각 구간별로 라벨을 지정한 다음, COUNTIFS() 함수를 이용하여 구간에 속한 수익률의 개수를 세고, 확률로 변환합니다.

구간별 도수를 구해 막대 그래프로 나타낸 SPY 1년(250거래일) 수익률 분포

왼쪽 그래프에서 각 구간의 대표값(계급값)은 구간 최소값과 최대값의 평균입니다. 구간 내 수익률의 개수를 세는 수식은 =COUNTIFS(D$7:D$9999,">" & F7, D$7:D$9999, "<=" & G7)입니다. COUNTIFS() 함수는 복수 조건이 모두 만족되는 셀의 수를 세는 함수입니다. 이 함수를 이용하여 (MIN, MAX] 구간의 수익률 개수를 셀 수 있습니다. 전체 개수(Count Sum)를 구해 확률로 변환하여 막대그래프로 표시하면 오른쪽 그림과 같이 됩니다.

정규 분포와 함께 나타내기

SPY의 수익률 분포가 정규 분포와 얼마나 비슷했는지 비교해 보겠습니다. 1년 수익률의 평균은 이전 글에서 구했고 표준 편차는 STDEV() 함수를 이용하면 됩니다.

SPY 1년(250거래일) 표준 편차와 정규 분포를 가정했을 때의 구간 확률 구하기

평균은 11.7%, 표준 편차는 16.9%입니다. 정규 분포에서 표준 편차의 의미는 [초급 5] 정규 분포의 성질과 투자에서의 활용 예를 참고하기 바랍니다.  표준 편차를 이용하면 오른쪽 그림과 같이 각 구간의 정규 분포 확률을 NORMDIST() 함수로 구할 수 있습니다.

수식에서 첫 번째 NORMDIST()는 각 구간의 최대치까지의 누적 확률이고, 두 번째 NORMDIST()는 최소치까지의 누적 확률입니다. 두 값을 빼면 해당 구간의 확률을 구할 수 있습니다. 함수의 마지막 인자 TRUE는 누적 확률을 구하겠다는 의미입니다.

SPY의 1년 수익률 분포와 정규 분포를 함께 그리면 아래와 같은 그림이 됩니다. 차트 종류는 막대그래프와 선그래프를 함께 표시하는 콤보 차트로 설정했습니다.

SPY의 1년 수익률 분포와 정규 분포 (콤보 차트)
SPY의 1년 수익률 분포와 정규 분포 (콤보 차트)

파란색으로 표시된 SPY의 1년 수익률 분포는 빨간색으로 표시된 정규 분포와 비슷해 보이기도 하고, 달라 보이기도 합니다. 정규 분포에 비해 SPY 수익률 분포는 가운데가 조금 더 뾰죡하고, 왼쪽 구간과 같이 큰 손실이 발생했던 빈도가 상대적으로 높았음을 알 수 있습니다.

정리하며

SPY 1년 수익률 데이터를 이용하여 확률 분포를 그려 보았습니다. 대응하는 정규 분포와도 비교해 보니 비슷해 보이는 부분도 있었고, 달라 보이는 부분도 있었습니다.

이어지는 글: [데이터 분석 6] 수익률 분포를 정규 분포로 모델링하고 위험을 추정해 보자 (구글 시트 편)

목록: 자산 배분 분석 방법과 사례 글 모음 [목록] (순서대로 차근차근 읽기를 권합니다)

출간 안내: 연재를 묶어 읽기 쉽게 보완하여 편집한 책이 종이책(교보문고)과 전자책(리디북스, 교보문고, Yes24, 곧 알라딘)으로 출간되었습니다. 책 소개: 구글 시트로 시작하는 투자 포트폴리오 분석 (오렌지사과의 불친절한 워크북) 출간에 부쳐 (샘플북 포함)

참고 서적: <왜 위험한 주식에 투자하라는 걸까? - 장기 투자와 분산 투자에 대한 통계학적 시각> - 이 연재에서 소개하는 각종 분석 방법의 의미를 소개합니다.

함께 읽으면 좋은 글:

반응형
도움이 되었다면, 이 글을 친구와 공유하는 건 어떻까요?

facebook twitter kakaoTalk naver band