주식투자

정규 분포의 성질과 투자에서의 활용 예 [초급 5]

오렌지사과키위 2024. 11. 2. 14:52

수학 2교시 수업입니다. 솔솔 잠이 올 수 있지만 통계학은 알아두면 실생활에 요긴합니다. 이전 글에서 불확실성이 있는 수익률을 모델링하는데 정규 분포를 자주 사용한다고 설명하였습니다. 현실의 수익률 분포는 정규 분포와 어느 정도 비슷한 점이 있으며, 서로 독립(independence)을 가정하면 정규 분포의 합도 정규 분포가 되어 편리하기 때문입니다. 이러한 성질은 분산 투자나 반복 투자를 모델링하기에 간편하면서 편리합니다. 이전 글: 투자 성과 분석의 초급 - 4. 왜 수익률 모델로 정규 분포를 사용할까?

정규 분포는 단 두 개의 숫자로 표현할 수 있습니다. 평균표준 편차(또는 분산)입니다. 평균은 말 그대로 값들의 평균입니다. 표준 편차는 값들의 분포가 퍼진 정도입니다.

표준 편차에 대한 이야기는 항상 들을 때는 알겠는데, 나중에는 잘 기억이 나지 않습니다. 마치 1타 강사의 학원 강의를 들을 때에는 "내가 이렇게 똑똑하다니"라며 스스로 감탄하지만, 1주일만 지나면 "역시 난 아니구나"라고 느끼는 것과 비슷합니다.

이는 표준 편차를 수식 위주로 이해했기 때문입니다. 수식을 보면 표준 편차를 어떻게 계산하는지 알 수 있지만, 무슨 의미인지 충분히 이해하지 못했기 때문입니다. 대개의 이론은 용도를 알지 못한 상황에서 배우려고 하면 쉽게 이해되지 않습니다.

정규 분포의 핵심은 표준 편차입니다. 표준 편차가 어떤 의미를 가지는지만 이해해도 실용적으로 충분합니다. 정규 분포에 대해 알아봅니다.

공지: 책 출간으로 인해 부분 공개로 전환합니다. 보다 이해하기 쉽게 수정 보완한 책을 참고하시기 바랍니다. 양해 부탁드립니다. 책 소개: 왜 위험한 주식에 투자하라는 걸까? (장기 투자와 분산 투자에 대한 통계학적 시각) 출간에 부쳐 (샘플북 포함)

주의: 이 글은 특정 상품 또는 특정 전략에 대한 추천의 의도가 없습니다. 이 글에서 제시하는 수치는 과거에 그랬다는 기록이지, 앞으로도 그럴 거라는 예상이 아닙니다. 분석 대상, 기간, 방법에 따라 전혀 다른 결과가 나올 수 있습니다. 데이터 수집, 가공, 해석 단계에서 의도하지 않은 오류가 있을 수 있습니다. 일부 설명은 편의상 현재형으로 기술하지만, 데이터 분석에 대한 설명은 모두 과거형으로 이해해야 합니다.

정규 분포에서 표준 편차의 영향

(책 출간으로 내용 생략)

평균이 10%이며, 표준 편차가 10%, 20%, 30%인 정규 분포
평균이 10%이며, 표준 편차가 10%, 20%, 30%인 정규 분포

정규 분포에서 표준 편차와 확률

(책 출간으로 내용 생략)

정규 분포 그래프
정규 분포 그래프
정규 분포 그래프 (1σ 구간)정규 분포 그래프 (2σ 구간)
정규 분포 그래프 (1σ, 2σ 구간)

정규 분포의 연산

(책 출간으로 내용 생략)

정규 분포의 활용

(책 출간으로 내용 생략)

정규 분포에서 구간 확률을 물어보기두 정규 분포 더한 결과를 물어보기
마이크로소프트 코파일럿에 물어본 정규 분포 계산을 물어본 결과
10년 투자 결과에 대한 질문
10년 투자 결과에 대한 질문
S&P 500 10년 수익률에 대한 정규 분포 모델과 추정 결과
S&P 500 10년 수익률에 대한 정규 분포 모델과 추정 결과

정리하며

수익률 모델로 많이 활용하는 정규 분포의 특징과 활용 사례를 살펴보았습니다. 정규 분포는 표준 편차의 의미를 이해하는 것이 핵심입니다. 계산하는 수식은 몰라도 별 문제가 없습니다.

N(8%, 12%²)이라는 정규 분포가 주어지면, 평균 수익률은 8%이며, 수익률은 95% 확률로 [8% ± 12% × 2] = [8% - 24%, 8% + 24%]  = [-16%, 32%] 구간에 속할 거라 추정할 수 있습니다.

대략적으로 현실적인 최대 손실률은 -16%이고(이보다 더 큰 손실이 발생할 가능성은 2.5% 이하입니다.), 최대 수익률은 32%라고 추측할 수 있습니다. 평균 수익률은 8% 정도를 기대하지만, -16% 정도의 손실도 염두에 두어야 한다고 볼 수도 있습니다.

수익률을 정규 분포로 간주하면 각종 연산이 편리해집니다. 인플레이션도 반영할 수 있고, 투자 비중에 따른 결과를 계산해 볼 수 있습니다. 현실과 다소 차이가 있지만, 정규 분포 간 독립을 가정하면 분산 투자나 다년 투자 결과도 추정해 볼 수 있습니다.

의미를 이해했다면 계산을 직접 할 필요는 없습니다. 우리에겐 귀한 시간을 아껴주는 인공지능 서비스가 있기 때문입니다.

이어지는 글: 투자 성과 분석의 초급 - 6. 정규 분포로 보는 큰 수의 법칙 (S&P 500 지수의 수익률 분포는 정규 분포와 유사할까?)

목차: [연재글 목차] 투자 성과 분석 (기초편, 초급편): 순서대로 차근차근 읽으면 좀 더 이해가 쉽습니다.

책 출간 안내: 연재를 정리하여 수정 보완한 <왜 위험한 주식에 투자하라는 걸까? (장기 투자와 분산 투자에 대한 통계학적 시각)>이 출간되었습니다. 종이책(교보문고), 전자책(Yes24, 알라딘, 교보문고, 리디북스)

함께 읽으면 좋은 글:

도움이 되었다면, 이 글을 친구와 공유하는 건 어떻까요?

facebook twitter kakaoTalk naver band