주식투자

[중급 29] 정확하다는 것은 무엇일까? (정확하지 않으면 무슨 일이 발생할까?) 투자에서 정보에 대한 통계학적 시각 4

오렌지사과키위 2025. 6. 5. 17:50

지난 몇 편의 글을 통해 불확실하다와 안다의 개념을 살펴보았습니다. 불확실하다는 개념은 상대적으로 이해하기 쉽습니다. 모든 변수는 가질 수 있는 값들을 확률 분포로 표현할 수 있습니다. 확률 분포에 0%가 아닌 둘 이상의 값이 있다면, 불확실성이 있는 것입니다. 다음번에 무엇이 나올지 정확하게 맞출 수 없기 때문입니다. 이에 비해 안다는 것은 그 확률 분포를 진실에 가깝게, 즉 얼마나 정확하게 나타낼 수 있는지를 의미합니다.

투자에서 정보가 정확하다는 것은 무엇을 의미하며, 정확도에 따라 결과에 어떤 변화가 발생하는지 살펴봅니다.

주의: 이 글은 특정 상품 또는 특정 전략에 대한 추천의 의도가 없습니다. 이 글에서 제시하는 수치는 과거에 그랬다는 기록이지, 앞으로도 그럴 거라는 예상이 아닙니다. 분석 대상, 기간, 방법에 따라 전혀 다른 결과가 나올 수 있습니다. 데이터 수집, 가공, 해석 단계에서 의도하지 않은 오류가 있을 수 있습니다. 일부 설명은 편의상 현재형으로 기술하지만, 데이터 분석에 대한 설명은 모두 과거형으로 이해해야 합니다.

수익률 분포를 정확하게 아는 경우

지난 1만년 동안 야옹이즈와 뱀뱀즈는 매년 결승전에 진출해서 맞붙었습니다. 총 10,000번의 결승전에서 야옹이즈가 절반인 5,000번, 뱀뱀즈가 나머지 절반인 5,000번을 이겼습니다.

충분히 많은 수의 시행 사례가 있고, 앞으로도 동일한 경향이 이어진다고 믿는다면, 야옹이즈의 우승 확률은 50%라 할 수 있습니다. 야옹이즈 우승은 [우승 × 50%, 준우승 × 50%]와 같이 확률 분포로 표현됩니다. 통계학에서 말하는 참값(true value)은 아니지만, 이에 준하는 값으로 간주하겠습니다.

야옹이즈 우승이라는 확률 변수는 2개 이상의 값을 가진 확률 분포로 표현되기에 불확실성이 있습니다. 하지만, 그 확률 분포는 정확합니다. 불확실성이 있지만 정확한 것입니다. 다음번 우승은 누구일지 알지 못하지만, 야옹이즈가 우승할 확률이 장기적으로 50%라는 것은 아는 것입니다.

각 야구단 우승에 따라 제일은행과 삼삼은행은 추가 금리를 줍니다. 총 1,000만원의 투자금을 제일은행과 삼삼은행 예금에 분산 투자하여 얻을 수 있는 이자는 다음과 같이 예상할 수 있습니다. 참고: [중급 25] 투자할 자산의 선택과 최적화 (수익률 분포를 완벽하게 알더라도 발생하는 불확실성과 주관성)

제일야옹이즈 우승 확률이 50%일 때, 제일은행과 삼삼은행 예금의 분산 투자 결과

충분히 많은 횟수로 반복 투자하면, 두 예금에 분산 투자한 포트폴리오의 1년 평균 수익률은 초록색 선에 근접하게 됩니다. 야옹이즈 우승이라는 변수에 내재된 불확실성이 반복 시행과 평균을 취함으로써 그 영향이 크게 줄어드는 것입니다.

야옹이즈 우승이 [우승 × 20%, 준우승 × 80%]라도 마찬가지입니다. 정확한 확률 분포라면 다음과 같이 오랜 기간 투자하면 평균 수익은 초록색 선으로 표시된 기대값에 수렴하게 됩니다.

제일야옹이즈 우승 확률이 20%일 때, 제일은행과 삼삼은행 예금의 분산 투자 결과

이 두 가지는 야옹이즈 우승에 불확실성이 있지만, 그 불확실성을 표현한 확률 분포는 정확하게 아는 경우입니다. 이런 경우 안다고 말할 수 있습니다.

수익률 분포를 잘못 아는 경우

어떤 투자자가 제일은행과 삼삼은행 예금에 분산 투자하려고 합니다. 투자 목표는 1,000만원을 투자해서 이자로 38만원 이상을 보장받으면서 기대 수익을 최대화하는 것입니다. 다음과 같이 그릴 수 있습니다.

야옹이즈 우승 확률이 50%와 20%일 때, 해의 범위

왼쪽은 야옹이즈 우승 확률이 50%인 경우입니다. 투자자는 매년 62.5%를 제일은행 예금에 투자하고 나머지는 삼삼은행 예금에 두는 포트폴리오를 구성하면 됩니다. 이자 기대값은 39.25만원입니다.

오른쪽은 야옹이즈 우승 확률이 20%인 경우입니다. 투자자는 매년 41.7%를 제일은행 예금에 투자하고, 나머지는 삼삼은행 예금에 두는 포트폴리오를 구성하면 됩니다. 이자 기대값은 39.33만원입니다. 별 차이 나지 않지만, 큰 차이라고 간주하고 해석하면 됩니다. 분산 투자 대상이 둘 다 예금으로 변동성이 작고, 서로 음의 상관성이 있어 차이가 작게 나타난 것입니다.

만일 어떤 뱀뱀즈 팬이 뱀뱀즈가 우승할 확률이 80%(야옹이즈 우승 확률이 20%)라고 믿고 투자한다면 어떻게 될까요? 이 투자자는 기대 수익을 최대화하기 위해 제일은행 예금에 41.7% 비중으로 투자할 것입니다.

뱀뱀즈 팬의 기대와는 달리 야옹이즈의 우승 확률은 50%라고 하겠습니다. 오른쪽 그래프의 39.33만원 이자를 기대하면 투자하지만, 장기적으로 왼쪽 그래프의 38.83만원을 받게 됩니다.

야옹이즈 우승 확률이 50%인 경우와 20%인 경우를 그래프를 함께 그려보면 다음과 같습니다.

뱀뱀즈 팬이 야옹이즈 우승 확률을 잘못 예측했을 때의 기대값의 차이

왼쪽 그래프에서 야옹이즈 우승 시 이자와 뱀뱀즈 우승 시 이자가 각각 파란색과 오렌지색 선으로 그려져 있습니다. 초록색 선은 야옹이즈 우승 확률이 50%일 때 기대값입니다. 참값이라 할 수 있습니다. 빨간색 점선은 뱀뱀즈 팬이 예상한 기대값입니다. 뱀뱀즈 팬은 이 기대값을 근거로 제일은행 예금에 41.7% 비중으로 투자했습니다.

오른쪽 그래프는 왼쪽에서 해(solution)가 되는 보라색 영역을 확대한 그림입니다. 초록색 선과 빨간색 점선의 간격이 예측과 실제의 오차입니다. 정보의 부정확한 정도가 포트폴리오에 미치는 영향입니다.

예측이 틀리더라도, 즉 부정확하더라도 모든 포트폴리오에 동일한 영향을 주는 것은 아닙니다. 50% 비중으로 제일은행 예금에 투자하는 포트폴리오는 예측의 부정확성에 영향을 받지 않습니다. 변동성이 없는 포트폴리오이기 때문입니다. 이에 비해 그래프의 양 끝단은 예측 부정확성에 큰 영향을 받습니다.

정확하지 않으면 항상 문제가 발생할까?

예측이 부정확하다고 해서 즉 잘못 알고 있다고 해서 투자 결정의 효용이 항상 낮아지는 것은 아닙니다. 다음 그래프는 야옹이즈 팬이 야옹이즈 우승 확률을 70%로 잘못 예측하고 투자하는 경우입니다.

야옹이즈 팬이 야옹이즈 우승 확률을 잘못 예측했을 때의 기대값의 차이

그래프에서 보는 바와 같이 초록색 선으로 표시된 참값과 야옹이즈 팬이 예측한 빨간색 점선은 차이가 있습니다. 즉, 부정확성이 있습니다. 야옹이즈 팬은 본인의 예측을 근거로 제일은행 예금에 62.5% 투자했을 것입니다. 이 야옹이즈 팬은 장기적으로 본인이 예상한 39.75만원의 대신 39.25만원의 이자를 받게 되지만, 결과적으로 좋은 투자 결과를 얻게 됩니다.

마치 어떤 투자자가 연 10% CAGR을 기대하고 미국 S&P 500 지수를 추종하는 ETF에 20년간 투자했는데, 연 9% 수익률에 그친 것입니다. 기대와는 분명한 차이가 났지만, 검토했던 모든 자산 중에서 S&P 500 지수가 가장 많이 상승했다면, 그 투자자의 투자 결정은 효용이 있었던 것입니다.

더 많이 모른다면 어떻게 될까?

야옹이즈 팬과 뱀뱀즈 팬은 각각 자기가 응원한 야구팀의 우승 확률이 높다고 생각했습니다. 만일 야구에 문외한인 어떤 농구 팬이 야옹이즈의 장기 우승 확률을 알 수 없다고 생각하면 어떻게 될까요?

지난 글에서 설명한 바와 같이 완전한 모른다는 것은 있을 수 없습니다. 문제 자체가 성립되지 않기 때문입니다. 이 농구 팬이 어떤 합리적인 이유로 야옹이즈 우승 확률이 장기적으로 10%에서 80% 사이일 거라 생각한다고 하겠습니다. 참고: [중급 27] 모른다는 것은 무엇일까? (한식방씨는 식빵을 몇 개나 만들어야 할까?) 투자에서 정보에 대한 통계학적 시각 2

다음과 같이 기대값이 하나의 직선이 아닌 분포(영역)로 나타나게 됩니다. 그림은 이해의 편의를 위해 몇 개의 경우에 대해 점선으로 표시했습니다.

야옹이즈 우승 확률을 예상하기 어려워 하는 농구 팬이 생각하는 기대값의 분포

농구 팬은 야옹이즈 우승 확률을 10% ~ 80%로 예상했기에, 장기간 반복 투자하더라도 각 포트폴리오의 기대값을 하나의 숫자로 추정할 수 없습니다. 1년에 38만원 이자를 보장받을 수 있는 제일은행 예금 비중 [41.7%, 62.5%] 구간 내에서 어떤 포트폴리오를 선택하는 것이 합리적인지 결정하는데 어려움을 겪게 됩니다. 어떤 초록색 선은 제일은행 예금 비중이 높을수록 좋다고 이야기하고, 다른 초록색 선은 반대로 낮을수록 좋다고 이야기하기 때문입니다.

그렇다고 투자 결정을 할 수 없는 것은 아닙니다. 이 농구 팬은 야옹이즈 우승 확률이 10% ~ 80% 중에서 동일 확률로 나타날 거라 가정하고 계산한 기대치의 평균을 참고할 수 있습니다 그래프의 보라색 선입니다. 이 보라색 선을 참고하면 농구 팬은 제일은행 예금에 62.5% 비중으로 투자하게 됩니다.

누가 가장 부정확하게 예측한 것일까?

뱀뱀즈 팬, 야옹이즈 팬, 그리고 농구 팬이 예상한 결과를 비교해 봅니다.

각 팬들의 예측치와 실제값

파란색 점선은 야옹이즈 우승 확률이 50%인 경우로 참값이라 볼 수 있습니다. 뱀뱀즈 우승을 열망하는 뱀뱀즈 팬은 오렌지색 선으로, 야옹이즈 승리를 원하는 야옹이즈 팬은 초록색 선으로 그려져 있습니다. 야구에 문외한인 농구 팬은 빨간색 선으로 그려져 있습니다.

농구 팬의 추정이 실제와 가장 유사합니다. 그러니 이 경우에는 야옹이즈 우승 확률 50%는 야옹이즈 우승 확률 20% 또는 70%보다 [10%, 80%]과 더 비슷하다고 말할 수 있습니다. 즉, 농구 팬은 뱀뱀즈 팬과 야옹이즈 팬보다 더 정확하게 알고 있다고 볼 수 있습니다. 참고: 앞에서 언급했지만, 추정 결과가 비슷하다와 투자 성과가 좋다는 항상 일치하지 않습니다.

정리하며

투자에서 정보가 정확하다는 것은 무엇인지 생각해 보았습니다. 다양한 방식으로 정의가 가능하겠지만, 기본적으로는 실제와의 차이입니다. 장기 투자라면 투자자가 기대한 수익과 실제 수익이 얼마나 비슷하냐가 한 가지 척도가 될 수 있습니다. 참고: 장기 평균의 차이가 척도의 하나인 이유는 변동성도 함께 고려해야 보다 면밀하게 비교할 수 있기 때문입니다.

참고 도서:

이어지는 글: [중급 30] 두 자산의 미래 수익률이 같다는 것을 알 수 있을까? (정말 다른지 판별할 수 있을까?)

목차: [연재글 목차] 투자 성과 분석 (기초편, 초급편, 중급편): 순서대로 차근차근 읽으면 좀 더 이해가 쉽습니다.

함께 읽으면 좋은 글 (최신 글)

  1. [중급 28] 안다는 것은 무엇일까? (한식방씨는 어느 지역에 빵집을 열어야 할까?) 투자에서 정보에 대한 통계학적 시각 3
  2. [중급 27] 모른다는 것은 무엇일까? (한식방씨는 식빵을 몇 개나 만들어야 할까?) 투자에서 정보에 대한 통계학적 시각 2
  3. [중급 26] 불확실하다는 것은 무슨 뜻일까? (포트폴리오의 변동성) 투자에서 정보에 대한 통계학적 시각 1
  4. [중급 25] 투자할 자산의 선택과 최적화 (수익률 분포를 완벽하게 알더라도 발생하는 불확실성과 주관성)
  5. 커버드콜 유지 비용은 얼마나 될까? (높은 기본 수수료를 부과하는 국내 상장 커버드콜 ETF들)

함께 읽으면 좋은 글 (인기 글)

  1. 커버드콜과 은퇴 그리고 현금 흐름 1 (세금을 고려해 보자)
  2. 구글 제미나이(Gemini)를 이용한 그림 생성하기 (vs. 마이크로소프트 이미지 크리에이터의 이미지 생성 AI)
  3. 챗GPT(ChatGPT)로 사진을 지브리 만화 스타일로 변환하기
  4. 당신이 JEPI/JEPQ를 사면 안되는 이유 (해외 상장 인컴 ETF의 배당소득세와 양도소득세)
  5. JEPI/JEPQ에 장기 배당 재투자하는 것은 좋은 방법일까? (장기투자와 세금)
도움이 되었다면, 이 글을 친구와 공유하는 건 어떻까요?

facebook twitter kakaoTalk naver band