주식투자

[중급 23] 숨겨진 주사위는 몇 면일까? (모집단의 추정)

오렌지사과키위 2025. 5. 25. 17:54

이제 본격적으로 투자 성과 비교에 대한 이야기를 해 보겠습니다. 투자 성과는 통계적으로 분석해야 하기에, 투자 성과 비교도 자연스럽게 통계적으로 살펴보아야 합니다. 이 연재에서는 통계학적으로 깊이 설명하지는 않습니다. 투자 성과 분석이 어떻게 이루어지는 대략적으로 이해할 수 있는 수준으로 알기 쉽게 소개하는 것을 목표로 삼고 있습니다. 참고: 투자 분석은 왜 통계적으로 접근해야 하나? (기초자산과 커버드콜의 경우) [파이썬 분석 17]

주의: 이 글은 특정 상품 또는 특정 전략에 대한 추천의 의도가 없습니다. 이 글에서 제시하는 수치는 과거에 그랬다는 기록이지, 앞으로도 그럴 거라는 예상이 아닙니다. 분석 대상, 기간, 방법에 따라 전혀 다른 결과가 나올 수 있습니다. 데이터 수집, 가공, 해석 단계에서 의도하지 않은 오류가 있을 수 있습니다. 일부 설명은 편의상 현재형으로 기술하지만, 데이터 분석에 대한 설명은 모두 과거형으로 이해해야 합니다.

나주사씨의 멋진 주사위는 몇 면일까?

내기를 좋아하는 나주사씨가 수작업으로 만든 멋진 주사위를 몇 개 구했습니다. 친구들을 불러 자랑하고 싶습니다. 내기를 좋아하는 만큼 나주사씨는 주사위 면이 몇 개인지 맞추면 친구들에게 주사위를 하나씩 선물하겠다고 합니다. 친구들은 곰곰이 생각해 봅니다. 나주사씨가 이런 내기를 건 이유는 일반적인 6면 주사위가 아닐 수 있기 때문입니다.

현실에서 각 눈이 동일한 확률로 나오는 기하학적으로 공정한(fair 또는 unbiased) 주사위는 정다면체 5가지 외에도 25가지가 더 있습니다. 총 30가지가 있습니다. 나주사씨가 사는 평행 세계에는 2면(동전)부터 무한대까지 공정한 주사위를 만들 수 있다고 가정하겠습니다. 참고: 주사위/분류 [나무위키]

친구들은 너무 어렵다고 힌트를 달라고 합니다. 나주사씨는 5, 6, 7면 공정 주사위 중에 하나이고, 각각 1 ~ 5, 1 ~ 6, 1 ~ 7까지의 숫자가 나온다고 합니다. 다섯 번을 굴려 어떤 숫자가 나왔는지 차례대로 알려주겠다고 합니다.

나주사씨가 주사위를 굴려 얻은 첫 번째 숫자는 1입니다. 어떤 주사위일까요?

공정한 주사위이기 때문에 5면 주사위라면 1 / 5, 6면 주사위라면 1 / 6, 7면 주사위라면 1 / 7 확률로 1이 나옵니다. 만일 다른 힌트가 없다면, 친구들은 5면 주사위일 거라 예측하는 것이 합리적입니다.

나주사씨가 주사위를 굴려 얻은 두 번째 숫자는 6입니다. 어떤 주사위일까요?

이제 5면 주사위일 가능성은 사라졌습니다. 5면 주사위로는 6이 나올 수 없기 때문입니다. 6면 주사위가 (1, 6)을 만들 확률은 1 / 6 × 1 / 6 = 1 / 36 ≒ 2.8%이고, 7면 주사위가 (1, 6)을 만들 확률은 1 / 7 × 1 / 7 = 1 / 49 ≒ 2.0%입니다.

6면 또는 7면 주사위일 테니, 확률의 합이 100%가 되도록 정규화하면, 각각 약 58%와 42%입니다. 6면 주사위일 가능성이 조금 더 높기는 하지만, 친구들이 확신을 가질 정도는 아닙니다.

나주사씨가 주사위를 굴려 얻은 세 번째 숫자는 3입니다. 어떤 주사위일까요?

이제 6면 또는 7면 주사위일 확률 분포는 [1 / 216, 1 / 343]으로 정규화하면 약 [61%, 39%]입니다.

관찰로 인한 각각의 주사위일 확률의 변화

계속해서 주사위를 굴렸더니 모두 6 이하의 숫자가 나왔다면, 6면 주사위와 7면 주사위의 확률 분포는 다음과 같이 변합니다.

주사위를 굴린 결과를 관찰하여 얻은 각각의 주사위일 확률의 변화

총 10회의 관찰을 했습니다. 맨 왼쪽 0회는 주사위를 한 번도 굴리기 전에 친구들이 생각한 각각의 주사위일 확률 1 / 3입니다. 첫 번째 주사위를 굴려 1이 나왔을 때 5면 주사위일 가능성과 6면 주사위일 가능성이 상승했습니다. 이 중에서 5면 주사위일 가능성이 좀 더 많이 상승했습니다.

두 번째 주사위를 굴려 6이 나왔을 때, 5면 주사위일 가능성은 없어지고, 6면 주사위와 7면 주사위가 확률을 나누어 가지게 됩니다. 이후 계속해서 6 이하의 눈이 나왔기에, 6면 주사위일 가능성은 점차 높아지고, 7면 주사위일 가능성은 조금씩 낮아졌습니다.

나주사씨의 친구들이 5번의 결과를 관찰했다면, 6면 주사위일 가능성이 대략 70%, 7면 주사위일 가능성이 약 30%가 됩니다. 그러니 6면 주사위일 거라 주장하는 것이 나주사씨로부터 주사위를 얻을 가능성이 높은 선택입니다.

얼핏 생각하기에는 10번을 던지는 동안 7이 한 번도 나오지 않았으니, 7면 주사위일 확률이 아주 낮을 듯합니다. 하지만, 확률 모델로 분석해 보면, 7면 주사위일 확률은 약 18%로 그리 작지 않습니다. 확률로 모델링해보면 감각적인 추측과 꽤 다른 결과가 나오는 경우가 흔합니다. 이 때문에, 중요한 결정을 내려야 할 때 합리적인 확률 모델링이 가능하다면, 이를 분석해서 직관과 비교해 볼 필요가 있는 것입니다.

정리하며

관찰을 통해 모집단(또는 모델, 여기서는 주사위 종류)을 추정하는 예를 들어 보았습니다. 나주사씨가 관찰을 많이 할수록 어떤 주사위인지 좀 더 명확해졌습니다. 투자 성과 분석에서 가능한 많은 데이터를 보는 것이 유리할 가능성이 높은 이유입니다.

확률은 공부할수록 뭔가 아리송해지는 경우가 있습니다. 이 글에서는 관찰을 통해 5면, 6면, 7면 주사위일 확률이 변하는 것처럼 설명했지만, 따지고 보면 어떤 주사위인지 이미 결정되어 있습니다. 그러니 어떤 주사위인지에 대한 확률이 변한 것 아니라, 각각의 주사위를 선택할 때 맞출 확률이 달라졌다고 보아야 합니다.

투자 성과 비교도 비슷한 방식으로 접근할 수 있습니다. 주사위 추측과 같이 어떤 숫자가 어떤 분포로 나올지 주사위에 따라 모집단이 명확한 경우와는 달리, 좀 더 복잡하고 고려해야 하는 사항이 더 많습니다.

참고 도서:

이어지는 글: [중급 24] 베이즈 정리와 추론 - 나주사씨의 친구들은 주사위를 어떻게 추정했을까? (고정된 수익률 분포를 완벽하게 아는 경우)

목차: [연재글 목차] 투자 성과 분석 (기초편, 초급편, 중급편): 순서대로 차근차근 읽으면 좀 더 이해가 쉽습니다.

함께 읽으면 좋은 글 (최신 글)

  1. [중급 22] 투자 정보의 가치는 얼마일까? (누군가 내일의 주가 수익률을 알려준다면 초모험씨는 얼마나 지불할 수 있을까?)
  2. [중급 21] 섀넌의 도깨비(Shannon's Demon) - 현실에서는 왜 찾기 어려울까?
  3. 파이썬으로 그려보는 투자 포트폴리오 분석 (정량적 투자 분석을 위한 입문서) 출간에 부쳐 (샘플북 포함)
  4. [중급 20] 켈리 공식(켈리 방정식) (가장 단순한 분산 투자 모델)
  5. 은퇴 후 현금 흐름 마련을 위한 커버드콜 투자를 말리는 이유

함께 읽으면 좋은 글 (인기 글)

  1. 구글 제미나이(Gemini)를 이용한 그림 생성하기 (vs. 마이크로소프트 이미지 크리에이터의 이미지 생성 AI)
  2. 챗GPT(ChatGPT)로 사진을 지브리 만화 스타일로 변환하기
  3. 커버드콜과 노벨상 (커버드콜에 투자하면 안 되는 간단하고 명확한 이유 + 노벨상을 받는 손쉬운 방법)
  4. 외화 RP는 위험한가? (증권사가 RP를 운용하는 방법)
  5. 해외 ETF는 세금이 어떻게 부과될까? (배당소득세와 양도소득세)
도움이 되었다면, 이 글을 친구와 공유하는 건 어떻까요?

facebook twitter kakaoTalk naver band