이전 글에서 동일한 수익률 분포를 가졌지만 서로 독립인 자산의 누적 수익률 그래프를 그렸을 때, 동일하다 판별할 수 있는지 살펴보았습니다. 2개의 동전을 던져 만드는 장기 수익률은 본질적으로 동일합니다. 두 동전은 장기적으로 앞면이 나올 확률이 같다고 말할 수 있기 때문입니다. 하지만 충분히 많은 10,000회 또는 100,000회를 시행하더라도 누적 수익률 그래프는 달라 보일 수 있습니다. 이전 글: [중급 30] 두 자산의 미래 수익률이 같다는 것을 알 수 있을까? (정말 다른지 판별할 수 있을까?)
현실의 투자 상품은 같은 부류끼리 비슷한 수익률 경향을 가지고 있습니다. 성장주 ETF에 투자하는 분도 있고, 가치주 ETF에 투자하는 분도 있습니다. 미국의 S&P 500 지수를 추종하는 ETF에 투자하는 분도 있고, 한국의 KOSPI 200 지수를 추종하는 ETF에 투자하는 분도 있습니다.
주식 개별 종목의 수익률은 서로 강한 상관성이 있습니다. 특히 같은 시장에 있는 종목은 그 상관성이 더 높을 수 있습니다. 이 때문에 이들 ETF는 흡사한 수익률 경향을 보이게 됩니다.
하지만 우리가 투자 결정을 할 때에는, 이들 간에 어떤 이유로든 장기적으로 의미 있는 차이가 있을 거라 예상해서 선택합니다. 선택의 근거는 과거 수익률 데이터를 통계적으로 분석일 수도 있고, 어떤 연역적인 추론 결과일 수도 있습니다.
통계적 분석을 통한 귀납적 분석 결과가 선택의 근거라면, 이를 충분히 신뢰할 수 있을까요?

주의: 이 글은 특정 상품 또는 특정 전략에 대한 추천의 의도가 없습니다. 이 글에서 제시하는 수치는 과거에 그랬다는 기록이지, 앞으로도 그럴 거라는 예상이 아닙니다. 분석 대상, 기간, 방법에 따라 전혀 다른 결과가 나올 수 있습니다. 데이터 수집, 가공, 해석 단계에서 의도하지 않은 오류가 있을 수 있습니다. 일부 설명은 편의상 현재형으로 기술하지만, 데이터 분석에 대한 설명은 모두 과거형으로 이해해야 합니다.
흡사하지만 살짝 다른 수익률 그래프
나주사씨가 동전을 10,000번 던져 누적 수익률 그래프를 2개 그립니다. 동일한 그래프가 그려질 것입니다. 두 그래프는 매일 같은 10,000개의 수익률이 누적된 결과이기 때문입니다.
10,000개의 위치 중에서 임의로 2%에 해당되는 200개의 수정 지점을 고릅니다. 각각의 수정 위치에서 동전을 다시 던져 방금 나온 수치로 바꿔 그래프를 고칩니다. 얼마나 달라질까요?
수정한 그래프 두 개를 비교하면 한 그래프마다 200개 지점이 수정되었을 것입니다. 두 그래프에서 수정한 200개 지점은 다른 그래프와 일치하는 지점도 있겠지만, 대부분은 다를 것입니다. 한 그래프에서 200개 지점을 새로운 동전의 값으로 바꾸면, 평균적으로 100개 지점은 이전과 동일하고, 100개 지점은 바뀔 것입니다.
두 그래프에서 모두 다른 지점이 선정되었다면, 두 그래프는 평균 200개 정도의 지점에 다른 값이 있을 것입니다. 전체 10,000개의 지점에서 200개 지점이 다르니 2%가 다른 그래프입니다.
1년을 250거래일로 가정하면, 2%는 5거래일에 해당됩니다. 두 그래프는 1년간 5거래일만 수익률이 반대(1% 또는 -1%)인 그래프가 됩니다.
다음은 이렇게 만든 10개의 가상의 주가 흐름을 그린 6가지 경우입니다. 임의로 생성하다 최종 수익률이 0% 이상인 경우 3가지와 0% 이하인 경우 3가지를 표시했습니다.






한 그래프에 있는 10개 주가 흐름은 동일한 주가 흐름을 기반으로 변형하였기에 전반적인 경향이 흡사합니다. 하지만 일부는 충분히 비슷해 보이고, 또 다른 일부는 경향은 비슷하지만 장기 수익률이 꽤 다르다고 느껴지는 경우도 있습니다. 마치 동일한 주식 시장에 투자하지만, 성격이 조금씩 다른 ETF인 것처럼 보입니다.
각 주가 흐름의 CAGR도 함께 표시하였습니다. 최대 CAGR과 최소 CAGR의 차이는 그래프 순서대로 1.7%, 1.4%, 1.5%, 2.4%, 1.3%, 1.8%입니다. CAGR의 최대 차이의 평균은 1.7% 정도에 불과하지만, 20년 정도 누적되니 최종 수익률에 꽤 차이가 납니다.
한 그래프에 있는 10개의 주가 흐름은 동일한 모델로 생성했기에 장기 평균 수익률은 같은 수밖에 없습니다. 본질적으로는 같은 것이 확실하지만 달라 보이는 것입니다.
다르게 말하면, 20년치 데이터로 그린 ETF 누적 수익률 그래프를 보고, 특정 ETF의 장기 수익률이 다른 ETF보다 꽤 높아 보여서 선택하더라도 그 선택이 올바른지 확신하기 어렵다는 의미입니다.
실제 데이터로는 어떨까?
가상의 데이터로 만든 결과라서 그렇다고 생각할 수 있습니다. 그렇다면 실제 데이터를 이용해서 살펴보겠습니다. 분석에 사용한 SPY의 거래일 수는 32년 4개월 정도인 8,144일입니다. 이 중에서 2%에 해당되는 163거래일을 임의로 선정하여 투자를 하지 않고 쉬는 경우를 생각해 보겠습니다. 1년 기준으로 평균 5일 정도 투자를 쉬는 것입니다.






임의로 선정한 날짜에 투자를 쉬는 경우를 10개씩 총 6개의 그래프로 그렸습니다. 모두 SPY에 기반을 두고 있기에, 누적 수익률 경향은 흡사해 보입니다. 각 그래프에서 가장 CAGR이 높았던 경우와 낮았던 경우의 차이는 각각 1.6%, 1.5%, 1.4%, 1.3%, 1.4%, 0.8%였습니다. 평균 연 1.3%를 조금 넘는 차이가 났습니다. 앞서 살펴본 동전으로 그린 결과와 큰 차이가 나지 않습니다.
다음은 가치 투자로 유명한 워렌 버핏이 설립한 버크셔 해서웨이 B주와 SPY를 비교한 그래프입니다. 데이터 출처: BRK-B vs SPY

BRK-B와 SPY는 29년간 연평균 1.1%(하단 보조 그래프의 복리 수익률 차이)의 CAGR 차이가 났습니다. 방금 살펴보았던 SPY에 대해 임의의 연 5거래일 투자를 쉬었던 정도의 차이라고 볼 수 있습니다. 순수하게 이 그래프만 보고 CAGR이 연 1% 정도 높았던 BRK-B를 선택하는 것은 얼마나 합리적일까요?
누구나 알다시피 버크셔 해서웨이는 장기간에 걸쳐 미국 S&P 500 지수를 크게 상회한 수익률을 거둔 종목입니다.


왼쪽은 SPY 상장 후부터 버크셔 해서웨이 A주와 비교한 그래프입니다. 연 2.9% BRK-A가 높은 CAGR을 보였습니다. 데이터 출처: BRK-A vs SPY
오른쪽은 가장 긴 기간의 데이터로 BRK-A를 배당 미고려 S&P 500 지수와 비교했습니다. S&P 500 지수의 배당을 고려하지 않았지만, 이름 감안하더라도 연 8.7% CAGR 차이가 났으니 그 차이는 꽤 컸다고 볼 수 있습니다. 데이터 출처: BRK-A vs US500
오른쪽 그래프를 보면, S&P 500 대신 BRK에 투자하는 것이 합리적인 선택으로 보입니다. 42년간에 걸친 수익률 차이가 워낙 크기 때문입니다. 왼쪽 그래프를 보면 조금 애매하긴 하지만 32년간의 데이터이니 BRK가 나아 보입니다.
앞에서 본 BRK-B vs SPY 그래프는 어떻까요? 그래프만 보고 판단하기 쉽지 않습니다. 그렇다고 기간이 짧은 것도 아닙니다. 무려 29년간의 데이터이기 때문입니다.
정리하며
장기 경향이 흡사하면서 어느 정도 수익률 차이가 난다면 충분히 다른 것이고, 투자 선택에 참고할 수 있는지 살펴보았습니다. 가상의 시뮬레이션으로 살펴보면 어느 정도 장기 수익률 차이가 나더라도 단순한 통계 분석으로는 확신하기 쉽지 않다는 것을 알 수 있습니다.
어떤 퀀트(quant) 투자자가 벤치마크인 대비 연 2% CAGR이 높은 새로운 투자 전략을 개발했다고 하겠습니다. 시장 지수 대비 연 2% 일수도 있고, 기존에 사용하는 투자 전략 대비 연 2% 일 수도 있습니다. 20년간의 데이터를 이용하여 백테스트했으니 개발한 전략을 충분히 신뢰할 수 있을까요?
이어지는 글부터 통계적 비교를 어떻게 할 수 있는지, 그리고 그 결과는 신뢰할 수 있는지 차근차근 살펴봅니다.
참고 도서:
이어지는 글: [중급 32] 신기하다고 말할 수 있는 정도는 어떻게 계산할 수 있을까? (그리고 정말 신기한걸까?)
목차: [연재글 목차] 투자 성과 분석 (기초편, 초급편, 중급편): 순서대로 차근차근 읽으면 좀 더 이해가 쉽습니다.
함께 읽으면 좋은 글 (최신 글)
- [중급 30] 두 자산의 미래 수익률이 같다는 것을 알 수 있을까? (정말 다른지 판별할 수 있을까?)
- [중급 29] 정확하다는 것은 무엇일까? (정확하지 않으면 무슨 일이 발생할까?) 투자에서 정보에 대한 통계학적 시각 4
- [중급 28] 안다는 것은 무엇일까? (한식방씨는 어느 지역에 빵집을 열어야 할까?) 투자에서 정보에 대한 통계학적 시각 3
- [중급 27] 모른다는 것은 무엇일까? (한식방씨는 식빵을 몇 개나 만들어야 할까?) 투자에서 정보에 대한 통계학적 시각 2
- [중급 26] 불확실하다는 것은 무슨 뜻일까? (포트폴리오의 변동성) 투자에서 정보에 대한 통계학적 시각 1
함께 읽으면 좋은 글 (인기 글)
'주식투자' 카테고리의 다른 글
| [중급 35] 로그 정규 분포 (투자에서 로그 정규 분포가 필요한 이유) (0) | 2025.06.09 |
|---|---|
| [중급 34] 로그와 로그 스케일 (투자 분석에서 로그의 의미와 로그를 사용하는 이유) (0) | 2025.06.09 |
| [중급 33] 투자 성과는 왜 예측하기 어려울까? (중심 극한 정리가 성립하지 않는 투자 수익률) (0) | 2025.06.08 |
| [중급 32] 놀랍다고 말할 수 있는 정도는 어떻게 계산할 수 있을까? (그리고 정말 신기한걸까?) (0) | 2025.06.07 |
| [중급 30] 두 자산의 미래 수익률이 같다는 것을 알 수 있을까? (정말 다른지 판별할 수 있을까?) (0) | 2025.06.06 |
| [중급 29] 정확하다는 것은 무엇일까? (정확하지 않으면 무슨 일이 발생할까?) 투자에서 정보에 대한 통계학적 시각 4 (0) | 2025.06.05 |
| [중급 28] 안다는 것은 무엇일까? (한식방씨는 어느 지역에 빵집을 열어야 할까?) 투자에서 정보에 대한 통계학적 시각 3 (0) | 2025.06.05 |
| [중급 27] 모른다는 것은 무엇일까? (한식방씨는 식빵을 몇 개나 만들어야 할까?) 투자에서 정보에 대한 통계학적 시각 2 (0) | 2025.06.04 |




