주식투자

[초급 부록 B1] 산술 평균과 기하 평균(CAGR) - 단리 투자와 복리 투자

오렌지사과키위 2024. 11. 21. 18:22

레버리지 ETF를 기초 자산과 비교한 글에서 평균-분산 그래프에는 산술 평균 수익률보다는 연평균 성장률(CAGR)을 사용하는 것이 합리적일 수 있다고 설명하였습니다. 산술 평균은 장기 투자 시 복리 효과를 제대로 표현하지 못할 수 있기 때문입니다. 이전 글: [초급 부록 A3] 레버리지 ETF는 기초 자산(본주)보다 얼마나 위험할까? (SPY vs SSO = SPY ×2)

참고: 이 글에서 말하는 복리 투자는 거치식으로 투자를 의미합니다. 단리 투자는 자산의 평가액을 고정 금액으로 주기적으로 재조정하는 투자를 말합니다. 고정 금액 리밸런싱 전략이라 할 수 있습니다. 어떠한 방식이든 현실에서는 수익률이 단리로 발생하지 않습니다. 관련 글: 단리는 없다 (세상은 복리로 움직인다)

기초편에서 투자 수익률은 복리 효과를 선형적으로 나타내기 위해 로그 스케일로 비교하고, 단위 기간당 수익률은 CAGR과 같이 복리 수익률로 정규화해서 비교하는 것이 적절하다고 여러 차례 설명하였습니다.

설명과는 다르게 초급편에서 설명한 대부분의 평균-분산 그래프에는 산술 평균 수익률을 사용했습니다. 수익률을 정규 분포로 모델링하고 연속적인 투자는 정규 분포의 합으로 묘사했기에, 이에 맞춰 이해하기 쉬운 방식으로 기술했기 때문입니다.

투자에서 평균 수익률이란 무엇인지 살펴봅니다.

주의: 이 글은 특정 상품 또는 특정 전략에 대한 추천의 의도가 없습니다. 이 글에서 제시하는 수치는 과거에 그랬다는 기록이지, 앞으로도 그럴 거라는 예상이 아닙니다. 분석 대상, 기간, 방법에 따라 전혀 다른 결과가 나올 수 있습니다. 데이터 수집, 가공, 해석 단계에서 의도하지 않은 오류가 있을 수 있습니다. 일부 설명은 편의상 현재형으로 기술하지만, 데이터 분석에 대한 설명은 모두 과거형으로 이해해야 합니다.

평균이란 무엇일까?

철수가 수학 시험을 3번 쳤습니다. 시험 친 순서대로 60점, 70점, 80점을 받았습니다. 철수의 수학 실력을 평가하기 위해 수치화된 지표를 고안해야 합니다. 첫 시험 점수인 60점을 쓰는 것이 좋을까요? 아니면 마지막 시험 점수인 80점이 적절할까요?

일관성 있게 언제나 가장 적절한 한 가지 방법은 없습니다. 용도에 따라 합리적인 방법이 달라질 수 있기 때문입니다.

철수의 학창 시절 수학 실력을 다른 학생들과 비교한다면, 산술 평균이 적절할 수 있습니다. 시험마다 출제 범위가 다를 수 있기에, 각 시험은 철수의 학창 시절 전 기간에 걸쳐 부분적으로 평가한다고 볼 수 있기 때문입니다. 철수의 수학 실력은 (60점 + 70점 + 80점) / 3 = 70점이라 보는 것이 무난할 수 있습니다.

철수의 진학 상담을 위해 수학 실적을 살펴본다면, 무엇을 보는 것이 적절할까요? 세 번의 시험 모두 진학을 위한 모의고사로 출제 범위가 동일했다고 하겠습니다. 첫 번째 시험 점수보다는 두 번째 시험 점수가, 두 번째 시험 점수보다는 세 번째 시험 점수가 조금 더 적절할 수 있습니다.

철수의 수학 실력은 조금씩 높아지는 방향으로 계속 변해 왔으며, 최근 시험 점수가 철수의 현재 수학 실력에 보다 가까울 가능성이 높기 때문입니다. 마지막 시험 점수를 기준으로 하거나, 최근 시험 점수일수록 더 높은 가중치로 평균을 내야 합니다.

철수가 대학에 진학할 때에는 두 가지 방식으로 계산한 평균 모두 고려될 수 있습니다. 앞의 평균은 내신 성적으로 반영될 수 있으며, 뒤의 평균은 수능(대학수학능력시험) 점수와 상관성이 높을 것이기 때문입니다. 두 가지 점수를 이용하여 또 다른 평균(종합) 점수를 만들 수도 있습니다.

평균이라고 하면 어떤 데이터에 대해서든 누구나 동일한 방식으로 계산한다고 생각하지만, 목적에 따라 달라질 수 있습니다. 평균은 목적을 고려하여 데이터의 평균적인 특성을 잘 나타내기 위한 대푯값의 하나이기 때문입니다.

시계열 데이터의 표현

철수가 진학을 위해 친 모의고사는 순서가 있습니다. 최근 시험일수록 철수의 현재 수학 실력을 조금 더 정확하게 평가할 가능성이 높다고 볼 수 있습니다. 이처럼 시간적 순서에 의미가 있는 데이터를 시계열(time series) 데이터라고 합니다.

시계열 데이터의 표현 방법은 두 가지가 있습니다. 하나는 수치 그 자체를 시간 순서대로 나열하는 것입니다. 서울의 최근 5일 최고 기온은 아래와 같이 표현할 수 있습니다.

(10도, 12도, 14도, 10도, 8도)

전일 대비 오르거나 내린 정도로도 표현할 수 있습니다. 이 경우 첫날의 기온은 따로 알려주어야 합니다.

(+2도, +2도, -4도, -2도)

기온을 이렇게 표현하는 사람이 어디 있냐 싶지만, 실생활에서 자주 사용합니다. 일기 예보를 들어보면, "오늘의 최고 기온은 어제보다 -4도 떨어진 10도이겠습니다"라고 설명하는 경우가 많습니다. 기온 자체도 의미가 있지만, 최근 대비 변화 정도가 더 쉽게 와닿는 경우도 많기 때문입니다.

투자는 어떻까요? 장이 마감되면 아래와 같은 증시 현황을 정리한 기사가 나옵니다.

오늘 KOSPI는 전일 대비 2%인 50 포인트 상승하여 2,550 포인트로 마감했습니다.

2,550 포인트는 마치 오늘의 최고 기온과 같은 값입니다. 50 포인트는 전일 대비 변동량입니다. 2%는 전일 대비 변동률입니다. 시계열 데이터에서 자산의 가격 변화를 나타내기에 무엇이 적절할까요?

자산에 따라 값의 크기는 다릅니다. KOSPI는 2,500 포인트 정도이며, 나스닥 100은 20,000 포인트에 가깝습니다. 그러니 포인트로 표시된 수치는 자산을 비교하기에 적절하지 않습니다.

KOSPI가 50 포인트 상승한 것과 나스닥 100이 50 포인트 상승한 것은 동일한 변동량이지만, 변동률은 각각 2%와 0.25%로 확연히 다르기 때문입니다. 투자자는 개별 자산이 얼마나 증감했는지에 더 관심이 있기 때문에, 변동량보다 변동률을 보는 것이 더 적절합니다.

변동률은 이전 데이터와 비교하여 계산합니다. 시간순으로 데이터를 나열했을 때, 변동률은 더해지는 개념이 아니라 곱해지는 개념입니다. KOSPI가 3년간 아래와 같은 변동률을 보였다고 하겠습니다.

(5%, 15%, 10%)

3년간 상승한 결과는 5% + 15% + 10% = 30%가 아닙니다. (1 + 5%) × (1 + 15%) × (1 + 10%) - 1 ≒ 32.8% 상승한 것입니다. 위의 데이터는 표현과는 달리 아래와 같은 자산비(ratio)를 의미합니다.

(1.05, 1.15, 1.1)

자산비는 더하는 것이 아니라 곱해야 합니다. 수익률 또는 손실률 형태로 이해하기 쉽게 %로 표시하다 보니, 본래 의미는 자산비라는 것을 간과하기 쉽습니다.

시계열 데이터의 평균

평균은 어떻게 구해야 할까요? 철수의 학창 시절 수학 시험 성적처럼 더하는 것이 적절한 수치는 산술 평균(arithmetic mean)을 쓰면 됩니다. KOSPI 수익률처럼 곱하는 것이 적절한 수치는 기하 평균(geometric mean)이 합리적일 수 있습니다. KOSPI의 3년 자산비의 1년 기하 평균은 아래와 같이 계산됩니다.

³√(1.05 × 1.15 × 1.10) ≒ 1.099

1.099를 세 번 곱하면 1.05 × 1.15 × 1.10와 같은 값이 되니, 1.099는 세 값의 평균이라 볼 수 있습니다. 자산비에서 1을 빼면 수익률이 됩니다. 기하 평균 수익률은 9.9%로 산술 평균 수익률 10%보다 조금 작습니다. 참고: 기하 평균은 항상 산술 평균보다 작거나 같습니다.

평균-분산 그래프에는 어떤 평균을 쓰는 것이 합리적일까요? 매년 동일하게 평가액을 맞추는 단리 투자라면, 산술 평균을 쓰는 것이 합리적입니다. 하지만 대개의 투자자는 다년에 걸쳐 복리 투자를 합니다. 그러니 1년 기하 평균 수익률인 CAGR을 쓰는 것이 조금 더 적절할 수 있습니다.

아래는 KOSPI 200 지수를 추종하는 KODEX 200과 일일 수익률을 2배로 추종하는 KODEX 레버리지의 250거래일 수익률의 산술 평균과 기하 평균(CAGR)입니다. 데이터 출처: [초급 부록 A3] 레버리지 ETF는 기초 자산(본주)보다 얼마나 위험할까? (SPY vs SSO = SPY ×2)

KODEX 200과 KODEX 레버리지의 평균 수익률과 표준 편차

산술 평균은 KODEX 레버리지가 높고, 기하 평균은 KODEX 200이 높습니다. 위의 그래프에서 산술 평균만 그려 놓고 비교하면, KODEX 레버리지가 장기 투자에 유리해 보입니다.

단리 투자를 한다면 KODEX 레버리지의 장기 투자 수익률이 높을 가능성이 높습니다. 하지만, 현실의 투자자는 복리 투자를 할 가능성이 높습니다. 이 경우 산술 평균을 보고 장기 투자 결과를 예상하면, 기대와 다른 결과를 얻을 가능성이 높습니다.

평균-분산 그래프를 이용하여 장기 투자 성과를 추정하거나 자산을 비교할 때에 보수적으로 살펴볼 필요가 있습니다. 기하 평균을 사용하거나, 산술 평균을 쓰더라도 기하 평균과 함께 보아야 할 필요가 있습니다.

정리하며

평균적인 자산 수익률을 나타내는 통계량으로 산술 평균과 기하 평균을 살펴보았습니다. 산술 평균은 1회 투자로 기대할 수 있는 평균 단리 수익률이고, 기하 평균은 충분히 오랜 기간 투자할 때 기대할 수 있는 평균 복리 수익률이라 볼 수 있습니다.

투자자의 목적에 따라 보다 적절한 평균은 다를 수 있습니다. 장기적으로 투자금을 불리기 위해 자산의 수익률을 분석하고 다른 자산과 비교한다면, 산술 평균보다는 기하 평균이 더 중요합니다.

이어지는 글: [초급 부록 B2] 적립식으로 투자하면 변동성은 어떻게 될까? (적립식이 거치식보다 변동성이 높다고?)

목차: [연재글 목차] 투자 성과 분석 (기초편, 초급편): 순서대로 차근차근 읽으면 좀 더 이해가 쉽습니다.

함께 읽으면 좋은 글:

도움이 되었다면, 이 글을 친구와 공유하는 건 어떻까요?

facebook twitter kakaoTalk naver band