지난 글에서 지수 함수(exponential function)와 로그(logarithm; 로가리듬)에 대해 알아보았습니다. 자산의 가격은 복리로 변동하기에 지수 함수를 이용하면 모델링이 간편해집니다. 또한 로그를 사용하면 복리로 변하는 자산 가격을 선형으로 변환할 수 있습니다. 지난 글: [중급 34] 로그와 로그 스케일 (투자 분석에서 로그의 의미와 로그를 사용하는 이유)
이 글에서는 투자에서 수익률 분포를 정규 분포(normal distribution) 대신 로그 정규 분포(log-normal distribution)를 사용해야 하는 상황과 해석 시 주의할 점을 알아봅니다.

주의: 이 글은 특정 상품 또는 특정 전략에 대한 추천의 의도가 없습니다. 이 글에서 제시하는 수치는 과거에 그랬다는 기록이지, 앞으로도 그럴 거라는 예상이 아닙니다. 분석 대상, 기간, 방법에 따라 전혀 다른 결과가 나올 수 있습니다. 데이터 수집, 가공, 해석 단계에서 의도하지 않은 오류가 있을 수 있습니다. 일부 설명은 편의상 현재형으로 기술하지만, 데이터 분석에 대한 설명은 모두 과거형으로 이해해야 합니다.
수익률을 정규 분포로 모델링할 때의 문제점
어떤 자산의 1년 수익률 분포의 평균이 10%이고, 표준 편차가 40%인 정규 분포라면 다음과 같은 확률 분포 그래프로 표현할 수 있습니다.

이 수익률 분포는 실제 자산의 수익률 분포와는 꽤 다를 수 있습니다. 하지만 실용적인 측면에서 비슷하다 하더라도 큰 문제가 하나 있습니다. 일반적으로 현실의 자산은 수익률이 -100% 이하가 될 수 없지만, 이 수익률 모델은 가능한 것으로 표현되는 것입니다.
다음은 나스닥 100 지수의 일일 수익률을 3배 레버리지로 추종하는 TQQQ의 1년(252거래일) 수익률 분포와 이를 모사한(approximation) 정규 분포를 함께 나타낸 그래프입니다.
주의: 수익률을 정규 분포로 모델링했을 때의 문제점을 보여주기 위해 변동성이 높은 자산을 든 것입니다. 본 연재에서는 레버리지(leverage)와 인버스(inverse) 투자를 포함하여 특정 투자 자산이나 투자 전략에 대한 어떠한 의견도 없습니다.

TQQQ의 1년 수익률 분포와 이를 모사한 정규 분포가 크게 달라 보이지는 않습니다. 하지만 정규 분포 모델로는 -100% 근처 또는 그 이하의 수익률이 발생할 가능성이 있고, 발생 확률은 낮았지만 높은 수익률을 보였던 경우를 충분히 커버하지 못하고 있습니다.
간단하게 말하면, TQQQ 1년 수익률 분포를 정규 분포로 모델링하여 분석하면, 1년 투자했을 때 전액 손실이 발생할 수 있으니, 복리로 투자하지 말라는 결론이 나올 수 있습니다.
어떤 자산의 수익률도 정규 분포로 모델링하면 그 확률이 매우 낮긴 하지만 -100% 이하의 수익률이 나올 수 있습니다. 그러니 정규 분포로 수익률을 모델링하고 복리를 가정하여 과거 투자 성과를 분석하거나 미래 성과를 추정하면, 현실에서는 발생할 수 없는 사건이 고려되어 현실과 다소 다른 결론이 나올 수 있습니다.
로그의 성질
투자에서 로그 정규 분포로 수익률을 모델링하는 이유는 명확합니다. -100% 이하의 수익률이 나오는 비현실적인 상황으로 모델링 되는 것을 방지하기 위해서입니다. 여기에 손익 비대칭성, 즉 복리 투자에서 100% 수익률은 -50% 수익률과 동등하다는 점을 고려해야 복리 투자를 모델링하기 수월합니다.
로그는 이러한 특성을 가진 함수입니다. 밑수(base)가 무엇이든 log(1 + 100%) = -log(1 - 50%)입니다. 밑수가 2인 경우로 계산해 보겠습니다. 투자에서 밑수는 단위 기간 자산비를 의미합니다.
단위 기간이 1년이라 가정해 보겠습니다. 수익률 100%는 자산비로 1 + 100% = 2이니 자산이 두 배가 된 경우이고, 수익률 -50%는 자산비로 1 - 50% = 0.5이니 자산이 절반이 된 경우입니다.
이전 글에서도 설명했다시피, 투자에서 로그는 수익률이 아닙니다. 복리 투자 기간(또는 복리 투자 횟수)입니다. log₂(1 + 100%)는 자산이 2배가 되는 데 걸리는 기간이니 1이 됩니다. log₂(1 - 50%)는 자산이 절반이 되는 데 걸리는 기간이니 -1이 됩니다. 마이너스 값이 나오니 헷갈릴 수 있지만, 매년 2배로 자산이 불어난다면, 1년전에 자산이 현재의 절반이었다고 이해하면 됩니다.
손익 비대칭성을 살펴보겠습니다. 자산이 x배 된 후에 1 / x배가 되면, 복리 자산비로는 x × 1 / x = x / x = 1로 수익률이 0%가 됩니다. 로그로 보면 다음과 같습니다.
log(1) = log(x / x) = log(x × 1 / x) = log(x) + log(1 / x) = 0
log(x) = -log(1 / x)
로그 스케일로 그래프를 그리면 y = log(1) = 0인 직선에서 x배 된 위치와 1 / x배 된 위치가 동일한 거리로 나타나기에 손익 비대칭성에 의한 착시가 발생하지 않습니다.
밑수가 2인 로그 그래프를 그려보면 다음과 같습니다.


왼쪽은 자산비로 그린 로그 그래프입니다. 세로축은 투자 기간이라 표시되어 있습니다. 매년 2배로 늘어나는 자산에 대해 투자를 하지 않았다면(x = 100%), 투자 기간은 0년(y = 0)입니다. 2년간 투자했다면 자산은 4배로 늘어 x = 400%가 될 것이고, 이때의 투자 기간은 2년(y = 2)입니다.
오른쪽 그래프는 보다 익숙한 수익률로 x축을 표시한 것입니다. 수익률이 100%(x = 100%)일 때 투자 기간은 1년(y = 1)입니다. 수익률이 -50%(x = 50%)일 때 투자 기간은 -1년(y = -1)입니다.
100%와 -50% 수익률은 복리 수익률로는 대칭 관계에 있습니다. 그래프에서 두 점은 투자 기간 0년(y = 0)을 기준으로 ±1 거리만큼 대칭으로 위치하고 있습니다.
100% 수익률을 거둔 후 다시 100% 수익률을 얻으면, 누적 수익률은 (1 + 100%) × (1 + 100%) - 1 = 2 × 2 - 1 = 3 = 300%입니다. 해당하는 y값은 2입니다. 0에서 출발하여 1칸 위로 이동하면 수익률은 100%가 되고, 다시 한 칸 이동하면 300%가 됩니다. 복리 수익률 100%가 동일한 거리로 표현되어 있습니다.
로그 정규 분포
이제 TQQQ의 1년 수익률을 로그 정규 분포로 나타내 보겠습니다. 참고: 일반적인 로그 정규 분포와 조금 다르게 그립니다. 설명을 참고하기 바랍니다.


로그로 변환한 그래프를 해석할 때에는 유의해야 할 점이 있습니다. 지금까지 계속 이야기했지만, 수익률이 아닌 자산비에 로그를 취해야 합니다. 로그는 0 이하의 값에 대해서는 정의가 되지 않기 때문입니다. 또한 로그값은 수익률이 아니라 밑수에 대한 투자 기간입니다.
수익률 + 1에 로그를 취한 값을 로그 수익률로 설명하는 경우가 많습니다. 잘못된 설명은 아닙니다. 하지만 x축은 엄밀하게는 수익률이 아닙니다. 자연대수(natural logarithm) e ≒ 2.71828를 자산비로 가지는 경우에 대한 투자 기간입니다. 경우에 따라서는 성장률(growth rate)라 부르기도 합니다. 참고: CAGR도 성장률입니다.
현실을 추상화한 수학에서는 대개 단위가 없습니다. 1 × 1 = 1입니다. 현실에서는 1m × 1m = 1m²입니다. 동일한 숫자 1이지만, 1m는 길이이고, 1m²은 넓이입니다.
y = rˣ로 표현되는 지수 함수에도 단위가 없습니다. 투자에서는 r를 단위 기간 자산비로, x를 투자 기간으로 설정합니다. y 역시 자산비입니다. 로그로 변환하면 logᵣ(y) = x가 됩니다. y라는 자산비를 주었을 때, x라는 투자 기간을 얻는 것입니다. 그러니 로그를 취해 얻은 결과는 엄밀하게는 수익률도 아니고, 자산비도 아닙니다. 투자 기간입니다.
오른쪽 그래프는 이를 명확하게 하기 위해 x축 눈금을 투자 기간으로 표시한 것입니다. 0은 자산비가 e⁰로 본전인 경우이고, e¹은 1년 투자하여 172% 수익률을 거두어 2.72배로 자산이 늘어난 경우입니다.
다음 그래프와 같이 수익률의 절대값이 작은 경우 x ≒ ln(1 + x)이기에 수치를 수익률처럼 받아들여도 별 무리가 없을 수 있습니다. 하지만, 수익률의 절대값이 커지면 수익률과 로그 수익률의 차이가 커지기에 해석에 유의해야 합니다. 로그 수익률은 연속 복리 성장률(continuously compounded return)로 불리기도 합니다.

로그 수익률 분포에서 이해하기 쉬운 밑수를 지정하는 경우
자연대수 e는 여러 모로 유용한 상수이긴 하지만, 투자에서 익숙하지 않은 숫자이기에 헷갈릴 수 있습니다. 보다 익숙한 자산비를 사용해 보겠습니다. 밑수를 2로 두면 1회 투자와 -1회 투자가 두 배 또는 절반이 되며, 0회 투자와 1 거리 차이가 납니다. 2는 지수로 암산하기에 편리하고, e에도 가깝습니다.

이 그래프의 x축은 1회 투자로 2배로 불어나는 자산과 비교했을 때의 투자 기간 또는 횟수로 이해해야 합니다. x = 0은 투자를 하지 않았으니 자산비가 1, 즉 수익률이 0%인 경우입니다. x = 1은 1회 투자로 자산이 2배가 되는 수익률인 100%인 지점입니다. x = -2인 지점은 -2회 투자로(또는 2회 투자 실패로) 자산이 1 / 4이 되는 -75% 수익률 지점입니다.
이 그래프를 포함하여 초록색으로 그린 로그 정규 분포 범례에 평균과 표준 편차가 적혀 있습니다. 마찬가지로 수익률이 아닙니다. 투자 기간입니다. 1년에 100% 복리 수익률을 가진 자산에 0.489년 투자한 2⁰·⁴⁸⁹ ≒ 1.40이 기하 평균 자산비입니다. 여기에서 1을 뺀 40%가 TQQQ의 1년 복리 수익률이라 볼 수 있습니다. 참고: CAGR과 비슷한 값이 나오기는 하지만 다른 개념입니다. 일일 자산비로 기하 평균을 계산한 후 년단위 수익률로 환산해야 CAGR과 동일합니다.
표준 편차 역시 투자 기간입니다. 평균 ±1 표준 편차 구간은 [48.9% ± 69.3%]입니다. 자산비 구간으로 환산하면, [2⁻⁰·²⁰⁴, 2¹·¹⁸²] ≒ [86.8%, 227.9%]이고, 수익률 구간으로 환산하면 [-13.2%, 127.9%]이 됩니다.
정규 분포와 로그 정규 분포로 나타낸 수익률 분포
정규 분포와 로그 정규 분포로 나타낸 수익률 분포를 비교해 봅니다.


TQQQ의 1년 수익률 분포는 왼쪽의 정규 분포와 좀 더 비슷합니다. 발생할 수 없는 -100% 이하의 수익률이 가능한 것처럼 표현되어 있고, 빈도는 낮지만 매우 높은 수익률 구간은 일부 포함하지 못합니다.
오른쪽 로그 정규 분포를 보면, 반대의 현상이 나타납니다. 낮은 수익률이 발생한 구간을 일부 포함하지 못하고 있습니다. 이는 손익 비대칭성을 고려했을 때 TQQQ는 로그 정규 분포 모델의 추정보다 더 위험한 경우가 많았다는 의미입니다. 반대로 높은 수익률 구간은 조금 더 넓게 잡고 있습니다.
어느 한 가지 분포가 더 정확하다는 것은 아닙니다. 자산에 따라 수익률 분포가 상당히 다를 수 있기에, 경우에 따라서는 정규 분포가, 또 다른 경우에는 로그 정규 분포가 좀 더 적절해 보일 수 있습니다. 다만 TQQQ의 경우에는 로그 정규 분포로 모델링하면 위험이 과소 평가될 수 있습니다.
로그 정규 분포의 최빈값은 실제 분포의 최빈값에 비해 살짝 왼쪽에 있습니다. TQQQ의 로그 수익률 분포가 오른쪽으로 치우쳐있기 때문입니다.
정규 분포와 로그 정규 분포를 비교해 보면, 왼쪽으로 갈수록 로그 정규 분포의 높이가 낮아지는 것을 볼 수 있습니다. 이는 정규 분포에서 수익률이 낮은 구간일수록 로그 정규 분포에서는 더 넓어지기 때문입니다.
로그 정규 분포의 x = -2는 정규 분포의 -75% 지점에 해당됩니다. 정규 분포가 그려진 된 고무판을 왼쪽에서 바깥쪽으로 쭉 잡아당기면서, 넓이(확률)를 맞춰주기 위해 높이를 낮추었다고 보면 됩니다. 반대로 오른쪽은 안쪽으로 밀면서 높이를 높여준 것입니다.
정리하며
로그 정규 분포가 무엇이며, 투자에서 로그 정규 분포를 사용하는 이유를 살펴보았습니다. 로그 정규 분포가 자산의 수익률 분포를 항상 더 정확하게 묘사할 수 있는 것은 아닙니다.
로그 정규 분포로 수익률을 모델링하면, -100% 이하의 비현실적인 수익률이 발생하지 않고, 손익 비대칭성을 제거할 수 있으며, 곱셈을 덧셈으로 변환할 수 있기에 복리 투자 분석이 수월해지기에 사용하는 것입니다.
참고 도서:
이어지는 글: [중급 36] 로그 수익률(log return)의 본질은 무엇일까? (수익률이 아니지만 수익률로 간주할 수 있는 이유는 무엇일까?)
목차: [연재글 목차] 투자 성과 분석 (기초편, 초급편, 중급편): 순서대로 차근차근 읽으면 좀 더 이해가 쉽습니다.
함께 읽으면 좋은 글 (최신 글)
- [중급 34] 로그와 로그 스케일 (투자 분석에서 로그의 의미와 로그를 사용하는 이유)
- [중급 33] 투자 성과는 왜 예측하기 어려울까? (중심 극한 정리가 성립하지 않는 투자 수익률)
- [중급 32] 놀랍다고 말할 수 있는 정도는 어떻게 계산할 수 있을까? (그리고 정말 신기한걸까?)
- [중급 31] 장기 경향이 비슷하면서 수익률 차이가 난다면 다르다고 판단할 수 있을까? (정말 동일하다고 판별할 수 있을까?)
- [중급 30] 두 자산의 미래 수익률이 같다는 것을 알 수 있을까? (정말 다른지 판별할 수 있을까?)
함께 읽으면 좋은 글 (인기 글)
'주식투자' 카테고리의 다른 글
| [중급 39] 복리 수익률로 보는 평균-분산 그래프의 해석 (표준 편차에 대한 비대칭 해석) (0) | 2025.06.12 |
|---|---|
| [중급 38] 로그 수익률로 보는 평균-분산 그래프의 해석 (어떤 스케일로 그래프를 그려야 할까?) (0) | 2025.06.12 |
| [중급 37] 로그 스케일 그래프는 어떻게 해석할 수 있을까? (투자 기간의 변화로 이해해 보자) (0) | 2025.06.11 |
| [중급 36] 로그 수익률(log return)의 본질은 무엇일까? (수익률이 아니지만 수익률로 간주할 수 있는 이유는 무엇일까?) (0) | 2025.06.10 |
| [중급 34] 로그와 로그 스케일 (투자 분석에서 로그의 의미와 로그를 사용하는 이유) (0) | 2025.06.09 |
| [중급 33] 투자 성과는 왜 예측하기 어려울까? (중심 극한 정리가 성립하지 않는 투자 수익률) (0) | 2025.06.08 |
| [중급 32] 놀랍다고 말할 수 있는 정도는 어떻게 계산할 수 있을까? (그리고 정말 신기한걸까?) (0) | 2025.06.07 |
| [중급 31] 장기 경향이 비슷하면서 수익률 차이가 난다면 다르다고 판단할 수 있을까? (정말 동일하다고 판별할 수 있을까?) (0) | 2025.06.07 |




