지금까지의 연재를 통해 구글 시트를 이용하여 자산의 데이터를 처리하여 기초 통계량을 추출, 표현, 분석하고, 다른 자산과도 비교하는 기본적인 방법 대부분을 설명했습니다. 유용하게 사용할 수 있는 기본 분석 방법 중에서는 두 가지 정도가 남아있습니다. (나중에 한두 가지 정도 더 생각날 수는 있습니다.)
하나는 두 자산의 수익률 분포를 확률 분포로 표현하고 비교하는 것입니다. 예를 들어 SPY의 환헤지와 환노출 수익률 분포를 하나의 확률 분포 그래프에 나타내면, 환율에 의해 수익률 분포가 어떻게 변했는지 추정해 볼 수 있습니다. [데이터 분석 5] 수익률 분포를 정규 분포와 함께 그려보자 (구글 시트 편)에서 SPY의 수익률 분포를 막대그래프로 나타내는 방법을 소개했기에 이 주제는 생략하겠습니다. 하나의 자산이 아니라 두 개의 자산에 대해서 수익률 분포를 그리도록 확장하면 됩니다.
또한 평균-분산 그래프에서도 환율에 의해 자산의 위치가 어떻게 바뀌었는지 살펴봄으로써 대략적인 영향을 추정할 수 있습니다. 참고: [데이터 분석 11] 환율을 고려해서 환노출 주가를 계산하고 평균-분산 그래프에서 환헤지와 비교해 보자 (구글 시트 편)
[데이터 분석 14] 두 자산의 수익률 분포를 비교해 보자 (구글 시트 편, feat. 미국배당다우존스 커버드콜)에서 소개한 두 자산 수익률을 분산형 차트로 나타내는 방법도 사용할 수 있습니다. 환헤지와 환노출 수익률을 사용해서 분산형 그래프를 그리면, 환율에 의해 수익률이 어떻게 변했는지 가장 상세하게 살펴볼 수 있습니다. 확률 분포 그래프와 평균-분산 그래프는 전반적인 분포 변화에 집중한다면, 분산형 차트는 점 단위로 어떤 구역이 어디로 이동했는지도 추적할 수 있습니다.
참고: 이러한 분석에는 인터렉티브(interative)한 조금 더 전문적인 데이터 표현(data visualization) 툴이 효과적입니다. 유사한 변화 경향을 보인 점들을 군집화(clustering)하고, 개별 군집이 어디로 이동했는지 군집 단위로 추적하면 데이터 특성을 이해하고 자산 간 특성을 보다 직관적으로 이해할 수 있습니다. 개인 투자자가 이 정도까지의 분석이 필요한 것은 아닙니다.
다른 하나는 투자 기간에 따른 위험의 변화입니다. 투자자에게 가장 유용한 분석의 하나입니다. 예를 들어 특정 자산에 3년간 투자하고자 한다면, 과거 데이터로 볼 때 얼마나 위험했는지 파악하는 것입니다. 투자 기간을 늘리거나 줄이면 위험이 어떻게 달라졌는지도 살펴볼 수 있습니다. 투자 가능한 자산이 여럿 있다면, 투자 기간에 따라서 우위가 어떻게 달라지는지를 파악해서 투자 판단에 참고할 수 있습니다.
제 책 <왜 위험한 주식에 투자하라는 걸까? - 장기 투자와 분산 투자에 대한 통계학적 시각>의 두 가지 주된 주제 중 하나인 장기 투자에 대한 분석 방법이라 볼 수 있습니다. 다른 하나인 분산 투자는 지금까지의 연재에서 소개한 평균-분산 그래프에서 혼합 포트폴리오를 나타내어 분석하는 방식으로 살펴본 바 있습니다.
이 분석이 제일 마지막에 있는 이유는 데이터 처리 방식이 상대적으로 가장 복잡하기 때문입니다. 이전 연재에서 소개했던 ARRAYFORMULA() 함수와 INDIRECT() 함수를 함께 사용해야 합니다.
같은 목적으로 보다 단순화하여 분석하는 방법은 이미 소개한 바 있습니다. [데이터 분석 6] 수익률 분포를 정규 분포로 모델링하고 위험을 추정해 보자 (구글 시트 편)에서 SPY 1년 수익률을 정규 분포로 모델링하고, 정규 분포를 이용하여 투자 기간에 따른 위험의 변화를 살펴보았습니다. 이 글에서 소개하는 분석 방법도 목적과 기본적인 접근 방법은 동일합니다. 투자 기간에 따른 수익률을 정규 분포 모델로부터 추정하는 것이 아니라, 과거 데이터에서 도출한다는 점만 다릅니다.
주의: 이 글에서 지칭하는 기초자산과 커버드콜 지수은 각각 미국배당다우존스 지수와 미국배당다우존스 +7% 프리미엄 커버드콜 지수에 한정합니다. 다른 기초자산과 이에 기초로 하는 커버드콜 지수는 그 특성이 다소 다를 수 있습니다.
주의: 이 글은 특정 상품 또는 특정 전략에 대한 추천의 의도가 없습니다. 이 글에서 제시하는 수치는 과거에 그랬다는 기록이지, 앞으로도 그럴 거라는 예상이 아닙니다. 분석 대상, 기간, 방법에 따라 전혀 다른 결과가 나올 수 있습니다. 데이터 수집, 가공, 해석 단계에서 의도하지 않은 오류가 있을 수 있습니다. 일부 설명은 편의상 현재형으로 기술하지만, 데이터 분석에 대한 설명은 모두 과거형으로 이해해야 합니다.
투자 기간에 따른 평균 수익률과 위험 수익률 계산하기
INDIRECT() 함수를 이용하면 주어진 투자 기간에 대해 모든 가능했던 수익률을 구해 평균을 낼 수 있습니다. 다음 그림은 이를 위해 데이터를 정돈한 시트입니다.
상단에 첫 행의 행 번호인 8, 마지막 행의 행 번호인 2530이 기입되어 있습니다. 제 경우에는 행 번호를 직접 입력했지만, 함수를 이용하여 데이터에서 자동으로 찾게 만들 수도 있습니다.
중간에 보면 개월수, 거래일수, 년수가 있습니다. 데이터를 촘촘하게 생성하기 위해 개월을 기본으로 했고, 평균 수익률 계산을 위해 개월수를 월 21거래일로 가정해서 환산했습니다. 최종적으로 그래프에는 년단위로 표시하기 위해 년수로 다시 환산했습니다.
시트에서 핵심은 O10 셀입니다. 주어진 투자 기간에 대한 수익률을 배열로 계산하고, 평균 수익률을 구합니다. ARRAYFORMULA() 함수를 이용하면, 두 배열의 각각의 쌍으로 나누기를 할 수 있습니다. 위의 예에서 거래일수는 M10셀에 지정된 63거래일입니다. 그러니 N71 / N8, N72 / N9, N73 / N10, ... 이렇게 모든 63거래일 차이가 나는 셀의 조합에 대해 자산비를 구해 수익률로 환산해서 평균을 내면 됩니다. ARRAYFORMULA() 함수를 다음과 같이 사용하면 됩니다.
ARRAYFORMULA(AVERAGE(N71:N2530 / N8:2467)) - 1
위의 수식은 63거래일 차이가 나는 두 배열을 나누어 자산비를 계산하고 1을 빼서 수익률로 환산한 것입니다. 고정된 셀 범위가 아닌 주어진 거래일수에 맞춰 셀 범위를 만들기 위해 INDIRECT() 함수를 사용할 수 있습니다. 분자가 되는 셀 범위와 분모가 되는 셀 범위는 각각 다음과 같이 됩니다.
분자: INDIRECT("H" & 8 + 63 & ":H2530")
분모: INDIRECT("H8:H" & 2530 - 63)
데이터 첫 행 번호와 마지막 행 번호, 그리고 계산하고자 하는 수익률의 거래일수를 각각 다른 셀로 지정했기에, 최종적으로 다음과 같은 수식이 됩니다.
ARRAYFORMULA(AVERAGE(INDIRECT("H" & $N$3 + $M10 & ":H" & $N$4) / INDIRECT("H" & $N$3 & ":H" & $N$4 - $M10))) - 1
첫 행과 마지막 행 번호를 지정한 두 셀 밑에 하위 위험 순위를 기입한 셀이 있습니다. 하위 몇 % 순위를 위험으로 간주할 것이지 지정한 것입니다. 여기서는 하위 5%를 지정했습니다. 101명의 투자자가 있다면 95등에 해당하는 운 나쁜 투자자라고 할 수 있습니다. 이보다 위험에 민감한 투자자라면 보다 작은 수치를, 위험에 조금 덜 민감한 투자자라면 조금 큰 수치를 사용하면 됩니다. 참고: 하위 1%, 하위 10% 같이 여러 단계로 위험을 정의하고 함께 그래프에 나타낼 수도 있습니다.
수익률 배열에서 특정 순위의 수익률은 PERCENTILE() 함수로 얻을 수 있습니다. 다음과 같은 수식을 이용합니다. AVERAGE() 함수 대신 PERCENTILE() 함수를 썼고, 두 번째 인자로 5%가 지정된 셀을 지정했습니다.
ARRAYFORMULA(PERCENTILE(INDIRECT("I" & $N$3 + $M8 & ":I" & $N$4) / INDIRECT("I" & $N$3 & ":I" & $N$4 - $M8), N$5)) - 1
이제 데이터 정돈이 완료되었습니다. 거래일수나 하위 순위를 바꾸면, 자동으로 재계산되어 표시됩니다. 그래프로 그려보면 다음과 같습니다.
투자 기간이 1년 정도였다면, 기초 자산과 커버드콜의 평균 수익률과 위험(하위 5% 순위) 수익률은 비슷했습니다. 각각 점선과 실선으로 표시되어 있습니다. 동일한 자산은 같은 색으로 나타냈습니다. 2년 정도 투자했다면, 그 차이가 눈에 보일 정도로 커졌습니다. 투자 기간이 길어질수록 기초 자산과 커버드콜의 평균 수익률과 위험 수익률 모두 점차 벌어집니다.
위험에 민감한 투자자는 하위 5% 순위 수익률을 주의 깊게 살펴볼 필요가 있습니다. 하위 5% 순위 수익률은 1년 정도 지나면 기초 자산이 커버드콜보다 확연히 더 높았습니다. 그 차이는 투자 기간이 길어질수록 점차 커졌습니다. 다르게 말하면, 커버드콜은 기초 자산보다 더 안전한 자산이 아니었을 가능성이 높다는 의미입니다. 참고: 기초 자산의 파생 상품 성격인 커버드콜은 상대 수익률 경향이 미래에도 계속 비슷한 형태로 나타날 가능성이 높습니다. 미래는 항상 불확실하기에 과거 데이터를 분석하는 것이기에 의도적으로 모호하게 설명하는 것입니다. 제 글에 이해하기 어렵게 군더더기처럼 '수 있었습니다', '가능성이 높았습니다'라는 표현이 자주 나타나는 이유입니다.
1년 복리 평균 수익률로 나타내기
동일한 수익률 그래프를 연수익률로 환산해서 그려보면 다음과 같습니다. 왼쪽 그림과 같이 앞의 데이터 시트에서 투자기간(년)을 이용하여 CAGR을 구합니다. 설명의 편의를 위해 위험 순위는 하위 10%로 변경했습니다. 101명 중에 90등 순위 투자자의 수익률이라 할 수 있습니다.
오른쪽 그래프를 보면 대략 5년 정도 투자했다면, 기초 자산에 투자했던 투자자 중에서 하위 10% 순위의 투자자 수익률이 커버드콜에 투자했던 투자자의 평균 수익률과 비슷해졌습니다. 참고: 여기서는 평균 수익률을 사용했지만, 분석 목적에 따라서는 중앙값을 쓰는 것이 더 적절할 수 있습니다. 중앙값은 101명의 투자자 중에서 51등에 해당되는 투자자의 수익률입니다. PERCENTILE() 함수로 구할 수 있습니다.
평균 수익률과 하위 10% 수익률 모두 투자 기간이 늘어남에 따라 평균 수익률로 수렴하는 큰 수의 법칙 현상이 나타납니다. 장기 투자 하십시오!
정리하며
투자 기간에 따른 위험의 변화를 쉽게 인지하기 위해 과거 데이터를 이용하여 그래프로 나타내고 비교하는 방법을 살펴보았습니다.
이어지는 글: [데이터 분석 부록 A1] 인플레이션 추정과 반영 (구글 시트 편)
목록: 자산 배분 분석 방법과 사례 글 모음 [목록] (순서대로 차근차근 읽기를 권합니다)
참고 서적: <왜 위험한 주식에 투자하라는 걸까? - 장기 투자와 분산 투자에 대한 통계학적 시각> - 이 연재에서 소개하는 각종 분석 방법의 의미를 소개합니다.
에필로그
이번 편이 구글 시트를 이용하여 자산 및 자산 간의 관계 데이터를 분석하는 연재의 마지막 편이었습니다. 기본적인 분석 방법 위주로 소개했지만, 대부분의 개인 투자자에게 이 정도면 크게 모자란 수준은 아닐 거라 생각합니다. 연재에서 배운 지식을 응용하면, 본인에게 필요한 분석으로 확장하는 것도 충분히 가능하리라 봅니다.
개인적으로는 파이썬(Python)을 이용하는데, 연재글을 작성하면서 구글 시트로도 웬만한 분석은 그리 어렵지 않게 할 수 있다는 점에서 놀랐습니다. 구글 시트는 세부 설정에 다소 제약이 있기는 하지만, 협업 기능을 중심으로 무료로 제공되는 툴이라는 점을 고려하면, 가성비가 좋다고 느꼈습니다.
기본 기능이 좀 더 다양하고 고급 기능도 제공하는 마이크로소프트 엑셀은 놀라울 정도로 잘 사용하는 분들이 많습니다. 이 분들은 제가 소개한 연재 내용을 기반으로 본인의 입맛에 맞춰 더 편리하고 유용하게 활용할 수 있는 시트를 만들 수 있을 거라 생각합니다. 참고: 사용해보지는 않았지만, 구글 시트는 앱스 스크립트(Apps Script)를 지원합니다. 마이크로소프트 엑셀의 VBA처럼 프로그래밍이 가능합니다. 또한 매크로 기능도 제공하기에 반복 작업을 손쉽게 처리할 수 있는 것으로 알고 있습니다.
이 연재를 조금 보완해서 책으로도 내는 것도 고려하고 있습니다. 하지만 책으로 출간한다고 해서 여기서 내용이 더 상세해지지는 않을 듯합니다. 스프레드시트에 익숙한 분들이 이미 많기에 스프레드시트를 다루는 구체적인 방법은 소개할 필요가 없고, 무엇을 위해 어떻게 할 수 있는지 정도만 알게 되어도 충분히 응용할 수 있을 거라 생각하기 때문입니다.
그래서 만일 출간한다면 "구글 시트를 활용한 자산 데이터 분석 방법 (오렌지사과의 불친절한 워크북)" 정도의 제목을 붙이지 않을까 싶습니다.
이 연재는 제 책 <왜 위험한 주식에 투자하라는 걸까? - 장기 투자와 분산 투자에 대한 통계학적 시각>의 보완적 성격으로 시작되었습니다. 해당 책에서 소개한 주요 분석 방법을 투자자가 실제 활용해 볼 수 있도록 구성하였습니다. 각 분석 방법의 목적이 무엇이고, 분석 결과를 어떻게 해석할 수 있는지 이해한 상황에서 분석 방법을 활용하면, 합리적인 투자 결정을 내리는데 조금은 더 효과적으로 참고할 수 있기 때문입니다.
제 책이 아니더라도 자산 성과 분석 방법을 소개하는 좋은 책 한 권 정도는 정독하기를 권합니다. 아쉽게도 저는 투자 입문자의 눈높이에 맞춘 이 부류의 책을 찾지 못했기에 직접 집필한 것입니다.
소설책 보듯이 읽으라는게 아닙니다. 교과서를 읽으면서 시험에 대비해서 공부하는 것처럼 정독하십시오. 투자는 여러분에게 수십년에 걸쳐 계속 주어지는 시험입니다. 시험은 교과서 범위를 높게 반영하여 출제됩니다. 그러니 먼저 교과서에 해당하는 좋은 책 위주로 정독하십시오. 잘 모르는 부분은 여러번 읽으면서 곰곰이 생각해 보고, 궁금한 점은 주변 사람과 논의하거나 카페에 질문을 올리십시오.
사람은 본인이 할 수 있는 일의 결과물에 대해서는 냉정하게 판단할 수 있지만, 그렇지 못한 일의 결과물을 평가할 때에는 감정에 휘둘리거나 권위(?) 있어 보이는 남의 말에 좀 더 귀를 기울이게 됩니다. 경우에 따라서는 아예 그 일과 그 일의 결과물을 무시하기도 합니다.
투자도 마찬가지입니다. 주식에 장기 투자하라고 아무리 권해도 나는 안전한 예금만 하겠다고 고집하는 사람이 주변에 한 둘은 있을 것입니다. 왜 그럴까요? 물론 예금에 집중하는 투자 전략이 잘못된 것은 아닙니다. 하지만 그분들은 장기 투자에서 위험이 무엇이고, 주식과 같이 단기적으로 위험해 보이는 자산이 장기적으로는 예금보다 더 안전할 수 있는 이유를 모르기 때문입니다. 장기 투자와 분산 투자가 무엇인지 충분한 수준으로 이해하지 못한 상황이기에, 예금을 고집하는 것입니다.
조금은 과장된 홍보로 들릴 수 있겠지만, 이에 대해 제 나름대로의 생각과 방식으로 교과서적 설명을 시도한 최종 결과물이 제 책입니다. 이 연재는 그 교과서에서 소개한 주요 내용에 대해 연습 문제를 제시하면서 그 풀이 과정을 해설한 것입니다. 그러니 가능하면 직접 해 보시길 권합니다. 직접 문제를 풀어보아야 그 원리와 과정, 그리고 결과물을 제대로 이해할 수 있습니다.
교과서를 공부하면서 원리를 이해하고, 연습 문제를 직접 풀어보면서 풀이 방법도 체득하면, 이제는 내가 어느 정도는 할 수 있는 일이 됩니다. 그러면 동일한 부류의 작업 결과물에 대해 이전보다 좀 더 냉정하게 평가할 수 있게 됩니다. 적어도 장기 투자를 계획하면서 높은 비중으로 커버드콜에 투자하는 선택은 거의 발생하지 않을 것입니다.
지금까지 읽어 주신 독자분들에게 감사드리고, 이 연재가 투자에 조금이나마 도움이 되기를 바랍니다.
숙제: 미래에셋자산운용이 2025년 1월 21일에 TIGER 미국배당다우존스타겟데일리커버드콜을 출시할 예정이라는 미래에셋자산운용 블로그 글이 올라왔습니다. 해당 블로그 글에도 설명되어 있다시피, 이 상품은 Dow Jones U.S. Dividend 100 10% Daily Premium Covered Call Index을 기초지수로 사용합니다. S&P Global 사이트에서 백테스트 데이터를 받을 수 있으니 어떤 특성이 있었는지 직접 분석해 보기 바랍니다. 저도 분석해 보지는 않았습니다. 이제 모두 성인일 테니, 더 이상의 숙제 검사는 없습니다.
함께 읽으면 좋은 글:
- [데이터 분석 14] 두 자산의 수익률 분포를 비교해 보자 (구글 시트 편, feat. 미국배당다우존스 커버드콜)
- [데이터 분석 13] 두 자산의 상대 수익률 변화를 살펴보자 (구글 시트 편)
- [데이터 분석 12] 자산과 환율의 시간의 흐름에 따른 상관성 변화를 살펴보자 (구글 시트 편)
- [데이터 분석 11] 환율을 고려해서 환노출 주가를 계산하고 평균-분산 그래프에서 환헤지와 비교해 보자 (구글 시트 편)
- [데이터 분석 10] 특정 포트폴리오를 평균-분산 그래프에 표시해 보자 (구글 시트 편)
- S&P 500 국내 ETF는 무엇이 좋을까? (국내 상장 ETF 9종 비교와 분석)
- 한국인은 커버드콜 ETF에 장기 투자해도 좋을까? - 커버드콜 ETF에 대한 글 모음
- 나스닥 100 국내 ETF는 무엇이 좋을까? (국내 상장 ETF 5종 비교와 분석)
- 당신이 커버드콜에 장기 투자하면 안되는 이유 (매년 100만원씩 손해보지 않는 방법) 출간에 부쳐 (샘플북 포함)
- 외화 RP는 위험한가? (증권사가 RP를 운용하는 방법)
'주식투자' 카테고리의 다른 글
[데이터 분석 부록 A3] 인플레이션을 고려한 인출식 투자 성과 추정 (구글 시트 편) (1) | 2025.01.19 |
---|---|
[데이터 분석 부록 A2] 인플레이션을 고려한 적립식 투자 성과 추정 (구글 시트 편) (0) | 2025.01.19 |
TIGER 미국배당다우존스타겟데일리커버드콜 ETF를 직접 분석해 보세요 (0) | 2025.01.18 |
[데이터 분석 부록 A1] 인플레이션 추정과 반영 (구글 시트 편) (0) | 2025.01.12 |
[데이터 분석 14] 두 자산의 수익률 분포를 비교해 보자 (구글 시트 편, feat. 미국배당다우존스 커버드콜) (0) | 2025.01.11 |
[데이터 분석 13] 두 자산의 상대 수익률 변화를 살펴보자 (구글 시트 편, feat. 미국배당다우존스 커버드콜) (0) | 2025.01.11 |
[데이터 분석 12] 자산과 환율의 시간의 흐름에 따른 상관성 변화를 살펴보자 (구글 시트 편) (0) | 2025.01.11 |
[데이터 분석 11] 환율을 반영한 환노출 주가를 계산하고 평균-분산 그래프에서 환헤지와 비교해 보자 (구글 시트 편) (1) | 2025.01.09 |