지금까지의 구글 시트를 이용하여 자산 가격 데이터를 가공하여 기초 통계량을 추출, 표현, 분석하고, 다른 자산과도 비교하는 기본적인 방법 대부분을 설명했습니다. 유용하게 사용할 수 있는 기본 분석 방법 중에서는 두 가지 정도가 남아있습니다. (나중에 한두 가지 정도 더 생각날 수는 있습니다.)
하나는 두 자산의 수익률 분포를 확률 분포로 표현하고 비교하는 것입니다. 예를 들어 SPY의 환헤지와 환노출 수익률 분포를 하나의 확률 분포 그래프에 나타내면, 환율에 의해 수익률 분포가 어떻게 변했는지 추정해 볼 수 있습니다. [데이터 분석 5] 수익률 분포를 정규 분포와 함께 그려보자 (구글 시트 편)에서 SPY의 수익률 분포를 막대그래프로 나타내는 방법을 소개했기에 이 주제는 생략하겠습니다. 하나의 자산이 아니라 두 개의 자산에 대해서 수익률 분포를 그리도록 확장하면 됩니다.
또한 평균-분산 그래프에서도 환율에 의해 자산의 위치가 어떻게 바뀌었는지 살펴봄으로써 환율의 대략적인 영향을 추정할 수 있었습니다. 참고: [데이터 분석 11] 환율을 고려해서 환노출 주가를 계산하고 평균-분산 그래프에서 환헤지와 비교해 보자 (구글 시트 편)
[데이터 분석 14] 두 자산의 수익률 분포를 비교해 보자 (구글 시트 편, feat. 미국배당다우존스 커버드콜)에서 소개한 두 자산 수익률을 분산형 차트로 나타내는 방법도 사용할 수 있습니다. 환헤지와 환노출 수익률을 사용해서 분산형 그래프를 그리면, 환율에 의해 수익률이 어떻게 변했는지 가장 상세하게 살펴볼 수 있습니다. 확률 분포 그래프와 평균-분산 그래프는 전반적인 분포 변화에 집중한다면, 분산형 차트는 점 단위로 어떤 구역이 어디로 이동했는지도 추적할 수 있습니다.
참고: 이러한 분석에는 인터렉티브(interactive)한 조금 더 전문적인 데이터 표현(data visualization) 툴이 효과적입니다. 유사한 변화 경향을 보인 점끼리 모아 군집화(clustering)하고, 개별 군집이 어디로 이동했는지 군집 단위로 추적하면 데이터 특성을 이해하고 자산 간 차이를 보다 직관적으로 이해할 수 있습니다.
다른 하나는 투자 기간에 따른 위험의 변화입니다. 투자자에게 가장 유용한 분석의 하나입니다. 예를 들어 특정 자산에 3년간 투자하고자 한다면, 과거 데이터로 볼 때 얼마나 위험했는지 파악하는 것입니다. 투자 기간을 늘리거나 줄이면 위험이 어떻게 달라졌는지도 살펴볼 수 있습니다. 투자 가능한 자산이 여럿 있다면, 투자 기간에 따라서 우위가 어떻게 달라지는지 파악해서 투자 판단에 참고할 수 있습니다.
제 책 <왜 위험한 주식에 투자하라는 걸까? - 장기 투자와 분산 투자에 대한 통계학적 시각>의 두 가지 주된 주제 중 하나인 장기 투자에 대한 분석 방법이라 볼 수 있습니다. 다른 하나인 분산 투자는 지금까지의 연재에서 소개한 혼합 포트폴리오를 평균-분산 그래프에 나타내어 분석하는 방식으로 살펴본 바 있습니다.
이 분석이 제일 마지막에 있는 이유는 데이터 처리 방식이 상대적으로 가장 복잡하기 때문입니다. 이전 연재에서 소개했던 ARRAYFORMULA() 함수와 INDIRECT() 함수를 함께 사용해야 합니다.
같은 목적이지만 보다 단순한 분석하는 방법은 이미 소개한 바 있습니다. [데이터 분석 6] 수익률 분포를 정규 분포로 모델링하고 위험을 추정해 보자 (구글 시트 편)에서 SPY 1년 수익률을 정규 분포로 모델링하고, 정규 분포를 이용하여 투자 기간에 따른 위험의 변화를 살펴보았습니다. 이 글에서 소개하는 분석 방법도 기본적인 접근 방법은 동일합니다. 투자 기간에 따른 수익률을 정규 분포 모델로부터 추정하는 것이 아니라, 과거 데이터에서 도출한다는 점만 다릅니다.
주의: 이 글에서 지칭하는 기초자산과 커버드콜 지수은 각각 미국배당다우존스 지수와 미국배당다우존스 +7% 프리미엄 커버드콜 지수에 한정합니다. 다른 기초자산과 이에 기초로 하는 커버드콜 지수는 그 특성이 다소 다를 수 있습니다.
주의: 이 글은 특정 상품 또는 특정 전략에 대한 추천의 의도가 없습니다. 이 글에서 제시하는 수치는 과거에 그랬다는 기록이지, 앞으로도 그럴 거라는 예상이 아닙니다. 분석 대상, 기간, 방법에 따라 전혀 다른 결과가 나올 수 있습니다. 데이터 수집, 가공, 해석 단계에서 의도하지 않은 오류가 있을 수 있습니다. 일부 설명은 편의상 현재형으로 기술하지만, 데이터 분석에 대한 설명은 모두 과거형으로 이해해야 합니다.
투자 기간에 따른 평균 수익률과 위험 수익률 계산하기
INDIRECT() 함수를 이용하면 주어진 투자 기간에 대해 모든 가능했던 수익률을 구해 평균을 낼 수 있습니다. 다음 그림은 이를 위해 데이터를 정돈한 시트입니다.
상단에 첫 행의 행 번호인 8, 마지막 행의 행 번호인 2530이 기입되어 있습니다. 제 경우에는 행 번호를 직접 입력했지만, 함수를 이용하여 데이터에서 자동으로 찾게 만들 수도 있습니다.
중간에 보면 개월수, 거래일수, 년수가 있습니다. 데이터를 촘촘하게 생성하기 위해 개월을 기본으로 했고, 평균 수익률 계산을 위해 개월수를 월 21거래일로 가정해서 환산했습니다. 최종적으로 그래프에는 년단위로 표시하기 위해 년수로 다시 환산했습니다.
시트에서 핵심은 O10 셀입니다. 주어진 투자 기간으로 배열 연산으로 수익률을 계산하고 평균 수익률을 구합니다. ARRAYFORMULA() 함수를 이용하면, 두 배열 원소의 각각의 쌍으로 나누기를 할 수 있습니다. 위의 예에서 거래일수는 M10셀에 지정된 63거래일입니다. 그러니 N71 / N8, N72 / N9, N73 / N10, ... 이렇게 모든 63거래일 차이가 나는 셀의 조합에 대해 자산비를 구해 수익률로 환산해서 평균을 내면 됩니다. ARRAYFORMULA() 함수를 다음과 같이 사용하면 됩니다.
ARRAYFORMULA(AVERAGE(N71:N2530 / N8:2467)) - 1
63거래일 차이가 나는 두 배열을 나누어 자산비를 계산하고 평균을 낸 후, 1을 빼서 수익률로 환산한 것입니다. 고정된 셀 범위가 아닌 주어진 거래일수에 맞춰 셀 범위를 만들기 위해 INDIRECT() 함수를 사용할 수 있습니다. 분자가 되는 셀 범위와 분모가 되는 셀 범위는 각각 다음과 같이 됩니다.
분자: INDIRECT("H" & 8 + 63 & ":H2530")
분모: INDIRECT("H8:H" & 2530 - 63)
데이터 첫 행 번호와 마지막 행 번호, 그리고 계산하고자 하는 수익률의 거래일수를 각각 다른 셀로 지정했기에, 최종적으로 다음과 같은 수식이 됩니다.
ARRAYFORMULA(AVERAGE(INDIRECT("H" & $N$3 + $M10 & ":H" & $N$4) / INDIRECT("H" & $N$3 & ":H" & $N$4 - $M10))) - 1
첫 행과 마지막 행 번호를 지정한 두 셀 밑에 하위 위험 순위를 기입한 셀이 있습니다. 하위 몇 % 순위를 위험으로 간주할 것이지 지정한 것입니다. 여기서는 하위 5%를 지정했습니다. 101명의 투자자가 있다면 95등에 해당하는 운 나쁜 투자자라고 할 수 있습니다. 이보다 위험에 민감한 투자자라면 보다 작은 수치를, 위험에 조금 덜 민감한 투자자라면 조금 큰 수치를 사용하면 됩니다. 참고: 하위 1%, 하위 10% 같이 여러 단계로 위험을 정의하고 함께 그래프에 나타낼 수도 있습니다.
수익률 배열에서 특정 순위의 수익률은 PERCENTILE() 함수로 얻을 수 있습니다. 다음과 같은 수식을 이용합니다. AVERAGE() 함수 대신 PERCENTILE() 함수를 썼고, 두 번째 인자로 5%가 지정된 셀을 지정했습니다.
ARRAYFORMULA(PERCENTILE(..., N$5)) - 1
거래일수나 하위 순위를 바꾸면, 자동으로 재계산되어 표시됩니다. 그래프로 그려보면 다음과 같습니다.
투자 기간이 1년 정도였다면, 기초 자산과 커버드콜의 평균 수익률과 위험(하위 5% 순위) 수익률은 비슷했습니다. 각각 점선과 실선으로 표시되어 있습니다. 동일한 자산은 같은 색으로 나타냈습니다. 2년 정도 투자했다면, 그 차이가 눈에 보일 정도로 커졌습니다. 투자 기간이 길어질수록 기초 자산과 커버드콜의 평균 수익률과 위험 수익률 모두 점차 벌어집니다.
위험에 민감한 투자자는 하위 5% 순위 수익률을 주의 깊게 살펴볼 필요가 있습니다. 하위 5% 순위 수익률은 1년 정도 지나면 기초 자산이 커버드콜보다 확연히 더 높았습니다. 그 차이는 투자 기간이 길어질수록 점차 커졌습니다. 다르게 말하면, 커버드콜은 기초 자산보다 더 안전한 자산이 아니었을 가능성이 높다는 의미입니다.
1년 복리 평균 수익률로 나타내기
동일한 수익률 그래프를 연수익률로 환산해서 그려보면 다음과 같습니다. 왼쪽 그림과 같이 앞의 데이터 시트에서 투자기간(년)을 이용하여 CAGR을 구합니다. 설명의 편의를 위해 위험 순위는 하위 10%로 변경했습니다. 101명 중에 90등 순위 투자자의 수익률이라 할 수 있습니다.
오른쪽 그래프를 보면 대략 5년 정도 투자했다면, 기초 자산에 투자했던 투자자 중에서 하위 10% 순위의 투자자 수익률이 커버드콜에 투자했던 투자자의 평균 수익률과 비슷해졌습니다. 참고: 여기서는 평균 수익률을 사용했지만, 분석 목적에 따라서는 중앙값을 쓰는 것이 더 적절할 수 있습니다. 중앙값은 101명의 투자자 중에서 51등에 해당되는 투자자의 수익률입니다. PERCENTILE() 함수로 구할 수 있습니다.
정리하며
투자 기간에 따른 위험의 변화를 쉽게 인지하기 위해 과거 데이터를 이용하여 그래프로 나타내고 비교하는 방법을 살펴보았습니다.
이어지는 글: [데이터 분석 부록 A1] 인플레이션 추정과 반영 (구글 시트 편)
목록: 자산 배분 분석 방법과 사례 글 모음 [목록] (순서대로 차근차근 읽기를 권합니다)
출간 안내: 연재를 묶어 읽기 쉽게 보완하여 편집한 책이 종이책(교보문고)과 전자책(리디북스, 교보문고, Yes24, 알라딘)으로 출간되었습니다. 책 소개: 구글 시트로 시작하는 투자 포트폴리오 분석 (오렌지사과의 불친절한 워크북) 출간에 부쳐 (샘플북 포함)
참고 서적: <왜 위험한 주식에 투자하라는 걸까? - 장기 투자와 분산 투자에 대한 통계학적 시각> - 이 연재에서 소개하는 각종 분석 방법의 의미를 소개합니다.
에필로그
이번 편이 구글 시트를 이용하여 자산 및 자산 간의 관계 데이터를 분석하는 연재의 마지막 편입니다. 기본적인 분석 방법 위주로 소개했지만, 대부분의 개인 투자자에게 이 정도면 크게 모자란 수준은 아닐 거라 생각합니다. 연재에서 배운 지식을 응용하면, 본인에게 필요한 분석으로 확장하는 것도 충분히 가능하리라 봅니다.
개인적으로는 파이썬(Python)을 이용하는데, 연재글을 작성하면서 구글 시트로도 웬만한 분석은 그리 어렵지 않게 할 수 있다는 점에서 놀랐습니다. 구글 시트는 세부 설정에 다소 제약이 있기는 하지만, 협업 기능을 중심으로 무료로 제공되는 툴이라는 점을 고려하면, 가성비가 좋다고 느꼈습니다.
기본 기능이 좀 더 다양하고 고급 기능도 제공하는 마이크로소프트 엑셀은 놀라울 정도로 잘 사용하는 분들이 많습니다. 이 분들은 제가 소개한 연재 내용을 기반으로 본인의 입맛에 맞춰 더 편리하고 유용하게 활용할 수 있는 시트를 만들 수 있을 거라 생각합니다. 참고: 사용해 보지는 않았지만, 구글 시트는 앱스 스크립트(Apps Script)를 지원합니다. 마이크로소프트 엑셀의 VBA처럼 프로그래밍이 가능합니다. 또한 매크로 기능도 제공하기에 반복 작업을 손쉽게 처리할 수 있는 것으로 알고 있습니다.
이 연재를 조금 보완해서 책으로 준비하고 있습니다. 책으로 출간한다고 해서 여기서 내용이 더 상세해지지는 않을 것입니다. 스프레드시트를 다루는 구체적인 방법까지 소개할 필요는 없기 때문입니다. 아마 "구글 시트를 활용한 자산 데이터 분석 방법 (오렌지사과의 불친절한 워크북)" 정도의 제목을 붙이지 않을까 싶습니다.
이 연재는 제 책 <왜 위험한 주식에 투자하라는 걸까? - 장기 투자와 분산 투자에 대한 통계학적 시각>의 보완적 성격으로 시작되었습니다. 해당 책에서 소개한 주요 분석 방법을 투자자가 실제 활용해 볼 수 있도록 구성하였습니다. 그러니 각 분석 방법의 목적이 무엇이고, 분석 결과를 어떻게 해석할 수 있는지 이해한 상황에서 분석 방법을 활용하는 것이 더 효과적일 것입니다.
제 책이 아니더라도 자산 성과를 분석하는 방법을 그 의미와 함께 소개하는 좋은 책 한 권 정도는 정독하기를 권합니다. 아쉽게도 저는 투자 입문자의 눈높이에 맞춘 이 부류의 책을 찾지 못했기에 직접 집필한 것입니다.
가볍게 읽을 수 있는 소설책 보듯이 읽을 수 있는 내용은 아니라고 생각합니다. 사람마다 다르겠지만, 가볍게 접근해도 충분한 정보도 있고, 신중하게 다가가야 하는 지식도 있습니다. 개인적으로는 교과서에 밑줄을 그어가며 반복해서 읽고 시험에 대비하듯 공부하는 게 좋다고 봅니다.
투자는 모두에게 수십년에 걸쳐 계속 주어지는 시험입니다. 시험은 교과서 범위의 내용을 상당 부분 반영하여 출제됩니다. 그러니 먼저 교과서에 해당하는 좋은 책을 골라 정독하는 게 좋을 수 있습니다. 잘 모르는 부분은 여러 번 읽으면서 곰곰이 생각해 보고, 궁금한 점은 주변 사람과 논의하거나 카페에 질문을 올리는 게 좋다고 봅니다. 이 연재가 다룬 투자 성과 분석은 여러 시험 과목 중에 하나라고 볼 수도 있습니다.
사람은 본인이 할 수 있는 일의 결과물에 대해서는 냉정하게 판단할 수 있지만, 그렇지 못한 일의 결과물을 평가할 때에는 감정에 휘둘리거나 권위(?) 있어 보이는 남의 말에 좀 더 귀를 기울이게 됩니다. 경우에 따라서는 아예 그 일과 그 일의 결과물을 무시하기도 합니다.
투자도 마찬가지입니다. 주식에 장기 투자하라고 아무리 권해도 나는 안전한 예금만 하겠다고 고집하는 사람이 주변에 한둘은 있을 것입니다. 왜 그럴까요? 물론 예금에 집중하는 투자 전략이 잘못된 것은 아니며, 그분들 나름대로의 이유가 있을 것입니다.
하지만 냉정하게 말한다면, 그분들은 장기 투자에서 위험이 무엇이고, 주식과 같이 단기적으로 위험해 보이는 자산이 장기적으로는 예금보다 더 안전할 수 있는 이유를 모르기 때문입니다. 장기 투자와 분산 투자가 무엇인지 충분한 수준으로 이해하지 못한 상황이기에, 예금을 고집하는 것입니다.
조금은 과장된 홍보로 들릴 수 있겠지만, 이에 대해 제 나름대로의 생각과 방식으로 교과서적 설명을 시도한 결과물이 제 책입니다. 이 연재는 그 교과서에서 소개한 주요 내용에 대해 연습 문제를 제시하면서 그 풀이 과정을 해설한 것입니다. 그러니 가능하면 직접 해 보시길 권합니다. 직접 문제를 풀어보아야 그 원리와 과정, 그리고 결과물을 제대로 이해할 수 있습니다.
교과서를 공부하면서 원리를 이해하고, 연습 문제를 직접 풀어보면서 풀이 방법도 체득하면, 이제는 직접 할 수 있는 일이 됩니다. 그러면 동일한 부류의 다른 사람이 만든 작업 결과물에 대해 이전보다 조금 더 냉정하게 평가할 수 있게 됩니다. 경험이 풍부한 건축업계 종사자가 단독 주택을 한 번 죽 훑어보면, 대략 견적이 나오는 것과 비슷합니다. 그러니 적어도 장기 투자를 계획하면서 높은 비중으로 커버드콜에 투자하는 선택은 거의 하지 않을 것입니다.
지금까지 읽어 주신 독자분들에게 감사드리고, 이 연재가 투자에 조금이나마 도움이 되기를 바랍니다.
숙제
미래에셋자산운용이 2025년 1월 21일에 TIGER 미국배당다우존스타겟데일리커버드콜을 출시했습니다. 이 상품은 Dow Jones U.S. Dividend 100 10% Daily Premium Covered Call Index를 기초지수로 사용합니다. S&P Global 사이트에서 백테스트 데이터를 받을 수 있으니, 기초자산과 비교 분석해 보기 바랍니다. 저도 분석해 보지 않았습니다.
이제 모두 성인일 테니, 더 이상의 숙제 검사는 없을 것입니다. 이 숙제도 마찬가지입니다. 하지만 본인의 분석 결과를 다른 사람과 의논해 보면 생각지도 못한 의미를 파악하거나, 인식하지 못했던 오류를 보다 쉽게 찾을 수도 있습니다. 카페나 블로그에 올려 공유하고 다른 사람들의 의견을 들어보는 것도 좋을 수 있습니다.
투자 성과 분석은 직접 분석하고 글로 정리해서 다른 사람들과 의논하며 수정 보완하는 과정을 반복하지 않으면, 잘 늘지 않습니다. 수학을 교과서를 읽고, 연습 문제를 풀고, 잘 모르는 것은 친구들에게 물어보며 배워가는 것과 비슷합니다.
함께 읽으면 좋은 글:
- [데이터 분석 14] 두 자산의 수익률 분포를 비교해 보자 (구글 시트 편, feat. 미국배당다우존스 커버드콜)
- [데이터 분석 13] 두 자산의 상대 수익률 변화를 살펴보자 (구글 시트 편)
- [데이터 분석 12] 자산과 환율의 시간의 흐름에 따른 상관성 변화를 살펴보자 (구글 시트 편)
- [데이터 분석 11] 환율을 고려해서 환노출 주가를 계산하고 평균-분산 그래프에서 환헤지와 비교해 보자 (구글 시트 편)
- [데이터 분석 10] 특정 포트폴리오를 평균-분산 그래프에 표시해 보자 (구글 시트 편)
- S&P 500 국내 ETF는 무엇이 좋을까? (국내 상장 ETF 9종 비교와 분석)
- 한국인은 커버드콜 ETF에 장기 투자해도 좋을까? - 커버드콜 ETF에 대한 글 모음
- 나스닥 100 국내 ETF는 무엇이 좋을까? (국내 상장 ETF 5종 비교와 분석)
- 당신이 커버드콜에 장기 투자하면 안되는 이유 (매년 100만원씩 손해보지 않는 방법) 출간에 부쳐 (샘플북 포함)
- 외화 RP는 위험한가? (증권사가 RP를 운용하는 방법)
'주식투자' 카테고리의 다른 글
[데이터 분석 부록 A3] 인플레이션을 고려한 인출식 투자 성과 추정 (구글 시트 편) (0) | 2025.01.19 |
---|---|
[데이터 분석 부록 A2] 인플레이션을 고려한 적립식 투자 성과 추정 (구글 시트 편) (0) | 2025.01.19 |
TIGER 미국배당다우존스타겟데일리커버드콜 ETF를 직접 분석해 보세요 (0) | 2025.01.18 |
[데이터 분석 부록 A1] 인플레이션 추정과 반영 (구글 시트 편) (0) | 2025.01.12 |
[데이터 분석 14] 두 자산의 수익률 분포를 비교해 보자 (구글 시트 편, feat. 미국배당다우존스 커버드콜) (0) | 2025.01.11 |
[데이터 분석 13] 두 자산의 상대 수익률 변화를 살펴보자 (구글 시트 편, feat. 미국배당다우존스 커버드콜) (0) | 2025.01.11 |
[데이터 분석 12] 자산과 환율의 시간의 흐름에 따른 상관성 변화를 살펴보자 (구글 시트 편) (0) | 2025.01.11 |
[데이터 분석 11] 환율을 반영한 환노출 주가를 계산하고 평균-분산 그래프에서 환헤지와 비교해 보자 (구글 시트 편) (1) | 2025.01.09 |