주식투자

투자 성과 분석의 초급 - 1. (첫 편) 미국으로 출장간 전사적 차장 (왜 통계학을 알아야 하는가?)

오렌지사과키위 2024. 10. 30. 13:56

지난 15편의 글에 걸쳐 투자 성과 분석의 기초를 연재했습니다. 몰랐던 부분을 알게 된 분도 있을 테고, 알고 있는 내용을 확인한 분도 있을 것입니다. 이해하기 어렵다고 느끼신 분도 있을 것입니다. 이어지는 연재는 초급편입니다. 기초편에서는 확률과 통계에 대한 이야기를 가능한 생략 했습니다. 통계량 중에서 수익률의 산술 평균이나 기하 평균(CAGR)은 대개 익숙합니다. 단순한 확률의 나열도 이해하기 어렵지 않습니다. 하지만, 수익률의 분포를 표현하는 주요 통계량의 하나인 표준편차로 넘어가면 알듯 말듯 할 수 있습니다.

초급부터는 통계학(확률 포함)에 대한 지식이 어느 정도 필요합니다. 투자는 미래의 불확실성을 인정하고 대량의 데이터를 분석하는 행위이기 때문입니다. 통계학은 데이터를 요약하고 불확실성을 체계적으로 다루는 학문입니다.

클릭 한 번으로 원하는 데이터를 손쉽게 찾을 수 있기에 대량의 데이터를 다룬다고 느끼지 못할 수 있습니다. KOSPI의 800여 종목 중에서 지난 3년간 연속 흑자였고 영업 이익이 꾸준히 증가해 온 시총 상위 30 종목을 여러 수치가 적힌 표에서 손으로 골라낸다고 상상해 보면 됩니다.

과거는 이미 확정된 사실의 연속이니, 과거 데이터를 분석에는 통계학이 필요하지 않다고 생각할 수 있습니다. 몇 가지 관점에서 의미가 있다고 볼 수 있습니다.

첫 번째는 데이터가 많기 때문에 조금이라도 더 쉽게 이해하기 위해 요약할 필요가 있습니다. 평균은 대표적인 요약값(통계량)입니다. 주가 그래프를 보면 한눈에 파악할 수 있는 것처럼 생각되지만, 이는 착시일 수 있습니다. 만일 그게 가능하다면 두 자산의 가격 그래프만 보고도 우위를 판별할 수 있어야 합니다. 통계학은 특정 종목의 사업 보고서를 각종 재무제표 지표로 요약하여 보는 것과 비슷합니다. 

두 번째는 확정된 과거의 데이터를 우연의 산물이라 볼 수 있습니다. 동전을 던지면 앞면 또는 뒷면이 나옵니다. 5번을 던져 앞-앞-뒤-앞-뒤가 나올 수 있습니다. 어떤 결과가 나오더라도 우연입니다. 투자자가 알고 싶은 것은 과거에 앞-앞-뒤-앞-뒤가 나왔다는 사실이 아닙니다. 왜 그런 결과가 나왔는지 원리를 파악하고 싶은 것입니다. 이를 일부라도 엿보기 위해 통계학적으로 접근할 수 있습니다.

세 번째는 미래가 과거의 연장이기 때문입니다. 미래는 과거와 완전히 단절된 혼돈의 세계가 아닙니다. 인간이 계획을 세울 수 있는 이유는, 미래를 조금이나마 예측할 수 있기 때문입니다. 복잡하고 이해하기 어렵지만 어떤 숨어있는 원리가 있다고 보는 것입니다. 그 원리의 편린을 과거 데이터에서 끄집어내서 추상화할 수 있다면, 합리적인 계획을 수립하는데 도움이 될 수 있습니다.

남녀 신생아의 성비는 105 : 100으로 알려져 있습니다. 통계량입니다. 자연법칙에 가까운 원리는 통계학으로 추정하기 용이하지만, 투자의 세계는 그렇지 못합니다. 미처 고려하지 못한 다양한 요인이 있고, 예기치 못한 중대한 사건이 발생하며, 투자자의 행동이 서로 영향을 미치는 복잡계이기 때문입니다.

깊은 수준으로 통계학을 공부해야 하는 것은 아닙니다. 고등학교 수준이면 충분합니다. 참고: 저는 이과라서 확률과 통계를 배웠는데, 현행 고등학교 교육 과정에서는 일반 선택 과목으로 분류되어 있습니다. 통계라고 이야기하면 확률을 포함한 통계학이라는 의미로도 쓰이고, 평균과 같은 통계량을 의미하기도 합니다. 

통계학에 대한 입문서는 도서관이나 서점에서 만날 수 있습니다. 통계학적 사고와 관련한 책으로는 아래 책이 괜찮았습니다.

미국으로 고무신을 팔러 간 전사적 차장

지난 이야기에서 전사적 과장은 제일고무의 서울 시장 개척에 큰 공을 세웠습니다. 이후 제일고무의 고무신은 전국 각지에서 열풍을 일으켰습니다. 제일고무는 국내 고무 업계의 선두 주자가 되었습니다. 전사적 과장은 차장으로 특진했습니다. 지난 이야기: 투자 성과 분석의 기초 - 10. 데이터의 요약 (전사적 과장의 비밀 전보 - 고무신 몇 켤레를 생산해야 할까?)

제일고무는 해외로 눈을 돌리기 시작했습니다. 전사적 차장의 합리적인 판단력과 빠른 행동력을 눈여겨본 경영진은 전사적 차장을 미국 지사장으로 임명하고 미국 진출을 위해 출장을 보냈습니다. 양갱과 샘플 고무신으로 가방을 가득 채운 전사적 차장은 성공하겠다는 굳은 결심을 하고 미국으로 가는 배를 탔습니다.

부산에서 출발한 전사적 차장은 1달에 걸쳐 나성(羅城; 로스앤젤레스)에 도착했습니다. 로스앤젤레스에는 교민이 꽤 거주하고 있기에, 정보를 얻고 고무신을 홍보하기에 적절하다고 판단했기 때문입니다.

이번에도 양갱의 도움으로 시장 데이터를 가득 얻은 전사적 차장은 수집한 데이터를 요약하여 부산 본사에 알려야 합니다. 로스앤젤레스 중앙 우체국에 도착한 전사적 차장은 전보를 이용하여 3자리 숫자 3개를 보낼 수 있습니다. 몇 년간 기술의 발전으로 보낼 수 있는 숫자 개수가 늘어난 것입니다. 전사적 차장은 무엇을 보내면 될까요?

284 081 578

전사적 차장의 전보를 받은 본사 직원들이 회의실에 모였습니다.

  • 양판매 부장: 이번에는 숫자가 3개입니다. 왜 3개나 보낸 걸까요? 이전처럼 기존 판매량 대비 백분율 하나면 충분하지 않은가요?
  • 최계산 차장: 미국인은 한국인보다 몸집이 크지 않습니까? 발도 더 크다고 알고 있습니다. 그러니 하나는 평균 사이즈인 듯합니다.
  • 최배달 부장: 그럼 셋 중 둘은 판매 예측치와 사이즈겠군요.
  • 양판매 부장: 첫 번째 숫자 284가 평균 사이즈를 말하는 듯합니다. 나머지는 사이즈라고 보기에 숫자가 너무 작거나 큽니다.
  • 오인사 과장: 그럼 081과 578 중에 하나는 판매 예측치겠군요. 그냥 사이즈와 판매 예측치 두 개만 보내면 되지 않나요?
  • 최계산 차장: 부산과 서울 사람의 고무신 사이즈 분포는 동일했기에 판매량만 알면 되었지만, 이번에는 다르지 않습니까. 고무신 평균 사이즈만으로는 각 사이즈별로 얼마나 생산해야 하는지 알 수 없으니 추가로 정보를 보낸 듯합니다. 
  • 강수학 공장장: 제가 보기에 하나는 표준 편차인 듯합니다. 사람의 발 길이 분포는 정규 분포와 유사합니다. 평균이 284cm이고, 표준 편차가 10cm라면, [284cm - 10cm, 284cm + 10cm] = [274cm, 294cm] 구간에 68%가 들어갑니다.
  • 최배달 부장: 그렇다면 081이 그 표준 편차라는 8.1cm를 말하는 것이겠군요.
  • 강수학 공장장: 그렇게 보입니다. 1 시그마 구간인 [284cm - 8.1cm, 284cm + 8.1cm] = [275.9cm, 292.1cm]에 68%, 2 시그마 구간인 [284cm - 8.1cm × 2, 284cm + 8.1cm × 2] = [267.8cm, 300.2cm]에 95%가 포함됩니다. 아! 시그마가 표준 편차입니다.
  • 양판매 부장: 그럼 나머지 숫자 하나가 판매량일 테니 국내 판매량 대비 578% 정도 팔릴 거라 예상한 것이겠군요.
  • 나최고 사장: 이게 맞는 듯합니다. 국내 생산량의 6배 정도 더 생산해야 하니 당장 서두릅시다. 미국에도 고무신 수요가 넘쳐나는 듯합니다. 이러다가 제일고무가 제일그룹이 되는 게 아닌가 싶습니다! 하하하!

정보의 요약

정보(또는 데이터)를 효율적으로 전달하기 위해서는 상호 공유하는 지식과 이를 축약하는 단어가 필요합니다. 이 글을 짧은 시간 동안 이해할 수 있는 이유는 '정보'가 무엇인지, '요약'이 무엇인지 글을 쓰는 사람과 글을 읽는 사람 모두 알기 때문입니다. 갓 한글을 배운 아이가 이 글을 읽는다면 이해할 수 있을까요? 아이의 눈높이에 맞춰 길게 풀어서 설명해야 합니다.

전사적 차장이 살고 있는 세계는 평행 세계입니다. 익숙한 지역명이나 상품명이 나오더라도 그건 우연일 뿐입니다. 지금의 세계와 다른 점도 꽤 많이 있습니다.

또 다른 평행 세계의 맨홀 뚜껑은 삼각형입니다. 모두 삼각형이지만 표준화가 되어 있지 않아 조금씩 크기와 모양이 다릅니다. 맨홀 뚜껑 하나를 점검하러 나간 기술자가 수리가 불가하여 교체하기로 결정하였습니다. 회사에 전화를 겁니다. 무엇을 알려주면 교체할 맨홀 뚜껑과 정확하게 일치하는 대체품을 받을 수 있을까요?

맨홀 뚜껑이 삼각형이라는 것은 이 세계 사람이라면 모두 아는 상식입니다. 그러니 삼각형 세 변의 길이를 알려주면 정확하게 일치하는 제품을 받을 수 있습니다. 참고: 유일한 삼각형 결정 조건 중에 하나입니다.

맨홀 뚜껑이 이등변 삼각형이라고 하겠습니다. 이제 세 변의 길이가 아닌 두 변의 길이만 알려주어도 됩니다. 세 변 중에서 첫 번째와 두 번째 변의 길이가 같기 때문입니다. 숫자는 둘만 알려주지만, 숫자 셋을 모두 보낸 것과 동일합니다.

맨홀 뚜껑이 정삼각형이라고 하겠습니다. 이제 한 변의 길이만 알려주어도 됩니다. 나머지 두 변의 길이도 동일하기 때문입니다. 숫자 하나만 알려주지만, 숫자 셋을 모두 보낸 것과 동일합니다.

전사적 과장과 본사는 부산과 서울 소비자의 고무신 사이즈 분포가 동일하다는 것을 알고 있었습니다. 그러니 서울 소비자의 고무신 사이즈 분포를 알려줄 필요가 없었습니다. 예상 판매량만 보내면 충분했습니다. 사이즈 분포가 어떤 형태인지는 중요하지 않았습니다. 분포가 동일한지 여부가 중요했습니다.

전사적 차장은 국내와 로스앤젤레스 소비자의 고무신 사이즈 분포는 다르다는 것을 확인했습니다. 하지만, 사이즈 분포가 정규 분포 형태를 띤다는 것은 알고 있었습니다. 맨홀 뚜껑이 삼각형이라는 것을 알고 있기에 숫자 셋이면 충분했던 기술자와 회사처럼, 정규 분포를 규정하는 평균과 표준 편차 두 숫자만 알려줘도 전체 데이터를 전송하는 것과 유사한 효과를 낼 수 있습니다.

정리하며

투자 성과 분석을 위해 통계학적 지식이 왜 필요한지 소개하였습니다. 많은 데이터를 축약하여 이해하기 쉽도록 가공하고, 투자에 항상 따라다니는 불확실성을 체계적으로 다루기 위함입니다.

프롤로그

투자 성과 분석의 초급편은 기초편의 마지막 글인 "장기 투자에서 위험이 줄어드는 이유"의 연장입니다. 불확실성이 높은 자산이라도 장기 투자하면 상대적 불확실성은 낮아지는 큰 수의 법칙이 투자에서도 어느 정도 발견됩니다. 참고: 투자 성과 분석의 기초 - 15. (마지막 편) 장기 투자는 왜 위험이 줄어드는가? (불확실성이 누적될수록 확실해진다고?)

다르게 말하면, 장기 기대 수익률이 높으면서, 기대 불확실성은 낮은 포트폴리오를 구성하면 투자에 유리할 수 있다는 뜻이 됩니다.

과거 데이터에서 장기 기대 수익률을 얻는 것은 어렵지 않습니다. 미래에도 동일한 양상으로 자산 가격이 변동할 거라 가정하면, 과거 수익률을 사용하면 됩니다. 참고: 지수의 경우 이러한 접근이 어느 정도 유효하지만, 개별 종목은 그렇지 않을 가능성이 큽니다. 개별 종목은 과거의 가격 흐름보다 미래에 대한 합리적 예측이 훨씬 더 중요한 경우가 많기 때문입니다.

그렇다면 불확실성은 어떻게 정의할 수 있을까요? 금융 공학에서는 대개 불확실성의 척도로 수익률의 변동성을 계산한 표준 편차를 사용합니다. 여기에 수익률 분포를 연산이 편리한 정규 분포와 같은 형식화된 분포로 가정하면, 논리 전개가 쉬워집니다. 이론적 접근 방법입니다.

본 연재에서는 가능한 이론적 설명보다 현상을 먼저 관찰하려고 합니다. 특이한 현상이 발견되면, 투자에서 그 의미가 무엇인지 추측해 보고, 이를 통계학적으로 설명해 보는 방식을 취합니다.

기초편과 달리 초급편의 연재 속도는 빠르지 않을 듯합니다. 생각을 정리하고 쉽게 설명할 수 있는 예와 방안을 고안하는데 시간이 꽤 소요될 수 있기 때문입니다.

주된 주제는 자산 배분이 될 것입니다. 자산 배분의 핵심은 여러 자산을 혼합하여 합리적인 수준으로 기대 수익률을 높이면서(또는 낮추지 않으면서), 현실적인 수준으로 불확실성을 줄이는 것입니다. 관찰자(투자자) 입장에서는 큰 수의 법칙을 효과적으로 활용할 수 있는 방안을 찾아보는 것이고, 이론적으로는 현대 포트폴리오 이론과 연계됩니다.

기초편과 초급편 모두 투자 수익률을 높이는 신비로운 방법을 소개하는 것이 아닙니다. 그게 가능하다면 수십년 전부터 전문 투자 기관이 활용해 왔을 것입니다. 이 연재글은 개인 투자자를 위한 장기 투자 철학에 가깝습니다. 장기 투자에서 기회 손실과 위험을 조금이나마 낮추어서, 개인 투자자의 마음을 편하게 하여 본업에 집중할 수 있도록 돕는 것이 목적입니다.

이어지는 글: 투자 성과 분석의 초급 - 2. 어느 자산이 투자에 유리했을까? (KODEX 200과 SPY)

함께 읽으면 좋은 글:

도움이 되었다면, 이 글을 친구와 공유하는 건 어떻까요?

facebook twitter kakaoTalk naver band