주식투자

[중급 부록 A2] 이 자산은 무엇과 비슷했을까? (피어슨 상관 계수를 이용한 닮은 ETF 찾기)

오렌지사과키위 2025. 7. 11. 23:23

지난 글에서 피어슨 상관 계수(Pearson Correlation Coefficient; PCC)를 기하학적으로 해석해 보았습니다. 피어슨 상관 계수는 두 확률 변수의 선형 상관성을 측정하는 방식의 하나입니다. 피어슨 상관 계수가 1이라면, 2차원 그래프에서 모든 두 변수 값의 쌍(pair)이 기울기가 양수인 직선 위에 위치함을 의미합니다. 상관 계수가 -1이라면 기울기가 음인 직선 위에 모든 쌍이 표시됩니다. 지난 글: [중급 부록 A1] 피어슨 상관 계수의 기하학적 해석 (표준화한 두 자산 간의 선형 상관성)

피어슨 상관 계수로 두 자산 수익률 간의 상관성을 측정하면 1과 -1 사이의 값이 나옵니다. 두 자산의 상관 계수가 1에 충분히 가깝다면 두 자산의 수익률은 선형적으로 동일한 경향을 띠었다고 유추할 수 있습니다. 이 말은 두 자산의 누적 수익률 그래프가 일치한다는 뜻은 아닙니다.

한 자산이 다른 자산의 양의 x배로 움직여도 상관 계수는 1이 됩니다. 이 경우 두 자산의 수익률이 완벽히 양의 비례 관계에 있었던 경우입니다. 또는 한 자산이 다른 자산보다 항상 b% 더 높은 수익률을 얻어도, 상관 계수는 1이 됩니다.

상관 계수를 이용하면 두 자산의 수익률 경향이 얼마나 비슷했는지 측정할 수 있습니다. 이를 이용하면, A라는 자산의 수익률 경향이 B, C, D, E라는 4가지 자산 중에서 무엇과 가장 가까웠는지 판별할 수 있습니다.

이 글에서는 상관 계수를 이용하여 몇몇 ETF가 과거 어떤 ETF와 비슷한 수익률 경향을 보였는지 살펴봅니다.

주의: 이 글은 특정 상품 또는 특정 전략에 대한 추천의 의도가 없습니다. 이 글에서 제시하는 수치는 과거에 그랬다는 기록이지, 앞으로도 그럴 거라는 예상이 아닙니다. 분석 대상, 기간, 방법에 따라 전혀 다른 결과가 나올 수 있습니다. 데이터 수집, 가공, 해석 단계에서 의도하지 않은 오류가 있을 수 있습니다. 일부 설명은 편의상 현재형으로 기술하지만, 데이터 분석에 대한 설명은 모두 과거형으로 이해해야 합니다.

비교 대상 ETF

2025년 7월 11일 기준으로 마켓워치(MarketWatch)에서 소개한 규모가 가장 큰 25개 ETF로 살펴봅니다.

VOO SPY IVV VTI QQQ
VUG VEA IEFA VTV BND
AGG IWF GLD VXUS IEMG
IJH VGT VIG VWO VO
XLK IJR IBIT RSP SPLG
SCHD IWM NVDA TSLA  
TLT IEF SHY BIL  

표에서 왼쪽 위에 있는 VOO는 2025년 7월 11일 기준으로 규모가 가장 큰 ETF입니다. 그 오른쪽에 있는 SPY는 두 번째 규모입니다. 제 기억으로 얼마 전까지는 SPY가 1위였는데 VOO의 수수료가 낮기 때문인지 추가 유입으로 순위가 역전된 듯합니다.

한국인이 좋아하는 QQQ가 5위에 있습니다. BND(10위)와 AGG(11위) 같은 종합 채권 ETF도 있고, GLD(13위)와 같은 금 현물 ETF도 있습니다. 14위에 있는 VXUS는 미국외 주식 ETF입니다. 23위에 있는 IBIT는 비트코인 ETF입니다. 최근에 25위 이내로 진입했습니다. IBIT는 상장된 지 얼마 되지 않았기에 분석에서 제외했습니다.

그 아래에는 25위 안에 포함되어 있지 않지만, 비교 분석을 위해 추가한 ETF입니다. 고배당 ETF의 하나인 SCHD는 25위 이내에 포함된 적이 있었지만, 최근 부진으로 밀려난 듯합니다. IWM은 러셀(Russel) 2000 지수를 추종하는 소형주 ETF입니다. 유사한 ETF로 22위에 소형주 ETF인 IJR이 있습니다.

이어지는 글에서 커버드콜의 기초자산을 추정하기 위해 엔비디아(NVDA)와 테슬라(TSLA)를 포함하였고, TLT, IEF, SHY, BIL과 같이 듀레이션(duration)이 다른 미국 국채 ETF도 포함하였습니다.

이 글에서는 비슷한 ETF를 찾는 범위에 규모가 큰 ETF만 넣었지만, 금리나 환율과 같은 종목이나 ETF가 아닌 다른 데이터도 함께 분석할 수 있습니다. 이에 대해서는 이후 글에서 살펴볼 계획입니다.

주의: 배당 재투자를 가정한 TR(Total Return) 가격을 이용하여 분석합니다. 경우에 따라서는 배당이 일부 누락되거나 오류가 있어 다소 부정확할 수 있습니다. 하지만 상대적인 비교용으로 큰 문제가 있는 수준은 아닙니다. 

VOO는 무엇과 비슷했을까?

가장 간단한 것부터 해 보겠습니다. S&P 500 지수를 추종하는 VOO를 살펴봅니다.

VOO와 상관성이 가장 높았던 또는 가장 낮았던 ETF
VOO와 상관성이 가장 높았던 또는 가장 낮았던 ETF

위의 막대그래프는 1개월(21거래일) 로그 수익률(log return)로 VOO와 상관 계수를 측정한 결과입니다. 중첩(rolling) 방식으로 21거래일 로그 수익률을 구했습니다. 상관 계수가 가장 높았던 상위 10개 ETF와 가장 낮았던 하위 5개 ETF를 다른 색으로 표시했습니다. 그중에서 상관 계수가 0.95 이상으로 매우 높았던 ETF는 초록색 막대로 나타냈습니다.

VOO와 상관성이 높았던 ETF로는 SPY, IVV, SPLG, VTI, VIG, VO, IWF가 있습니다. SPY, IVV, SPLG는 모두 VOO와 동일하게 S&P 500 지수를 추종하기에 거의 1이라고 할 수 있는 높은 상관성을 보였습니다.

VTI는 미국 내 거의 모든 주식에 투자하는 ETF입니다. S&P 500과 큰 차이가 없었다고 볼 수 있습니다. VIG는 배당 성장주 ETF입니다. VO는 중형주 ETF입니다. 12.7년간 중형주는 대형주와 유사한 흐름을 보였다고 이해할 수 있습니다. IWF는 러셀 1000 성장주 ETF인데, 의외로 S&P 500 지수와 수익률 경향이 유사했던 것으로 보입니다.

VOO와의 상관성이 가장 낮았던 하위 5개 ETF는 오렌지색 막대로 표시하고 있습니다. S&P 500을 추종하는 VOO는 4개의 국채 ETF와 금 현물 ETF인 GLD와 0에 가까운 낮은 상관성을 보였습니다. 포트폴리오의 안정성을 높이고자 한다면, 이들 ETF를 편입하는 것을 고려해 볼 수 있습니다. 참고: 상관 계수가 분산 투자 효과의 강도를 설명하지는 않습니다.

VOO와 0.95 이상의 상관 계수를 가졌던 7개 ETF의 누적 수익 그래프를 그려보면 다음과 같습니다.

VOO와 상관성이 가장 높았던 7개 ETF의 누적 수익률
VOO와 상관성이 가장 높았던 7개 ETF의 누적 수익률

대략 세 그룹이 있습니다. 가운데 그룹이 VOO를 포함하여 S&P 500 지수를 추종하는 ETF입니다. 상단에 있는 회색 선은 IWF로 이 기간 동안 성장주가 주도했음을 알 수 있습니다. 누적 수익률은 꽤 차이가 나지만, 누적 수익률 형태는 비슷했습니다. 말하자면 S&P 500이 오르면 IWF도 오르고, S&P 500이 내리면 IWF도 내리는 경향이 뚜렷했다는 뜻입니다.

하단 2개의 ETF는 각각 VIG와 VO입니다. VIG는 배당 성장주 ETF로 S&P 500 대비 약간 낮은 수익률에 조금 낮은 변동성을 가진 ETF입니다. VO는 중형주 ETF입니다.

QQQ는 무엇과 비슷했을까?

나스닥 100 지수를 추종하는 QQQ로도 살펴봅니다.

QQQ와 상관성이 가장 높았던 또는 가장 낮았던 ETF
QQQ와 상관성이 가장 높았던 또는 가장 낮았던 ETF

상관성이 가장 높았던 VUG는 대형 성장주 ETF이며, IWF는 러셀 1000 성장주 ETF입니다. 간단하게 생각하면 IWF의 종목 편입 범위가 VUG보다 조금 더 넓다고 할 수 있습니다.

VGT는 정보 기술주 ETF이며, XLK는 기술주 ETF입니다. QQQ의 섹터와 어느 정도 일치했기에 비슷한 수익률 경향을 보였다고 볼 수 있습니다.

SPY와 마찬가지로 미국 국채 ETF 및 금 현물 ETF와 낮은 상관성을 보였습니다. 거의 0에 가까운 상관성이었습니다.

이들 4개 ETF를 QQQ와 함께 누적 수익률을 그려보면 다음과 같습니다.

QQQ와 상관성이 가장 높았던 4개 ETF의 누적 수익률
QQQ와 상관성이 가장 높았던 4개 ETF의 누적 수익률

특정 섹터에 투자한다고 할 수 있는 VGT와 XLK는 QQQ와 누적 수익률이 비슷했습니다. 이에 비해 VUG와 IWF는 성장주 ETF이지만, 기술주 이외의 종목도 편입되어 있기 때문인지 누적 수익률은 QQQ보다 조금 낮았습니다. 하지만 전반적인 수익률 경향 자체는 VGT나 XLK보다 QQQ와 더 비슷했다고 볼 수 있습니다.

SCHD는 무엇과 비슷했을까?

배당 성장률을 중요하게 고려하는 고배당주 ETF인 SCHD를 다른 ETF와 비교해 봅니다. SCHD는 배당률이 높은 ETF이며, 수집한 데이터에는 배당이 꽤 많이 누락되어 있기에 누적 수익률이 다소 부정확합니다. 참고로만 살펴보기 바랍니다.

SCHD와 상관성이 가장 높았던 또는 가장 낮았던 ETF
SCHD와 상관성이 가장 높았던 또는 가장 낮았던 ETF

SCHD와 가장 상관성이 높았던 ETF는 VTV였습니다. VTV는 미국 대형 가치주 ETF입니다. SCHD는 가치주 성격을 가지고 있었다고 볼 수 있습니다. 다른 주식형 ETF와 마찬가지로 미국 국채 ETF 및 금 현물 ETF와 0에 가까운 상관성을 보였습니다.

다음은 SCHD와 상관성이 가장 높았던 4개 ETF 누적 수익률 그래프입니다.

SCHD와 가장 상관성이 높았던 4개 ETF의 누적 수익률
SCHD와 가장 상관성이 높았던 4개 ETF의 누적 수익률

중간중간 조금씩 수익률이 달랐지만, 전반적인 경향을 비슷해 보입니다.

BND는 무엇과 비슷했을까?

종합 채권 ETF인 BND도 살펴봅니다.

BND와 상관성이 가장 높았던 또는 가장 낮았던 ETF
BND와 상관성이 가장 높았던 또는 가장 낮았던 ETF

가장 상관성이 높았던 AGG 역시 종합 채권 ETF입니다. 거의 1에 가까운 상관성을 보였습니다. 그 외에는 IEF, TLT, SHY 순으로 국채 ETF들과 상관성이 유사했습니다.

의외로 1 ~ 3개월 만기의 단기 채권인 BIL과는 0에 가까운 낮은 상관성을 보였습니다. 테슬라, 엔비디아와 같은 기술주와 비슷한 수준의 상관성이었습니다. 마찬가지로 상관성이 낮았던 IJR과 IWM은 소형주 ETF입니다. 12.7년이라는 분석 기간이라 신뢰성 있는 설명을 하기는 어렵겠지만, 소형주와 채권은 어떤 관계가 있지 않았을까 추정해 볼 수 있습니다. 이를 보다 면밀하게 살펴보기 위해서는 추가 분석이 필요합니다.

다음은 BND와 상관성이 높았던 4개 ETF의 누적 수익률 흐름입니다.

BND와 상관성이 가장 높았던 4개 ETF의 누적 수익률
BND와 상관성이 가장 높았던 4개 ETF의 누적 수익률

AGG는 BND와 거의 동일했습니다. IEF는 조금 차이가 났지만 전반적인 경향이 흡사했습니다. TLT는 BND 수익률을 증폭한 듯한 경향을 보였고, 반대로 SHY는 BND를 축소한 듯한 변동성을 보였습니다.

이런 사실로 미루어 보아 BND는 대략 IEF와 비슷한 약 7년 정도의 평균 듀레이션을 가진 채권 ETF였다고 볼 수 있습니다. 뱅가드사의 BND 소개 페이지에서 확인해 보면 평균 듀레이션이 5.8년으로 IEF보다 조금 더 길다고 설명되어 있습니다.

정리하며

선형 상관성을 계산하는 피어슨 상관 계수를 이용하여 규모가 큰 ETF 중에서 비슷한 ETF를 찾아보았습니다. 재미있다고 느낀 분도 있을 테고, 이를 어디에 사용할 수 있는지 궁금한 분도 있을 것입니다. 이어지는 글에서 상관 계수를 이용하여 커버드콜 ETF의 기초자산을 추정해 봅니다.

이어지는 글: [중급 부록 A3] 이 커버드콜 ETF의 기초자산은 무엇일까? (피어슨 상관 계수를 이용한 닮은 ETF 찾기 2)

참고 도서:

목차: [연재글 목차] 투자 성과 분석 (기초편, 초급편, 중급편): 순서대로 차근차근 읽으면 좀 더 이해가 쉽습니다.

도움이 되었다면, 이 글을 친구와 공유하는 건 어떻까요?

facebook twitter kakaoTalk naver band