주식투자

투자 성과 분석의 기초 - 10. 데이터의 요약 (전사적 과장의 비밀 전보 - 고무신 몇 켤레를 생산해야 할까?)

오렌지사과키위 2024. 10. 20. 14:12

옛날이야기를 하나 하겠습니다. 아주 오래된 옛날은 아닙니다. 지금은 세계적인 규모의 기업 집단인 제일그룹의 모태는 제일제화입니다. 제일제화의 설립 당시 사명은 제일고무였습니다. 제일고무는 고무를 이용한 각종 상품을 만들었는데, 특히 고무신의 인기가 대단했습니다. 당시에서 짚신을 주로 신었는데, 발이 편하고 질기면서 방수도 되는 고무신은 비싼 가격에도 남녀노소 모두에게 선풍적인 인기를 끌었습니다. 제일고무의 고무신이 성공하지 못했더라면, 지금의 제일그룹도 없었을 것입니다.

부산에서 사업을 시작한 제일고무는 사세 확장을 위해 소비자가 많은 서울에 진출하기로 결정하였습니다. 당시에는 교통이 워낙 불편했기에 소가 끄는 우마차를 이용했습니다. 시장 조사를 위해 전사적 과장이 샘플을 가지고 서울로 출장을 갔습니다.

전사적 과장이 소달구지를 타고 서울까지 도착하는데 보름이 걸렸습니다. 사람들이 많이 모이는 장소에 들러 양갱을 선물로 나누어주며 며칠에 걸쳐 시장 조사를 했습니다. 발크기를 재어주고, 가져온 샘플 고무신을 체험시켜 주었습니다. 홍보를 하면서 의견도 듣는 것입니다. 만족도를 물어보고 몇 켤레나 구매할 의향이 있는지도 조사해서 정리하였습니다. 예나 지금이나 양갱의 효과는 대단합니다.

시장 조사 결과를 부산 본사에 알려야 생산을 시작할 수 있습니다. 당시 고무는 귀한 자원이었기에, 마구잡이로 미리 생산해 놓을 수는 없었습니다.

우마차를 타고 부산으로 되돌아간다면 다시 보름이 걸립니다. 시장 조사 결과를 즉시 보낼 수 있다면, 보름을 절약할 수 있습니다. 더욱이 고무신을 생산하여 서울로 가져오기 전까지 전사적 과장은 서울에서 판매점 계약을 진행할 수 있습니다. 보름 이상의 기간을 단축하는 효과가 납니다.

전사적 과장이 서울 중앙 우체국에 들렀습니다. 체험에 참가한 한 우체국 직원이 전보라는 정보를 즉시 전달할 수 있는 신기술이 되었다고 알려주었기 때문입니다.

서울 중앙 우체국에서 전신기로 전보를 보내면, 부산 중앙 우체국이 수신하고, 종이에 적어 제일고무 본사까지 배달해 준다고 합니다. 제일고무 본사는 부산 중앙 우체국에서 그리 멀지 않기에 전보를 보내면 1시간 내에 도착할 수 있습니다.

그런데 전보를 보내는 요금이 너무 비쌉니다. 글자수도 제한이 있습니다. 세 자리 숫자 하나만 보낼 수 있습니다. 전사적 과장은 어떤 숫자를 보내면 좋을까요?

주의: 이 글은 특정 상품 또는 특정 전략에 대한 추천의 의도가 없습니다. 이 글에서 제시하는 수치는 과거에 그랬다는 기록이지, 앞으로도 그럴 거라는 예상이 아닙니다. 분석 대상, 기간, 방법에 따라 전혀 다른 결과가 나올 수 있습니다. 데이터 수집, 가공, 해석 단계에서 의도하지 않은 오류가 있을 수 있습니다. 일부 설명은 편의상 현재형으로 기술하지만, 데이터 분석에 대한 설명은 모두 과거형으로 이해해야 합니다.

전사적 과장의 비밀 전보

제일고무 본사는 전사적 과장이 보낸 전보를 받았습니다. 창사 이래 처음 받아보는 전보입니다. 전보에는 아래와 같은 숫자가 적혀 있습니다.

273

제일고무 본사 회의실에 사람들이 모였습니다. 전사적 과장이 보낸 암호를 해독해야 합니다. 만일 실패하면 미래의 제일그룹은 역사에서 사라질 수도 있습니다.

  • 양판매 부장: 고무신 사이즈가 아닐까요? 평균 발 크기가 273cm라는 뜻으로 보입니다.
  • 최계산 차장: 270cm과 275cm가 가장 잘 팔리긴 하지만, 업계 종사자면 다 아는 이야기인데, 굳이 비싼 전보로 보낼 내용은 아닌 듯합니다.
  • 최배달 부장: 적정 가격 아닐까요? 부산에서는 한 켤레에 200원 정도에 팔리는데, 서울에서는 273원까지 받을 수 있다는 뜻이 아닐까요? 제가 아는 똑똑한 전사적 과장이라면 어느 정도 가격까지 구매할 의향이 있는지도 조사했을 것입니다.
  • 양판매 부장: 그런 조사도 했을 겁니다. 하지만, 판매 가격이야 서울에 물건을 풀면서 결정해도 늦지 않습니다. 당장은 고무신을 생산해야 하니, 생산과 관련한 정보를 알려주는 숫자일 듯합니다.
  • 오인사 과장: 혹시 부산의 고무신 수요를 100이라 두면 서울은 273이라는 뜻이 아닐까요? 서울 인구가 부산 인구의 2배 정도인데, 구매력이 조금 더 높으니 더 잘 팔릴 거라 본 것 아닐까요? 아직까지는 고무신이 저렴하지는 않으니까요.
  • 최계산 차장: 오 그럴듯한데요. 근데 사이즈 별로 얼마나 생산해야 하는지는 모르잖아요.
  • 강수학 공장장: 아. 그건 문제없습니다. 사람의 발 크기는 어디서나 비율이 비슷합니다. 275cm가 19.5% 정도, 270cm와 280cm가 각각 17.5% 정도, 265cm와 280cm는 각각 12% 정도입니다. 여기 부산에서 팔린 신발 치수별 숫자와 비율이 있습니다.
  • 최배달 부장: 사람들 발 크기 비율이 비슷하다면, 굳이 이런 정보를 보낼 필요가 없지 않을까요? 비율대로 생산해서 서울로 계속 보내면 되지 않겠습니까?
  • 양판매 부장: 그건 원재료인 고무 수급 때문일 겁니다. 외국에서 고무를 수입하려면 3개월이 걸립니다. 한국에 이미 수입되어 지금 당장 구할 수 있는 고무의 양은 정해져 있습니다. 회사의 고무 재고량을 살펴보고 모자란 만큼 다른 회사에서 사 와야 합니다. 이후에 필요한 고무는 지금이라도 미리 수입 절차를 진행해야 합니다.
  • 나최고 사장: 이게 맞는 듯합니다. 부산에서 팔린 신발의 치수별 비율을 고려해서 2.73배씩 더 생산할 수 있도록 고무를 구하고 생산도 시작합시다. 전사적 과장이 전보로 급히 보낸 걸 보니, 시간을 줄이기 위해 판매점 계약을 진행하고 있는 듯합니다. 빨리 만들어서 서울로 진출합시다.

전사적 과장이 숫자 하나로 정보를 요약할 수 있었던 이유는 무엇일까요?

데이터의 수집

전사적 과장은 고무신 구매 의향이 있는 소비자 100명을 조사했습니다. 조사 결과를 정리하여 고무신 사이즈별 빈도를 아래와 같이 얻을 수 있었습니다.

사이즈 빈도
245 1
250 3
255 8
260 9
265 17
270 22
275 14
280 11
285 10
290 3
295 1

전사적 과장은 추가의 시장 조사를 통해 서울은 부산에 비해 2.73배 정도 고무신이 팔릴 것이라는 예상 하였습니다. 이 모든 데이터를 본사에 전송하면, 본사에서 생산 계획을 잡을 수 있을 것입니다. 본사에서 전사적 과장이 보내 준 데이터를 보고 245cm는 1%, 250cm는 2% 이런 식으로 생산 물량을 정하는 것은 합리적인 결정일까요?

신기하게도 합리적인 결정이 아닙니다. 전사적 과장이 다시 100명을 조사하면 앞선 조사와 동일하거나 유사한 데이터가 나올까요? 아래는 전사적 과장이 3번에 걸쳐 100명씩 추가로 조사한 결과입니다.

사이즈 조사 결과 1 조사 결과 2 조사 결과 3
235   1  
240      
245 1 1 1
250 2 1 8
255 7 5 6
260 15 13 11
265 20 21 16
270 23 17 14
275 13 20 17
280 5 10 14
285 5 7 7
290 3 3 5
295 1 1  
300      
305     1

조사 결과 1은 안정적으로 보입니다. 조사 결과 2는 235cm의 발 사이즈가 작은 샘플이 하나 포함되어 있습니다. 265cm가 가장 많고(최빈값), 275cm가 270cm보다 많습니다. 조사 결과 3은 305cm의 왕발이 한 명 포함되어 있습니다. 전보에 대해 알려준 그 우체국 직원입니다. 아마 선조 중에 왕이 있는 듯합니다. 275cm가 가장 많고, 265cm가 270cm보다 많습니다.

조사 결과 1, 2, 3 중에 무엇을 보내느냐에 따라 부산 본사의 생산 계획은 달라집니다. 조사 결과 3을 보낸다고 하겠습니다. 305cm 고무신은 1% 비율로 생산하고, 295cm와 300cm는 생산하지 않을 것입니다. 270cm보다 265cm와 275cm를 더 많이 생산할 것입니다. 합리적인 생산 계획일까요?

발크기가 305cm인 사람보다 300cm인 사람이 많고, 300cm인 사람보다 295cm인 사람이 많을 거라 보는 것이 적절합니다. 지역에 따라 발크기의 차이가 크다고 보는 것은 합리적이지 않습니다. 참고: 남녀노소 그리고 지역 간의 거리가 충분히 멀면 여러 요인(예를 들어 인종)에 의해 의미 있는 수준의 발크기 차이가 발생할 수 있습니다. 여기서는 설명의 편의를 위해 한국인에게 유일한 대표 체형이 있다고 가정합니다.

데이터의 요약

전사적 과장은 난감합니다. 조사를 할 때마다 다른 결과가 나오기 때문입니다. 이는 조사한 샘플의 수가 적기 때문입니다. 그런데 샘플의 수가 매우 큰 조사가 이미 하나 있습니다. 부산에서 날개 돋친 듯이 팔린 10만개의 고무신입니다.

아래는 부산에서 팔린 고무신의 사이즈별 판매량을 히스토그램으로 표시한 것입니다.

가장 많이 팔린 사이즈는 270cm였고, 265cm와 275cm는 비슷하게 팔렸습니다. 서울 조사에서 발견되지 않은 230cm와 310cm도 간혹 팔렸습니다.

서울에서 팔릴 고무신 사이즈의 분포도 부산과 비슷할 거라 가정할 수 있습니다. 전사적 과장은 서울의 예상 판매량만 부산 본사에 보내도, 본사에서 사이즈별로 적정 수량을 생산할 수 있을 거라 생각한 것입니다. 전보로 보낼 수 있는 숫자는 3자리이니, 서울의 예상 판매량이 아닌 부산의 판매량 대비 백분율을 보낸 것입니다.

전사적 과장은 최종적으로 500명의 발 크기를 조사하였습니다. 만일 한국인의 발 크기 분포가 지역에 관계없이 동일하다면, 굳이 조사할 필요가 있었을까요?

아래는 부산에서 팔린 고무신의 사이즈별 분포와 서울에서 조사한 고무신 구매 의향이 있는 소비자의 발 크기 분포입니다. 서울에서는 500명을 조사했기에  부산과 동일하게 10만명으로 맞추기 위해 200배로 증폭하였습니다. 참고: 정규 분포를 가정하여 임의 생성하였기에, 앞의 데이터와 다를 수 있습니다.

부산과 서울의 발 크기 분포는 큰 차이가 나 보이지 않습니다. 전사적 과장이 서울에서 500명의 발 크기를 조사한 이유는 서울 소비자와 부산 소비자의 발크기 분포가 정말 유사한지 확인하기 위해서입니다. 참고: 소비자의 발 크기와 고무신 사이즈는 동일하다고 가정합니다.

통계학적 용어로 설명하면 서울 소비자와 부산 소비자의 발크기 분포가 같을 거라는 가설을 세우고, 그 가설이 맞는지 검증해 본 것입니다. 만일 차이가 충분히 커서 가설이 틀리다면, 전사적 과장은 데이터를 요약하기 위해 다른 방법을 사용해야 했을 것입니다.

정리하며

고무신 시장 조사를 위해 서울로 출장을 간 제일고무의 전사적 과장은 양갱을 이용하여 세밀하게 시장 조사를 했습니다. 서울 소비자의 발크기에 분포 부산 소비자와 유사하다는 사실을 확인했고, 얼마나 많은 고무신이 팔릴 수 있을지도 예측했습니다.

전사적 과장은 조사한 결과를 단 세 자리 숫자로 요약하여 부산 본사에 재빨리 보냄으로써 제일고무의 미래에 큰 기여를 하였습니다. 다음 인사 시즌에 특진을 하지 않을까 싶습니다.

전사적 과장이 정보를 요약할 수 있었던 이유는 무엇일까요? 전사적 과장과 본사가 공통된 정보를 공유하고 있었기 때문입니다. 부산에서 판매된 고무신의 사이즈 분포를 알고 있었고, 한국인의 발크기 분포는 어느 지역이나 비슷할 거라고 추측했기 때문입니다.

만일 부산에서 판매된 고무신의 집계 데이터가 없었거나, 한국인의 발크기 분포가 지역에 무관하다는 가정이 성립하지 않았다면 어떻게 되었을까요? 전사적 과장은 자세한 보고를 위해 부산으로 되돌아갈 수밖에 없었을 것입니다.

투자 성과의 기초 데이터는 무엇일까요? 특정 시간 간격으로 자산의 수익률을 기록한 그래프입니다. 20년간 5,000일을 거래했다면, 일별 종가만 따져도 5,000개의 데이터가 생깁니다.

5,000개 데이터 두 쌍은 어떻게 하면 효율적으로 비교할 수 있을까요? 어떤 가정을 두면 5,000개의 데이터를 비교에 용이하도록 단 몇 개의 숫자로 요약할 수 있을까요?

이어지는 글: 투자 성과 분석의 기초 - 11. 비교를 위해 투자 전략과 투자 목표를 구체화해야 하는 이유는 무엇일까?

함께 읽으면 좋은 글:

도움이 되었다면, 이 글을 친구와 공유하는 건 어떻까요?

facebook twitter kakaoTalk naver band