숫자에 약한 사람들을 위한 통계학 수업 (데이비드 스피겔할터) - 현실에서 통계란 무엇인지 설명하는 책 (서평)

오렌지사과키위 2024. 8. 16. 15:42

통계학은 투자 특히 퀀트 투자에 있어 많은 도움이 되는 기초 학문입니다. 통계학은 불확실성에 대한 체계적인 접근 방법을 제시하기에, 투자 분야 이외에도 쓸모가 많습니다. 이 세상은 불확실성으로 가득 차 있기 때문입니다. 참고: 퀀트 투자에서 통계학은 기초 지식에 가깝습니다.

통계학은 어떤 정보의 진실성 또는 유용성을 판단하거나, 복수의 선택 가능한 결정 중에서 조금 더 합리적인 안을 고르는데 도움이 될 수 있습니다. 통계학은 기술적인 학문이면서 실용적인 사고 철학이라 볼 수도 있습니다. 

투자에 있어서 확률적 사고는 중요합니다. 미래는 불확실하지만 확률적 예측이 가능할 수 있습니다. 발견된 어떤 현상(또는 데이터)은 숨겨진 모델로부터 노이즈(noise; 소음)가 낀 우연의 발현으로 생각할 수 있습니다.

투자에서 어떤 전략이 다른 전략에 대해 가지는 우위는 절대적이지 않고 확률적으로 묘사할 수 있으며, 결과에 영향을 미치는 여러 요인은 불확실성과 함께 중요도가 다르면서 서로 관련이 있을 수 있습니다.

현실에서 유용함이 많은 학문임에도 선뜻 통계학 책에 손이 가지 않는 이유는 아마도 다음 두 가지 중 하나 또는 둘 다 일 것입니다.

수식에 익숙하지 않은 사람이라면 책을 넘길수록 무엇을 설명하고 있는지 점점 더 이해하기 어려워질 수 있습니다. 마치 고등학교 수준의 미분/적분에 관한 수식이 가득한 책을 하루에 한두 시간씩 일주일간 모두 읽었다고, 내용을 충분히 이해할 수 있다고 볼 수 없는 것과 마찬가지입니다.

또 다른 이유는 내용은 대충 이해가 가는데, 어디에 어떻게 쓸 수 있는 것인지 도통 알 수 없기 때문일 수 있습니다. 요즘은 수학 시험 문제도 단순히 주어진 수식을 푸는 것이 아니라, 현실 문제에 가깝게 설명이 주어지는 경우가 있습니다.

수학을 싫어하는 Statistics Girl

투자자가 통계학을 처음 배우면서 초점을 맞추어야 하는 것은 문제를 푸는 구체적인 기술적 방법이 아닙니다. 왜 통계학적으로 사고를 해야 하고, 특정 유형의 문제를 풀기 위해 (또는 의문에 답하기 위해) 사용할 수 있는 통계학적 기술은 무엇이 있으며, 어떤 의미를 가지는지 아는 것이 중요합니다.

계산은 컴퓨터로 처리할 수 있습니다. 문제를 인식하고, 문제를 정의하고, 문제를 해결하기 위한 방법론을 선정하고, 문제를 풀기 위한 데이터를 수집하고, 컴퓨터가 계산해 준 결과를 해석하는 것이 사람이 해야 하는 일입니다. 투자자는 고3 수험생이 아닙니다.

이런 관점에서 집필된 서적이 통계학 대중 소개서입니다. 아쉽게도 시중에 출간된 통계학 대중 소개서는 통계학을 쉽게 이해할 수 있게 기술되어 있기는 하지만, 깊이나 범위가 얕은 경우가 많습니다.

데이비드 스피겔할터의 <숫자에 약한 사람들을 위한 통계학 수업>은 조금 특이한 통계학 대중 소개서입니다. 통계학 세부 분야 대부분을 구체적인 사례와 함께 상당히 깊은 수준으로 소개하고 있습니다. 이 책의 수준이 깊다는 의미는 기술적으로 고도화되었거나 복잡한 방법론을 소개하기 때문이 아니라, 기술 외적인 부분을 포함하여 통계의 의미를 깊게 설명하기 때문입니다.

이 책의 원제는 <The Art of Statistics: Learning from Data>입니다. 제목에 '숫자에 약한'이라는 단어도, '통계학 수업'이라는 단어도 없습니다. 번역서의 제목은 원제와 꽤 떨어져 있지만, 수식이 거의 등장하지 않는 통계학 수업용 책에 가깝기는 합니다.

이 책은 미분/적분을 우주선의 항로 결정에 어떻게 사용할 수 있는지 사례를 들면서 개념을 소개하는 책에 가깝습니다. 수식이 거의 등장하지 않을 뿐이지 제목처럼 숫자 또는 수식이 거의 없다고 쉽게 읽을 수 있는 책은 아닙니다.

수식이 거의 없기에, 배운 통계 지식을 활용하기 위해서는 수식이 많이 포함된 통계학 책이나, 엑셀이나 파이썬과 같은 툴을 이용하여 통계 처리를 하는 방법을 설명하는 책을 참고해야 할 수 있습니다.

책의 번역은 조금 아쉽습니다. 직역체에 가까워서 즉각 이해가 되지 않거나, 한두 번 다시 읽어야 하는 문장이 꽤 있습니다. 참고: 번역의 목적은 원서의 내용을 다른 언어를 쓰는 독자에게 정확하고 효과적으로 전달하는 것입니다. 직역체를 고집할 필요가 없습니다. 투자 분야에서는 이건 번역가가 자연스러운 번역으로 유명한 분입니다.

통계의 여러 세부 분야가 소개되어 있는데, 그중에서 베이즈 통계에 좀 더 관심이 있다면, 코지마 히로유키의 <세상에서 가장 쉬운 베이즈 통계학 입문>이 이해하기 쉽고 재미있습니다.

함께 읽으면 좋은 글:

도움이 되었다면, 이 글을 친구와 공유하는 건 어떻까요?

facebook twitter kakaoTalk naver band