전체메뉴

검색
팝업창 닫기
이메일보내기

스포츠 통계의 진상

내야수의 방어율에서부터 쿼터백의 기량까지 아마추어 통계학자들이 파헤친 프로 스포츠 통계의 진실과 허상

사람들은 흔히 ‘300 안타를 기록한 타자’(야구), ‘20점이나 기록한 득점왕’(농구), ‘터치다운 머신’(미식축구)이라는 식으로 운동선수를 기억한다. 또한 매일 아침 신문에 나오는 스포츠 통계 수치를 보고는 술집에서 좋아하는 운동선수의 활약을 칭찬하기도 한다.

하지만 그 통계 수치들이 모두 틀렸다면? 모든 인기 스포츠의 통계 수치는 갈수록 세밀해지고, 많은 정보를 담고 있다. 그 수치를 자세히 분석하면 구기 종목을 관람할 때 사람들이 미처 보지 못하는 진실을 볼 수 있다. 무릎이 삐걱거리는 나이 먹은 풀백이 알고 보니 그 팀의 비밀병기였다거나 한 게임에서 20점의 득점을 올리는 슈팅 가드가 바다 속으로는 볼을 던질 수 없다거나 하는 것 말이다.

ESPN의 농구 전문가 존 홀링거 같은 몇몇 사람들은 이 같은 통계 분석 작업을 통해 자신들의 입지를 더욱 높이고 있다. 하지만 남는 시간을 모조리 투자해 정량화하기 힘든 요소들을 정량화하는 컨설턴트, 경제학자, 대수교사 등의 통계 마니아들도 있다. 이들의 통계 방식을 활용하면 스포츠를 더욱 창의적이고 재미있게 즐길 수 있으며, 예상치 못했던 새로운 진실도 알아낼 수 있다.

football

쿼터백 기량 제대로 평가하려면 NFL 패서 레이팅 아닌 DVOA 분석해야

지난 1973년 미식축구 명예의 전당 홍보 직원이던 돈 스미스는 마술에서나 쓸 법한 기가 막힌 방법을 사용, 그저 그런 NFL 쿼터백들을 미식축구 역사에 길이 남을 명선수들로 탈바꿈시켰다.

그는 패스의 거리, 터치다운 성공 확률, 인터셉트 성공 확률, 포워드 패스를 받아내는 확률 등 4가지 범주의 수치를 가지고 쿼터백의 능력을 나타내는 NFL 패서 레이팅(PASSER RATING)을 만들고 여기에 맞춰 선수들의 실력을 판단한 것.

이 기준은 과연 타당한 것일까? 물론 그렇지 않다. 우선 평가 기준부터 살펴보자. 스미스의 패서 레이팅 시스템에서 가장 높은 점수는 158.3점, 가장 낮은 점수는 0점이다. 158.3점이라는 점수는 누구에게도 의미하는 바가 명확치 않다는 데서부터 몇 가지 문제가 있다. 만점이 제멋대로 정해진 것이라면 평균 점수는 과연 몇 점인가? 인정할 수 있는 점수는 과연 몇 점인가? 100점이나 80점 정도면 좋은 것일까? 패서 레이팅 설정에 쓰이는 공식 역시 큰 문제를 안고 있다. 이 공식은 뛰어난 쿼터백도 공을 그냥 쓸데없이 던져버리는 일이 많다는 점을 계산에 넣지 않았다.

물론 이 같은 행위는 패서 레이팅 결정에는 악영향을 미친다. 경기를 지연시키려고 공을 스파이킹하는 것도 이런 통계적인 시각에서 보면 바람직하지 못한 행위일 뿐이다.

또한 쿼터백을 평가하는 기준에 공 던지는 실력만 있고 달리는 능력은 전혀 고려돼 있지 않다. 간단히 말해 NFL 패서 레이팅은 엉망진창이고 너무나 부족한 점이 많다. 따라서 더 나은 방법을 찾아야 한다.

애런 샤츠 역시 같은 생각을 하고 있다. 풋볼 아웃사이더(footballoutsiders.com)라는 웹사이트의 편집인인 그는 ‘DVOA(Defence-adjusted Value Over Average)’라는 새로운 기준을 제시했다. DVOA는 다운, 거리, 경기장 위치, 득점 등 모든 상황을 감안해 리그 전체의 평균을 낸다. NFL 팀이 하는 모든 경기 실력은 이 평균치와 비교된다.

매 플레이마다 계산이 이루어지기 때문에 DVOA를 분석하면 특정 팀 사이의 대전 현황을 알 수 있고, 특정 쿼터백이 게임 상황에 따라 어떻게 대응하는지도 알 수 있다.
풋볼 아웃사이더는 DVOA를 사용해 각 공격 기술의 수준을 등급화하고, 팀 전체의 실력을 가늠하게 한다. 또한 NFL 공식 패서 레이팅과 실제 쿼터백의 기량 사이에 얼마나 차이가 있는지 통계적으로 더 정확하고 납득할 수 있게 보여준다. 뿐만 아니라 술집에서 미식축구를 논할 때 패서 레이팅 점수가 89.7인 쿼터백이 평균보다 10%나 앞서가는 점을 증명할 구체적 근거를 제시해 준다.

2007년 NFL 패서 레이팅
1위 톰 브래디 뉴잉글랜드 패트리어츠 117.2
2위 벤 뢰틸스버거 피츠버그 스틸러즈 104.1
3위 데이비드 게라드 잭슨빌 재규어스 102.2
4위 페이튼 매닝 인디애나폴리스 콜츠 98.0
9위 도노반 맥넵 필라델피아 이글스 89.9

2007년 DVOA 랭킹
1위 톰 브래디 뉴잉글랜드 패트리어츠 56.9
2위 페이튼 매닝 인디애나폴리스 콜츠 40.6
3위 데이비드 게라드 잭슨빌 재규어스 37.4
4위 브렛 파브 그린베이 팩커스 28.0
15위 도노반 맥넵 필라델피아 이글스 8.2

새로운 미식축구 통계 DVOA

DVOA는 단순히 얻은 야드 수를 따지는 것이 아니라 공격권을 얻은 퍼스트-다운 이후의 경기 상황에 따른 야드 수를 따진다. 미식축구에서는 총 4번의 다운을 통해 10야드를 전진해야 하는데, DVOA에서는 퍼스트-다운에서 남은 야드 수의 45%, 세컨드-다운은 60%, 그리고 서드와 포스-다운에서 100%를 얻어야 성공한 플레이로 본다.

(이 같은 시스템을 사용할 경우 같은 3야드를 가더라도 퍼스트-다운에서보다는 서드-다운에서 가는 것이 훨씬 높은 평가를 받게 된다.)
이 기준을 충족시키는 플레이는 최대 1점을 주며, 소수점 이하 점수는 멀리 못 갔지만 야드 수를 얻은 플레이에 준다.

빅 플레이에는 추가 포인트가 나오며, 팀에 도움이 되지 않는 플레이나 인터셉트, 펌블의 경우 포인트가 차감된다. 레드 존에서의 점수는 20%가 늘어난다. 터치다운 득점의 경우 보너스가 나온다. 필드 위치, 잔여 시간, 게임 스코어, 플레이를 저지하는 상대팀의 방어 성공률 등에 따라서 추가 조정되기도 한다.

간단한 공식은 아니지만 평가가 %로 나오기 때문에 해석하기는 쉽다. 뉴잉글랜드 패트리어츠 팀의 쿼터백 톰 브래디는 지난 시즌에 57%를 기록했다. 이는 그의 실력이 평균적인 쿼터백들보다 57%가 더 뛰어나다는 뜻이다. 평균적인 쿼터백의 좋은 예인 디트로이트 라이언즈 팀의 존 키트나는 0점에 가까운 -1.2%를 기록했다.

리그에서 최악의 쿼터백은 샌프란시스코 팀의 백업 포지션에 있는 트렌트 딜퍼로 그는 평균보다 52.2%나 낮은 성적을 기록했다. 포티나이너 팀의 스타터인 알렉스 스미스는 살짝 못 미치는 -49.4%를 기록해 꼴찌에서 두 번째가 됐다.

baseball

실제 뛰는 선수와 그냥 자리만 지키는 선수 구분할 수 있어

지난해 뉴욕 메츠 팀의 3루수 데이빗 라이트가 내셔널리그의 골드 글러브 상을 탔을 때 애틀랜타 브레이브스 팀의 3루수 치퍼 존스는 ‘애틀랜타저널 컨스티튜션’지를 통해 가장 실수를 적게 하고 최고의 방어율을 갖춘 선수들이 그 상을 받았어야 했다고 불평했다.

존스의 주장은 옳은 것이었다. 실수 21회와 방어율이 0.954인 라이트는 내셔널리그 3루수 중 꼴찌에서 5번째 성적밖에 되지 않는다.

하지만 존스가 인용한 이 통계가 현실을 정확히 대변한다고는 보기 힘들다. 야구에서 수비는 측정하기가 가장 어렵다. 방어율(풋 아웃과 어시스트 회수를 더한 후 전체 수비 회수로 나눈 것)은 선수가 자신에게 날아오는 공을 실수 없이 얼마나 잘 막는지 보여줄 수는 있지만 공에 가장 먼저 접근해 처리하는 선수의 능력을 평가할 수는 없다.

노스캐롤라이나에서 신약 개발에 종사하는 화학자인 크리스 다이얼은 이런 점을 염두에 두고 ‘수비 & 실점 억제 시스템(Defensive runs saved system)’을 창안했다. 이는 선수가 수비한 공뿐만 아니라 선수가 수비했어야 할 공 숫자까지 계산에 넣은 것으로 상대편 득점수의 관점에서 선수의 수비력을 평가한 것이다.

다이얼은 수비 & 실점 억제 시스템에 의거해 골드 글러브의 유권자들이 라이트에게 상을 주지 말았어야 했다는 결론을 내렸다. 하지만 그렇다고 해서 존스가 받았어야 했다는 것은 아니다. 내셔널리그 최고의 3루수는 샌프란시스코 자이언츠의 페드로 펠리츠다.

2007년 내셔널리그 골드 글러브 수상자
포수러셀 마틴 LA다저스
1루수데렉 리 시카고 컵스
2루수올랜도 헛슨 애리조나 다이아몬드 백스
3루수데이빗 라이트 뉴욕 메츠
유격수지미 롤린스 필라델피아 필리스
외야수앤드류 존스 애틀랜타 브레이브스
외야수제프 프랑코어 애틀랜타 브레이브스
외야수애론 로완드 필라델피아 필리스
외야수카를로스 벨트란 뉴욕 메츠

2007년 내셔널리그 수비 & 실점 억제 랭킹
포수 야디어 몰리나 세인트루이스 카디날스(10)
1루수 앨버트 푸홀스 세인트루이스 카디날스(12)
2루수 체이스 어틀리 필라델피아 필리스(21)
3루수 페드로 펠리츠 샌프란시스코 자이언츠(24)
유격수 오마 비즈켈 샌프란시스코 자이언츠(23)
외야수 맷 홀리데이 콜로라도 록키스(13)
외야수 카를로스 벨트란 뉴욕 메츠(11)
외야수 쉐인 빅토리노 필라델피아 필리스(10)
*( )은 막아낸 실점 숫자

수비 & 실점 억제 시스템

크리스 다이얼의 수비 & 실점 억제 시스템은 선수가 실제 처리한 공뿐 아니라 선수가 처리할 수 있었고, 처리했어야 하는 공까지 다 계산에 넣는 것으로 메이저리그 야구통계 기록 STATS의 영역 등급제에 기초한 것이다.



영역 등급제는 야구장의 다이아몬드를 수 백 개의 구역(각 구장마다 조금씩 크기 차이가 있어 그 수는 일정하지 않다)으로 나누어 배트로 친 공이 그 중 어느 구역으로 날아가는지 마킹한 것이다. 수비하는 선수들은 선수 위치 주변의 영역에 대해 수비 책임을 진다.

리그 전체 평균으로 볼 때 이 같은 책임 구역에서 최소 50%의 야구 플레이가 행해진다. 다이얼은 이 데이터를 모은 후 자료를 선수가 막거나 막지 못한 상대팀 타구 수로 전환시켰다.

이 때문에 이 데이터는 해석하기가 쉽다. 실제 계산을 통해 답을 얻어낼 수 있지만 그 전에 짚고 넘어가야 할 부분이 있다.

바로 리니어 웨이츠(Linear weights)에 따라 각 선수가 잡아야 하거나 잡지 못한 공의 중요도를 결정하는 것이다. 리니어 웨이츠는 통계 전문가 데일 스티븐슨과 피트 파머가 쓰는 척도로서 타구의 가치를 1루타, 2루타, 3루타, 홈런으로 계량화해 매기는 것이다. 타구라고 해서 가치가 다 같은 것이 아니라 가중치가 다르다는 것.

예를 들어 야구장 중견으로 날아가는 공은 0.84루타에 해당한다. 이 같은 가중치 덕택에 중견수가 도달하거나 그렇지 않은 공에 대한 수비의 가치를 상대적으로 평가할 수 있다.

basketball

가장 많은 연봉을 받는 선수와 가장 효율적인 선수는 같지 않아

지난 1995~1996년 NBA 시즌에서 보여준 우수한 경기 덕분에 주완 하워드는 워싱턴 불리츠 팀과 기간 7년, 금액 1억500만 달러 규모의 계약을 하게 됐다. 물론 그 팀도 하워드를 영입하기 전에 통계적 관점에서 생각했을 것이다. 하지만 그들은 한 번 더 생각해 봐야 했다.

하워드는 득점 평균으로 볼 때 리그에서 10위에 속하는 선수였다. 하지만 게임 시간 순위로는 4위, 필드 골 시도 순위는 3위였다. 이 같은 숫자로 미루어보건대 하워드는 대부분의 시간을 코트에서 제대로 활용하지 못한 것 같지만 불리츠 팀은 이 같은 부분을 신경 쓰지 않고 넘어가고 말았다.

서던 유타 대학 경제학과 조교수인 데이비드 베리는 팀의 효율성만큼 농구 경기의 승패를 좌우하는 요인은 없다고 말한다. 즉 공을 잡고 득점 포인트로 연결시킬 수 있는 공격 기회를 상대편보다 많이 만들어야 이길 수 있다는 것이다. 그가 창안한 ‘승리 창출 연관 점수’ 통계는 아주 중요한 하나의 숫자를 가지고 선수의 생산성을 평가하는 지표다.

놀랍게도 그는 리그에서 가장 많은 연봉을 받는 선수들이 가장 효율적인 선수는 아니라는 점을 발견했다. 즉 엄청난 득점을 올리고는 있지만 그렇다고 필요 불가결한 선수는 아니라는 것. 예를 들어 하워드의 경우 그의 긴 계약 기간을 계산에 넣는다면 승리 창출 연관 점수는 -151.9로 조정된다. 이는 NBA 파워 포워드의 평균에 크게 미달하는 것이다.

2007~08년 NBA 연봉 순위
1위 케빈 가넷 2,200만 달러
2위 샤킬 오닐 2,000만 달러
공동 3위 저메인 오닐 1,970만 달러
공동 3위 제이슨 키드 1,970만 달러
5위 코비 브라이언트 1,950만 달러

2007~08년 NBA 승리 창출 연관 점수 순위
1위 드와이트 하워드 543.3
2위 마커스 캠비 520.4
3위 크리스 폴 504.8
4위 아마레 스타더마이어 421.9
5위 제이슨 키드 403.2

승리 창출 연관 점수 통계

승리를 만들어 내는 요소를 알아내기 위해 복잡한 식을 만들어 내던 베리는 선수 개인에 관한 통계 수치에 주목했다. 즉 포인트, 리바운드, 스틸, 턴 오버, 슛 시도 등이 게임 결과에 모두 동일한 정도의 중요성을 미친다는 것을 알았다. 또한 개인 파울, 프리 드로우, 블록슛, 어시스트는 앞선 것들의 절반 정도의 중요성을 가지고 있다는 것도 알아냈다.

그런 만큼 선수의 승리 창출 연관 점수를 알아내려면 그가 얻은 득점에 리바운드 회수, 스틸 회수, 그리고 블록슛 회수의 절반을 더해야 한다. 그런 후 필드골 시도 회수와 턴 오버 회수를 제하고, 프리 드로우 회수의 절반과 개인 파울 회수의 절반을 제한다. 이렇게 나온 수를 선수가 한 시즌 동안 뛴 경기 수로 나눈 다음 48(한 게임의 소요분수)을 곱하면 된다.

이 공식에서는 선수의 포지션이 중요하다. 한 예만 봐도 센터는 포인트 가드와 역할이 완전히 다르다. 따라서 베리는 5개의 포지션을 공정하게 다루기 위해 조정을 가했다. 앞서 나온 방식대로 계산을 한 다음에 포지션 별로 일정한 수를 다시 제했다. 센터는 11, 파워 포워드는 10.4, 스몰 포워드는 7.4, 슈팅 가드는 6.2, 포인트 가드는 6.4를 빼는 것이다.

베리의 말에 따르면 계산을 마쳤을 때 양수가 나오면 선수의 공헌도가 평균 이상이라는 것이고, 음수이면 평균 이하임을 의미한다. 이는 선수의 경기 효율과 밀접하게 연관된 지수다.

hockey

샷에도 품질이 있고, 품질 낮은 샷을 많이 막아 유명해진 골키퍼도 있어

지난 시즌 아이스하키 플레이오프 개막전에서 산호세 샥스 팀은 총 39개의 샷을 날리며 23개의 샷에 그친 캘거리 플레임스 팀을 일방적으로 몰아붙였다. 하지만 결과는 3대2의 패배였다. 이는 일단 철벽수비를 펼친 플레임스의 골키퍼 미카 키프루소프의 공(功)으로 볼 수 있다. 하지만 그것이 다는 아니다.

NHL 통계로는 이해하기 어려운 일이지만 샥스는 그날 밤 이루어진 모든 샷이 동일한 결과를 이끌어 내지는 못했다는 것을 알았을 것이다. 아이스하키 관련 웹사이트(hockeyanaltics.com)를 운영하고 있는 보험회계사 앨런 라이더는 “골대에 퍽만 많이 날린다고 게임에 이길 수 있는 게 아니다”면서 “진정한 득점 기회를 잡고 저돌적으로 밀어붙여야 한다”고 말한다.

이를 수학적으로 입증하기 위해 라이더는 ‘샷 품질’이라고 불리는 통계를 냈다.
이 통계는 NHL에서 실시간 득점 시스템을 이용해 모은 샷 정보를 활용, 수비 팀이 사실상 막기 어려운 샷이 실제 골대에 들어가는 경향을 측정하는 것이다. 샷 품질의 지표와 샷이 골대에 들어가는 확률을 나타내는 통계를 조합해 보면 팀의 수비력, 특히 골키퍼의 수비력을 정확하게 평가할 수 있다.

이 관점에서 보면 플레임스는 플레이오프 개막전에서의 샷 품질이 샥스를 앞섰지만 전체 7경기를 통틀어 보면 단 2경기(이중 1경기는 패배)에서만 샷 품질의 우위를 나타냈다. 토털 전적도 4대 3으로 탈락의 고배를 마셔야했다.

2007~08년 방어율 순위
1위 댄 엘리스내시빌 프레데터 0.924
2위 타이 콩클린 피츠버그 펭귄스 0.923
3위 J-S 기거 애너하임 덕스 0.922
공동 11위 파스칼 르클레어 콜럼버스 블루자켓스 0.919
공동 24위 마티 터코 댈러스 스타즈 0.909

2007~08년 샷 품질 감안 방어율 순위
1위 J-S 기거애너하임 덕스 0.927
2위 댄 엘리스 내시빌 프레데터 0.924
3위 캐리 프라이스 몬트리올 캐나디언스 0.923
공동 9위 마티 터코 댈러스 스타즈 0.918
공동 22위 파스칼 르클레어 콜럼버스 블루자켓스 0.909

샷 품질을 기준으로 한 통계

샷 품질을 기준으로 한 통계는 수비 팀이 방어하기 어려운 샷 중에서 실제 골대에 들어가는 것이 얼마인지를 알아내기 위한 것이다.일반적으로 블루 라인(골에서 가장 가까운 거리가 19.2m)에서 쏜 샷 중 골에 들어가는 것은 5% 이하다.

하지만 골대 바로 앞의 선수 틈새를 비집고 날린 샷의 성공률은 20%가 넘는다.
이 같은 통계를 감안하면 일부 골키퍼들이 소문만큼 훌륭한 선수는 아니라는 점이 드러난다. 상당수의 샷은 상대적으로 막아내기가 어려운 것이 아니었기 때문이다.
라이더의 공식에서는 NHL의 샷 데이터를 이진법 계산을 사용해 회귀 분석함으로서 샷의 품질을 좌우하는 요인도 알아 낼 수 있다.

골대와의 거리는 물론 양 팀의 상황이 공평했는지, 강압적인 플레이가 벌어졌는지, 그리고 시간이 부족했는지 등이 그 것이다. 또한 샷의 종류도 주요한 요인으로 지목된다. 예를 들면 슬랩 샷이 백핸즈 샷보다 위협적이다.

라이더는 이 같은 모든 요인을 감안해 골인 확률을 알아낼 수 있었으며, 샷의 품질이 좋을수록 골인 확률도 높다는 것을 확인했다. 팀별로 모은 그의 샷 품질 지표는 샷 골인 확률 (각 샷의 골인 확률의 총합을 샷 횟수로 나눈 것)을 리그 평균 샷 골인 확률로 나눈 것이다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >
주소 : 서울특별시 종로구 율곡로 6 트윈트리타워 B동 14~16층 대표전화 : 02) 724-8600
상호 : 서울경제신문사업자번호 : 208-81-10310대표자 : 손동영등록번호 : 서울 가 00224등록일자 : 1988.05.13
인터넷신문 등록번호 : 서울 아04065 등록일자 : 2016.04.26발행일자 : 2016.04.01발행 ·편집인 : 손동영청소년보호책임자 : 신한수
서울경제의 모든 콘텐트는 저작권법의 보호를 받는 바, 무단 전재·복사·배포 등은 법적 제재를 받을 수 있습니다.
Copyright ⓒ Sedaily, All right reserved

서울경제를 팔로우하세요!

서울경제신문

텔레그램 뉴스채널

서울경제 1q60