A팀 : 점유율 52%, 전체 슈팅 횟수 18회, 코너킥 7회
B팀 : 점유율 48%, 전체 슈팅 횟수 14회, 코너킥 5회
우리는 TV중계로 축구를 보면서 이러한 부류의 통계량을 쉽게 마주한다. 과연 이 숫자들이 어떠한 의미를 전달하고 있을까? 당신은 이 기록을 바탕으로 어떤 팀이 이겼는지 말할 수 있는가?
이 경기는 2014년 브라질 월드컵 준결승전 기록이다. A팀은 브라질이고 B팀은 독일이다. 독일은 7-1이라는 아주 역사적인 스코어를 남기며 결승전 진출에 성공했다. 하지만 바로 위에서 나열했던 데이터만 살펴보면 굉장히 치열한 접전이 펼쳐졌을 것처럼 보인다.
간단히 이야기하자면 이렇다. 피치 위에서 발생하는 사건을 잘 반영하지 못한다면 그 통계량은 사기나 다름없다.
지난 10년 가까이 TV 프로그램은 어떠한 세밀한 분석없이 시청자들에게 그저 셈한 숫자, 날것 그대로의 데이터를 양적으로만 제공했다. 전술에 대한 논의, 통계에 대한 논의들이 시작되면서 틈새시장을 공략한 방송, 웹사이트들이 있지만 여전히 데이터는 지금보다 더 가공처리 되어야하고 평가받을 수 있어야한다. 현재 축구를 분석하는 컨텐츠는 온라인 세계에서 이루어지고 있다. 따라서 축구소비에서 주류가 아닌 Spielverlagerung.com이나 Statsbomb.com과 같은 웹사이트는 경기 이후 가볍게 축구를 TV로만 시청하는 사람들에게 존재가 유의미하지 못하다.
키커(Kicker), 스포츠빌트(SportBild), 슈폭스(Spox)처럼 규모가 큰 웹사이트는 이적 루머, 사진, 인터뷰로 가득 차있다. 애널리틱스와 관련된 글은 길고 내용도 어렵다. 간단히 "포그바가 인스타그램에서 FC 바르셀로나 글에 좋아요를 눌렀다. 이적이 임박한 것일까?" 같은 기사보다 접속량 자체가 적다.
2015년 스테판 라이나르츠(2016년 바이어 레버쿠젠에서 은퇴)와 옌스 헤겔러(Jens Hegeler, 당시 헤르타 베를린 소속)는 이러한 문제들을 인지하게 되었다.
수비형 미드필더인 두 사람은 커리어 내내 자신들의 실제 기여도를 제대로 반영하지 못하는 도구와 방법론을 활용해 그들의 퍼포먼스를 평가하는 감독과 미디어에 대한 짜증이 났다. NFL에선 리처드 쉐먼같은 코너백 포지션 선수들은 상대의 공격끊기, 인터셉트, 태클만으로도 스타가 될 수 있다. NBA에선 브루스 보웬, 데니스 로드맨같은 선수들은 스틸, 블록, 리바운드로 자신의 가치를 증명해낼 수 있다. 하지만 축구는 오로지 골과 어시스트 뿐이다.
발락처럼 골을 넣는 능력이 뛰어나거나, 피를로처럼 프리킥을 전담하지 않는 이상 수비형 미드필더는 언제까지나 언성-히어로가 될 수 밖에 없다. 수비형 미드필더는 상당히 중요한 역할을 수행하지만 그들의 역할은 스탯 범주에 드러나지 않는다. 이 장면에서도 마찬가지다. 비달은 유벤투스의 포그바로부터 공을 뺏어냈고 측면에 위치한 코망에게 공을 연결했다. 비달은 득점 장면을 만드는 과정에서 핵심적인 역할을 수행했을 뿐만 아니라 유벤투스의 역습 가능성을 차단했다. 하지만 이 장면에서 의미있는 통계를 획득한 선수는 오직 어시스트를 올린 코망과 골을 넣은 뮬러 뿐이다.
평상시 우리가 보던 통계는 왜 안좋은가?
우리가 평상시 마주하는 통계들 그 자체는 나쁘지 않다. 그것들도 역시 정보를 포함하고 있다. 하지만 그것은 양적(quantity)이지 질적(quality)이지 못하다. 다른 것들과 동떨어진 점유율 그 자체는 아무 의미가 없다.
티아고 알칸타라의 멋진 스루볼은 눈 깜짝할 사이에 발생하는 사건이지만, 그 패스는 바이언의 점유율에는 부정적인 영향을 미친다. 설령 그것이 레반도프스키의 골로 연결되어도 말이다.
"전체 슈팅 횟수(Total Shots)" 도 크게 의미하는 바가 없다. 가까운 거리에서 시도한 리오넬 메시의 슈팅이나 35미터 떨어진 지점에서 하이코 베스터만이 절박하게 시도한 중거리 슈팅 모두 똑같이 슈팅 1회다.
"코너킥 횟수"의 가치는 팀마다 다르다. 티키-타카를 활용하는 스페인이나 바르셀로나는 코너킥 상황에서도 직접 박스로 공을 올리지 않는 반면, 피지컬적인 축구를 구사하는 리버풀이나 잉글랜드는 세트-피스에 크게 의존하는 경향이 있다.
"패스 성공률"은 모든 패스마다 리스크/보상 시나리오를 평가하지 않는한 결점을 보일 수 밖에 없다. 2015/2016시즌 분데스리가에서 소크라티스는 88%의 패스 성공률을 기록했고 마츠 후멜스는 85%의 패스 성공률을 기록했다. 하지만 정말로 후멜스가 소크라티스보다 패스 능력이 떨어지는가? 그건 아니다.
득점 기대값(ExpG), 전체 슈팅 비율(Total Shot Rate) 같은 발전된 메트릭이 존재하지만, 이러한 통계량은 일반적인 시청자들에게 굉장히 어려운 내용이다.
그리고 ExpG 역시 상당한 결점을 가진 통계량이다. ExpG는 피치 위 특정 지역에서 슈팅이 들어갈 특정한 확률이 있다고 가정한다. 글쎄... 직접 축구를 해본 사람들이라면 날씨, 피치 상태, 신체 컨디션, 축구화 종류에 따라서도 슈팅이 상당히 달라질 수 있다는걸 알고 있을 것이다. 축구에서 완벽하게 동등한 상황이란 없다.
3,000만명 이상의 독일인이 디 만샤프트(Die Mannschaft, 독일 국가대표팀) 경기를 본다는 것을 잊지 말자. 할머니와 애기들도 보는게 국가대표팀 경기인만큼 이해하기 쉬운 메트릭을 써야한다. 대다수 미국 국민들은 NFL의 Sack, 농구의 리바운드에 대해서 알고 있다. 하지만 ExpG를 알고 있는 독일 국민이 얼마나 될까?
새로운 메트릭은 무엇을 하는가?
Impect 메트릭은 모든 선수들의 플레이를 "퀄리티"에 기반하여 평가해야 한다는 점에서 시작한다. 공이 상대 수비를 지나쳐야만 (Gegner überspielt) 골을 넣을 수 있다. 상대 수비수를 제치는 것은 플레이의 퀄리티를 높여준다. 더 많은 수비수를 제친다면, 플레이 퀄리티는 더 높아진다. 이것은 전혀 의심할 여지가 없다.
"상대 수비수를 제친다는 것" 이것은 엄청난 약진이다. 개인의 주관적인 판단을 완벽하게 제외하면서 플레이의 퀄리티를 측정할 수 있다. 상대 수비수를 제쳤는가? 제치지 못했는가? 둘 중 하나다.
수비하는 팀은 분명히 제쳐지지 않으려고 한다. 따라서 상대에게 제쳐진 경우가 적은 것(Überspielt werden)은 그만큼 수비를 잘한다는 의미가 된다.
즉 특정 플레이가 이루어지기 전후 상황에서의 수비수 숫자를 따지는 것이다. 패스 뿐만 아니라 드리블 시도, 턴오버, 인터셉트 같은 경우에도 다 적용될 수 있다. 앞서 언급한 비달의 예시에서는, 비달은 바이언이 역습에 취약한 상황에서 공을 다시 뺏어냈고 그가 이 상황에서 기록한 가로채기는 바이언 동료 6명이 뒤에 있었을 때 기록하는 가로채기보다 더 높은 가치를 지닌다.
결국 "제친 상대팀 선수 숫자 총 합" 이 패킹-비율(Packing-Rate)라 불리게 된다.
추가로 Impect는 공격하는 입장에서 수비수를 제치는 것이 수비수가 프레싱을 걸어오는 공격수를 제치는 것보다 가치있는 사건이라 측정한다. 회사 이름 그대로 후방에 위치한 수비수가 제쳐진 횟수를 "IMPECT"라 부르며 이 역시 집계된다.
왜 새로운 메트릭이 더 좋은가?
브라질과 독일의 맞대결을 다시 생각해보자. 하지만 이번에는 라이나르츠와 헤겔러의 시스템이 말하는 기록으로 경기를 바라보자.
독일은 브라질보다 상대팀 선수를 61회 더 제쳤다. 독일이 약 15% 앞섰지만 이것만으로 7-1 스코어를 설명할 수는 없다. 그런데 IMPECT 횟수는 보다 직관적이다. 독일은 브라질보다 상대 후방 수비수를 훨씬 더 많이 제쳤다.
영상의 1분 23초에서 멈춰보자. 2명의 브라질 센터백이 크로스와 뮬러 사이에 서있다. 단테와 다비드 루이즈 특유의 머리 스타일로 쉽게 두 센터백의 위치를 파악할 수 있다. 패스가 상대팀 센터백보다 뒷쪽으로 연결이 되면, 자연스럽게 매 순간 위협적인 찬스가 만들어진다.
이전의 메트릭이 적용된다면, 뮐러는 여기서 "패스 1회 성공" 이라는 결과를 받아들이게 된다. 크로스의 멋진 패스도 역시 마찬가지로 "패스 1회 성공"으로 기록될 것이다. 뮬러와 크로스는 통계적으로 많은 사랑을 받지 못하겠지만 클로제는 모든 것을 다 가져간다.
이전의 메트릭은 잘 통하지 않는다. 그 대신에 IMPECT가 특정 플레이의 진정한 가치를 이야기해준다.
IMPECT 메트릭은 클로제가 골대와 상당히 가까운 거리에서 슈팅을 시도했다는 것을 고려하지 않는다. 이 플레이는 크로스와 뮬러가 거의 다 만들어낸 것이며 클로제는 그저 골대 안으로 공을 넣었을 뿐이다.
IMPECT 관점에서 바라보면, 클로제는 뮬러의 패스를 받은 것으로 +1점을 버는 것에 그친다. 그게 전부다. 분데스리가에서 뛰는 선수라면 누구나 거기서 골을 넣을 수 있다. 하지만 이 상황에서 토니 크로스가 뮬러에게 연결시킨 패스는 오직 극소수의 월드 클래스만 해낼 수 있는 패스다. 그게 가장 큰 차이다.
크로스는 뮬러에게 공을 연결시킴으로써 수비수 4명을 제쳤다. +4점. 뮬러 역시 그 공을 받음으로써 독일이 수비수 4명을 제치는데 공헌했다. 뮬러도 +4점. 뮬러는 공을 클로제에게 연결하면서 마르셀루를 무력화시켰고 추가로 +1점을 벌었다. 브라질 관점에서는 -5점이 된 것이다.
이 과정에서 MVP는 뮬러다. 그는 아주 작은 공간 속에서도 온사이드 상태를 유지하면서 크로스의 패스 길을 만들어냈다. 또한 본인이 연결받은 공을 클로제에게 연결함으로써 총 +5점의 효과를 만들어냈다. 마침내 우리는 누가 진정한 찬사를 받아야 하는지 알 수 있게 되었다.
다른 예시 : 후멜스에서 로이스로
패킹 관점에서 후멜스와 로이스는 각 +6점을 획득한다. 후멜스의 패스와 로이스의 침투는 동등한 가치를 지닌다. 이는 미식 축구에서 쿼터백과 와이드 리시버가 같은 플레이 상황에서 스탯을 생산하는 것과 똑같다. (야드, 캐치 / 패스 성공) 후멜스의 패스도 끝내줬지만, 로이스가 침투하는 방향이나 타이밍 역시 그 못지않게 완벽했다. 만약 후멜스가 패스를 잘못 줬거나 로이스가 침투의 타이밍과 방향을 잘못 잡았다면 이 플레이의 가치는 죽었을 것이다.
이전의 메트릭에서 상대 수비수를 제치지 못하는 패스도 동료에게 연결만 된다면 패스 성공으로 간주되었지만, 패킹은 그러한 패스들을 집계하지 않는다. 즉, 패킹에서 상대 수비수를 제치지 못하는 패스나 백패스는 무시되는 것이다. 전진하지 않는 패스는 득점에 도움이 되지 않는다. 이것은 올바른 평가이다. 이에 대해 반박할 수 없을 것이다. 또 그러한 의미없는 패스들을 제외함으로써 샘플의 사이즈가 줄어들고, 데이터 분석과 처리를 더욱 빠르게 시행할 수 있다.
메시의 위대함은 숫자로도 나타난다.
이 놀라운 득점 장면은 패킹 비율로 따졌을 때 +4점을 줄 수 있다. 이 드리블이 위대한 이유는 메시가 슈팅을 시도하는 순간에도 여전히 3명의 수비수가 남아있었다는 점이다. 패스로도 +4점의 패킹 비율을 얻는 것은 굉장히 어려운 일이다. 그런데 메시는 오로지 자신의 발로 +4점을 획득했고 아주 가차없는 골까지 넣었다.
메시의 이러한 경이적인 스킬에도 불구하고 2015/2016시즌 IMPECT MVP는 메시가 아닌 토니 크로스였다.
크로스는 경기당 85명(!!)의 수비수를 제쳣다. 수비형 미드필더의 평균치는 28명이다. 크로스가 뛰어난 패스 능력을 갖췄다는 것을 알기위해 정교한 메트릭이 필요한 것은 아니겠지만, 크로스가 독일 국가대표팀과 레알 마드리드에서 어느 정도의 가치를 지니는 선수인지 알려주는 지표라 할 수 있다.
이러한 기록이 누구에게 베팅해야 하는지도 알려주는가?
여전히 우리는 결과를 예측할 수 없다. 상대팀 수비수를 제치는 횟수가 많은 팀이 지지않을 확률이 86%라는 것만 알 뿐이다. 하지만 IMPECT는 더 좋은 플레이를 펼친 팀이 "이겨야만 했거나 최소한 지지는 말았어야 했다" 라는걸 구분하게 해준다. 이것은 다양한 부분에서 많은 이야기를 전해준다.
패킹 비율 싸움에서 이겼음에도 경기에서 패배한 14%에 속하는 팀들은 그 때서야 불운이나 선수 개인의 실수에 대해서 지적할 수 있다. 감독들은 자신의 팀이 불운했다는 것을 통계 자료를 통해 증명해냄으로써 자신의 자리를 보전할 수도 있다. 훗날 크로스와 쟈카같은 선수들이 스트라이커 못지않은 큰 돈을 벌 수도 있다.
선수 평가에 있어 혁명이 이루어져 단장들은 막대한 이적료가 지출되는 무대에서 더 좋은 의사결정 도구를 가질 수 있다. 빠른발과 압도적인 피지컬은 부상 및 선수가 나이를 먹어감에 따라 사라질 수 있지만, 가치있는 패스를 시도하는 능력은 그것보다는 느린 속도로 하락한다. 챠비와 피를로에게 물어보라. 두 선수는 35세가 넘는 나이에도 챔피언스 리그 결승전을 제대로 소화해냈다. 그렇게 패스 길을 볼 줄 아는 선수들은 나이의 영향을 잘 피해간다.
이제 구단은 한 선수가 상대팀보다 단순히 빠르거나 신체적으로 강한 것 뿐인지 아니면 가치있는 패스를 시도할 수 있는 선수인지 구별해낼 수 있다.
메트릭의 다음 단계는?
라이나르츠와 헤겔러가 만들어낸 이 통계는 축구 애널리틱스 관점에서 그야말로 비약적인 발전이므로 자연스럽게 수요가 상당하다.
독일 국가대표팀, 바이어 레버쿠젠, 보루시아 도르트문트, RB 라이프치히는 이미 패킹 기술의 라이센스를 획득했다. 구매 고객들을 고려한다면, IMPECT가 분명히 무언가 가치있는 정보라는 것을 알 수 있다. 로저 슈미트, 요하임 뢰브, 토마스 투헬, 랄프 랑닉까지 이들 모두 오늘날 축구계에서 스마트하고 가장 혁신적인 인물이다. 만약 이들이 공통적으로 무언가를 좋아한다면, 그것은 정말 확실하다는 것이다.
유로2016에서 독일의 ARD 방송에서는 패킹 비율을 사용할 것이다. 과거 바이언에서 활약했던 스타이자 현재 ARD에서 활약하고 있는 메멧 숄(Mehmet Scholl)은 패킹 데이터를 실시간으로도 처리할 수 있다고 말한다. 그 무엇보다 중요한 것은 패킹이 이해하기 쉽다는 것이다. 가볍게 축구를 즐기는 사람에게도 결코 무겁게 느껴지지 않을 정보라는 것이다.
IMPECT 통계량은 인터넷에서 인기를 끌고 있는 ExpG과 같은 메트릭들과 결합할 수 있다. 그 결과 각 포지션이나 선수들에게 훨씬 더 잘 맞춰진 숫자들을 제공해줄 것이다.
람이냐 말디니냐? 호날두냐 메시냐? 지단이냐 귄터 네쳐냐? 루이스 수아레즈냐 클린스만이냐? 이처럼 오랫동안 이어진 "누가 더 나은 선수인가?" 란 논쟁은 훨씬 잘 정립될 수 있을 것이다.
"모든 통계들은 다 쓸모없는 것" 이라 주장하는 전통주의자 입장에서도 걱정할 것은 없다. 리버풀의 4-3 승리로 끝난 리버풀과 도르트문트의 맞대결 같은 케이스들은 언제든지 일어난다. 그런 경기들은 가장 발전된 예측 모형과 알고리즘이 틀렸다고 말할 것이다. 하지만 스프레드시트로 경기를 보는 사람들 입장에선 IMPECT와 같은 새로운 숫자는 엄청난 발견이다.
내가 걱정하는 것은 단 하나다. 가장 발전된 메트릭이 유행을 타기 시작한다면 레알 마드리드와 바이언같은 구단이 도르트문트나 비야레알에서 근무하고 있는 최고의 분석가들과 기술자를 데려갈 것이라는거다. 불행하게도 정보 전쟁은 돈으로 이길 수 있다. 따라서 야구처럼 진보된 메트릭이 빈부격차를 좁혀줄 것이라 기대하지 않는 것이 좋다. 바르셀로나 라 마시아의 데이터 센터는 다름슈타트98의 데이터 센터보다 더 클 것이다. 그럴 것이라 확신한다.
어쨌든 유럽 최상위 리그에서 "머니볼" 시대가 도래했다고 생각한다. 이제 그럴 때가 왔다.
출처 : http://bundesligafanatic.com/impect-packing-the-future-of-football-analytics-is-here/
'Football Stats' 카테고리의 다른 글
공 점유에 관한 새로운 측정 방법 소개 (0) | 2017.07.17 |
---|---|
승부차기의 과학 : 승리를 위해 어떻게 데이터를 활용하는가 (0) | 2017.06.01 |
마무리 능력에 대한 재검토 (0) | 2017.05.08 |
순위는 똑같지만 무리뉴의 맨체스터 유나이티드는 어떤 면에서 나아졌는가? (0) | 2017.04.26 |
'순위표는 거짓말을 하지 않는다'란 말은 그만, 데이터는 축구계 가장 큰 거짓말을 해결할 수 있다. (0) | 2017.02.24 |