사이먼 윌슨(Simon Wilson)이 사우스햄턴에 처음 발을 딛는 순간, 그는 프로존(Prozone)이라 불리는 소규모 컴퓨터 프로그램 업체의 컨설턴트였다. 프로존은 피치 전반에 걸쳐 8대의 카메라를 설치하고 그것을 바탕으로 2D 영상으로 전환하여 선수를 트래킹(player-tracking)하는 시스템을 고안한 선두 주자이다. 프로존의 기술은 선수들의 움직임을 매 0.1초마다 캐치해내고 그것을 바탕으로 경기당 평균 3,000회의 볼터치를 측정해낸다. 그걸 바탕으로 오늘날 우리가 통계적으로 궁금해하는 사항들에 대해서 답을 얻어낸다. 사우스햄턴은 프로존과의 협력으로 이 일을 시작했지만 나중에는 윌슨을 퍼스트팀 전력 분석관(performance analyst)으로 고용한다.


"프로존의 시스템은 다수의 감독들이 채택하고 있는 전략도 아니었고 하나의 축구 문화도 아니었습니다. 다만 저는 사람들이 왜 이렇게 다양한 종류의 데이터를 원하지 않는가에 대해서 이해하기 어려웠습니다." 윌슨이 말한다. 2005년 루턴 타운과 사우스햄턴의 챔피언십 경기를 앞두고 윌슨은 당시 클럽 감독이었던 해리 레드냅에게 데이터를 토대로 경기 전 브리핑을 하게 되었다. "알다시피 해리는 분석적인 성향의 감독이 아닌 직관력으로 승부를 보는 감독입니다. 그는 선수들에게 더 많은 정보를 제공하면서 부담을 주는 것을 원하지 않았습니다." 결국 사우스햄턴은 2:3으로 패배햇고 팀버스 안에서 해리 레드냅 감독은 윌슨에게 이렇게 말했다고 한다. "이 봐, 다음 주에 네 놈 컴퓨터와 상대팀 컴퓨터가 싸워서 누가 이기는지 보자고"


반면에 레드냅 감독과 달리 데이터 활용에 적극적인 입장도 있는데 2003년 잉글랜드를 럭비 월드컵 우승으로 이끌었던 클리브 우드워드가 대표적인 케이스라고 할 수 있겠다. 2005년 우드워드는 사우스햄턴의 풋볼 디렉터 자리에 1년 계약 제의를 받았다. 사실 우드워드는 럭비계에서 처음으로 프로존의 데이터 시스템을 도입한 감독이다. 잉글랜드의 데이터와 상대팀의 데이터를 지속적으로 저장했다. "처음으로 데이터를 접목시키는 것을 목격했을 때 이러한 방식에 매료될 수 밖에 없었다. 경기를 지켜보고 있지 않는 지점에 대해서는 전혀 알 수 있는 방법이 없었지만 데이터화를 통한 점의 움직임으로 확인할 수 있게 되었다. 상대가 어떻게 플레이하고 있는지에 대한 선입견에도 변화를 줄 수 있었다. 우리가 이전까지 이기지 못했던 팀들을 데이터를 통한 기록으로 보았을 때 완전히 달라보였다." 이상 클리브의 발언이었다.


"클리브는 모든 분야에 데이터를 활용할 수 있도록 환경을 마련했다. 그는 우리가 골을 넣기 위한 훈련에 시간을 쏟고 있다고 왜 상대의 플레이를 저지하는 것에는 시간을 그만큼 투자하지 않느냐고 말했고 나는 코칭 스태프와 선수단이 (직관에 의해 시행) 하는 것들에 대해서 설명했다. 그러더니 클리브는 왜 그렇게 운영하고 있냐고 계속 되물었다." 윌슨이 클리브와 같이했던 시기를 회상한다. 클럽은 계속해서 직관에 의존해 운영되었고 결국 레드냅은 해를 넘기지 못한 채 자리에서 물러났으며 우드워드는 기존의 1년 계약 기간이 끝나자 팀을 떠났다. 윌슨의 경우는 우드워드보다 조금 더 이른 시점에 사우스햄턴을 떠났지만 분명히 클럽을 이끌어가는 방식에 더 좋은 방법이 있는게 분명하다고 확신하게 되었다. "우드워드는 비디오, 통계 자료와 같은 것들이 팀을 준비하는데 있어서 굉장히 기초적인 부분을 차지한다고 믿었습니다. 다만 기존의 클럽 운영 방식이 (직관에 의존하는) 특정 방법론에 의거해 이루어지고 있었기 때문에 우리가 꼭 나서서 할 필요가 없다고 생각했던 것이죠."


오늘날 20개 프리미어 리그 클럽 중에서 19개 클럽이 프로존을 활용하고 각 팀에는 전력 분석관과 데이터 분석가(data scientists)가 선수들의 퍼포먼스 지표를 분석한다. 경기에서 결정적인 순간들과 시즌을 보내는데 있어서 클럽의 전술적 트렌드 등을 분석하게 된다. 한 마디로 이들이 세계 최고 스포츠를 조목조목 해부하는 과학자인 것이다. 프로존과 더불어 다른 시스템까지 활용한 분석 자료를 기반으로 승리를 만든 플레이와 패배를 만든 플레이의 차이점을 발견한다. 


1950년 3월 19일 오후 3:50 영국 공군(RAF)의 회계사 찰스 리프(Charles Reep)는 스윈던 타운과 브리스톨 로버스의 경기를 보러 가서 노트와 연필을 꺼낸다. 그리고 나서 피치 위에서 발생하는 사건들을 자신만의 기호로 기록한다. 반면에 오늘날 전력 분석관들은 컴퓨터 시스템에 의존한 방식으로 경기를 기록한다. 지난 수십년간 리프는 2,200경기를 기록했으며 1경기마다 80시간이 걸렸다고 한다. 특히 1958년 월드컵 결승전은 분석하는데 무려 3달이 걸렸다는 이야기가 있다.


우리는 축구가 예측 불가능하고 굉장히 다이내믹한 경기라고 생각하지만, 리프는 그 와중에도 예측 가능한 패턴과 일정한 법칙이 존재함을 증명해냈다. 평균적으로 9번의 슈팅마다 1골이 나오고 전체 득점의 80%가 4번의 패스보다 적게 연결된 상태로 만들어진다고 한다. 또한 전체 득점의 50%는 골라인에서 30m 떨어진 지점에서 공을 뺏어낸 이후에 만들어낸 득점이며 결국 리프는 지속적으로 패스를 시도하는 플레이 시간을 줄이고 상대 진영에서 공을 뺏어내는 움직임에 더 많은 투자를 하면 좋은 성적을 낼 수 있다는 결론을 내리게 되었다. 리프가 주장하는 방식의 축구는 롱볼(long-ball game)이라 알려진 전술이 되었다.


롱볼 게임에는 2가지 문제점이 있다. 우선 보는게 괴롭다는 점이다. 둘째는 롱볼 축구를 지지하는 리프의 통계 자료는 굉장히 단편적이라는 것이다. 2005년 University of British Columiba 의 이안 프란츠(Ian Franks) 교수와 수학자 마이크 휴즈는 2차례의 월드컵 기록을 토대로 나름의 분석을 시행했다. 우선 프란츠와 휴즈가 시도한 데이터 분석은 리프의 분석과 상호호환 될 수 있으나 기록을 더 면밀하게 살펴볼 경우 차이점이 발생하는 것을 확인할 수 있었다. 우선 리프가 '전체 득점의 80%는 4회 이하의 패스로 만들어진다' 라고 주장한 것은 타당치 않은 주장이었다. 일반적으로 골이 그렇게 나왔던 것이지 4회 이하의 패스가 시도된다고 득점의 확률이반드시 높아진 것은 아니었다. 즉 득점의 빈도가 득점 확률과는 동일하지 않다는 것이다. 휴즈와 프란츠가 발견한 사실은 더 많은 패스를 성공시키는 팀이 골을 기록할 기회가 높아진다는 것이었다. "물론이죠. 오랫동안 패스를 주고받을 기술력을 갖춘 선수들이 필요한게 맞습니다." 휴즈가 말한다. 그 때까지도 사람들은 뻔뻔하게도 롱볼 전략을 사용하지 않는 브라질같은 국가들이 월드컵에서 우승한다는 사실을 무시하고 있었다.


"자료를 수집하는 것은 언제나 최우선적으로 시행되어야할 단계입니다. 그 점에서 리프는 아주 대단한 회계사였죠. 그러나 훌륭한 분석가는 아니었습니다. 숫자가 말해주는 것들에 대한 해석 능력에 한계가 있었습니다." Cornell University에서 경제학을 담당하며 지난 3년간 축구 통계에 대해 연구하고 있는 크리스 앤더슨(Chris Anderson)교수가 말한다. 앤더슨는 리프가 선입견을 가지고 있었고 분석가들 대다수가 활용하는 다른 가설 설정에 소홀했다고 지적한다. 눈에 보이는 최소한의 변수만으로 최대의 아웃풋을 이끌어내려고 했던 것이다. "리프의 결론은 롱볼 게임을 추구하는 사람들의 열렬한 지지를 받았습니다. 그렇게 결론을 내린 것이 잘못되었다는 것은 전혀 고려하지 않고서 말이죠." 앤더슨은 자신의 저서인 <The Numbers Game>에 이렇게 리프에 대해 이렇게 서술했다. '전술을 설명하기 위한 리프의 숫자 데이터 활용은 실패로 돌아가고 말았다. 왜냐면 리프는 데이터를 자신의 신념이 맞다고 뒷받침 하기 위해서 활용한 절대론자(absolutist)였기 때문이다. 축구에 대해서 자신이 가지고 있는 개념을 버렸어야만 했다. 승리를 만들어내는 단 1가지 공식을 만들겠다는 생각을 버렸어야만 했고 숫자들을 토대로 다양한 진실과 거짓을 발견하는걸 추구했어야 했다.' 다만 통계가 우리가 놓치는 부분에 대해서 확인할 수 있는 길을 열어준다는 리프의 주장은 전적으로 타당하다.


다시 윌슨의 이야기로 돌아가서, 윌슨은 2006년 맨체스터 시티로 팀을 옮기게 되었고 맨체스터 시티에서 Football Analytics란 새로운 부서의 최고 분석관으로 임명 되었다. 이 때부터 윌슨은 축구 팀이 데이터를 활용하는 방식의 차이를 바꾸려는 목표를 설정하게 되었다. "경기가 끝난 이후엔 어떠한 분석도 없었습니다. 감독과 코칭 스태프들이 선을 그려가면서 감성적인 분석을 하고서 넘어가는게 일종의 문화였습니다. 스스로 게임 플랜이 올바르게 설정되었는지 잘 먹혀들었는지 반문하지 않았습니다. 제가 이끄는 부서는 일종의 그런 습관과 싸워야만 했습니다. 그리고 결국에 우리는 하나의 루프를 만들어냈습니다. 1. 경기에서 무슨 플레이가 벌어졌는가 2. 무슨 이유에서 플레이가 나왔을까? 3. 그렇다면 우리가 나아갈 방향은 무엇인가? 이렇게 분석을 이어가는 것이죠."


당시만 하더라도 시티는 리그 중위권에 위치한 팀이었고 원정에서 좀처럼 승리를 만들어내지 못하는 팀이었다. 2008년 9월에 아부다비 유나이티드 그룹의 인수를 통해 시티는 프리미어 리그에 지각 변동을 일으켜냈다. 지금 윌슨은 맨체스터 시티의 전술 퍼포먼스 분석팀(strategic performance analysis)의 매니저 역할을 담당하고 있고 5개 부서를 총괄하고 있다. 5개 부서 중에는 팀 퍼포먼스 분석팀(team performance analysis)이 있는데 이 부서는 스포츠 과학자 에드 설리(Ed Sulley)가 담당하고 있는 곳이다매 경기마다 철저한 편집을 통해 팀의 퍼포먼스를 분석하는 세심한 레포트를 작성하는데 여기에는 경기의 승패를 좌우할 것이라 생각되는 통계 자료들이 포함된다라인 브레이크(line break) 횟수라던가공을 뺏기거나 뺏어낸 후 20초 동안 벌어진 사건들에 대해서 면밀히 분석한다이들은 전방 1/3지점에서 시티의 볼 소유권에 대해서 집중했고 결국에 경기를 승리하는데 있어서 전방 1/3지점에서 볼 소유권이 강한 상관 관계를 지닌다는 것을 알아냈다. “우리는 상위권 팀이 평범한 팀을 상대로 승리를 거둘 때그 지점(전방 1/3지점)에서 점유율을 지배하는 것을 발견했습니다패스 성공률이 상당히 높았고 특히 전진 패스가 두드러졌습니다그래서 이제 우리는 선수를 영입하는데 있어서 개인의 높은 패스 성공률에 대해서 주목하게 되었습니다.” 윌슨이 말한다.

 

라인 브레이크 횟수나 전방 1/3지점에서의 볼 소유권은 시티처럼 플레이하는 팀에는 중요한 지표가 될 수 있으나 다른 스타일의 경기를 펼치는 팀에게는 상관없는 기록일 수도 있다우리는 경기 스타일에 맞춰 통계 자료를 해석할 수 있어야한다어려운 점은 다양한 숫자들 사이에서 유의미한 수치를 발견하기가 어렵다는 것이다. “50가지 다양한 변수들에 대해서 고려하기 보다는 우리의 경기 스타일에 직접적인 영향을 주는 5개의 수치를 발견하길 원하고 있습니다정확한 데이터 공급이 있다면알고리즘을 통해 나오는 통계 자료들은 경기의 승패와 강한 상관 관계를 지니게 됩니다.” 시티의 경기 분석가(match analyst) 페드로 마르퀘스(Pedro Marques)가 말한다.

 

윌슨은 맨체스터 시티가 22경기 동안 코너킥에서 득점이 없었던 시절에 대해서 이야기하려고 한다따라서 분석팀은 코너킥 득점이 발생한 400번의 장면을 분석하기 시작했고 코너킥 득점 장면의 75%가 인-스윙(in-swinging) 코너킥에서 나왔던 것으로 분석되었다. “다음 시즌 12경기에서 우리는 코너킥으로 9골을 넣었습니다만약 코치들의 직관에만 의존한다면 6명의 코치 개개인의 의견이 다를 것이고 결국 각자의 생각은 버려지기 마련입니다반면에 우리는 아주 명백한(objective) 증거를 토대로 이게 옳은 방식이라 주장했고 그게 맞았습니다.” 윌슨이 말한다.

 

윌슨이 사우스햄턴에서 컨설턴트로 일했을 때그는 프로존의 기계에서 정보를 하드 디스크에 옮겨 담아 다른 10명의 프로존 컨설턴트가 있는 리즈로 복귀하여 밤새면서 데이터 처리를 했고 다시 분석 자료를 사우스햄턴에 가져다 줬다하루에 20시간을 일해야하는 날도 있었다프로존의 CEO인 Ram Mylvaganam은 축구에 대해서는 거의 아는 바가 없었다프로존 사무실 벽에는 아티스트 줄리안 비버(Julian Beever)의 작품이 걸려있는데 그 그림은 오른쪽에서 보았을 경우 3D처럼 보이는 착각을 만들어낸다. Mylvaganam에게 데이터는 비버의 작품과도 같았다제대로 보아야 데이터를 이해할 수 있는 것이며 잘못된 시선으로 바라보면 데이터는 실없는 소리에 그치는 것이었다.

 

Mylavaganam은 경영 상담을 전문으로 하는 직업에 있으면서 1996년에 프로존에 대한 아이디어를 처음 떠올렸고 당시 과거 에이전트 역할을 하고 있었던 닐 람세이(Neil Ramsay)의 소개로 더비 카운티와 계약을 하게 되었다프로존의 첫 시작은 포터캐빈(임시 사무실로 사용할 수 있도록 차량에 달고 이동 가능한 작은 건물)에 22개의 마사지 의자를 설치하여 의자에서 발산해내는 전기충격을 통해서 선수들의 근육을 풀어주고 유연성을 증가시키는 일이었다매일 아침 10시 30분에 선수들은 15분간 의자에 앉아 팀의 수석 코치인 스티브 맥클라렌의 이야기를 경청한다.맥클라렌은 경기 플랜에 대한 비디오 자료를 준비하여 선수들에게 설명한다

 

맥클라렌은 선수들이 모두 집으로 떠난 이후에도 남아서 일을 했다. 2개의 비디오 녹화기기와 스크린을 토대로 비디오 영상을 편집하고 있었다고생하던 것이다그래서 나는 맥클라렌에게 우리 회사 사람들에게 영상 편집을 맡겨보는 것이 어떠냐고 물어봤다그러더니 맥클라렌은 이렇게 반문했다. ‘당신들이 좋은 움직임과 나쁜 움직임을 선별해낼 수 있냐고난 선수들에게 어떻게 하면 이길 수 있는지에 대해서 보여주고 싶다.’라고 말했다.” Mylavaganam이 맥클라렌과의 이야기를 회상한다물론 맥클라렌이 더 많은 의미를 파악해낼 수 있었을 것이다. Mylavaganam은 프랑스에 있는 Video Sports라는 소규모 기업이 트래킹 소프트웨어를 개발한 것을 알게 되었고 회사 지분의 25%를 구매하여 프라이드 파크 스타디움(Pride Park Stadium, 더비 카운티의 홈구장)에 카메라 8대를 설치했다. “물론 카메라 기술이 좋지는 않았습니다때로는 우리가 분석을 위해서 영상을 되돌리더라도 선수가 카메라에 잡히지 않는 경우가 있었습니다우리는 리즈에서 새로운 소프트웨어를 만들어야했지만 여전히 그 방식은 혁명적인 시도였습니다우리는 축구라는 게임을 통계 자료를 바탕으로 정의하고 있었으니까요.” Mylavaganam이 말한다.

 

1999년 스티브 맥클라렌을 맨체스터 유나이티드의 감독인 알렉스 퍼거슨 경이 데려가게 되고 맥클라렌은 맨체스터 유나이티드 측에 프로존을 활용할 것을 제안한다당시에 더비는 무료로 서비스를 누리고 있었는데 Mylavaganam은 맨체스터 유나이티드와 정식 계약을 요구하게 된다.이에 맨체스터 유나이티드는 트로피를 1개당 50,000을 지불하겠다고 약속했다. 1999년 맨체스터 유나이티드는 트레블을 달성했고 프로존은 이렇게 돈을 벌기 시작했다. 2000년 8월에 프로존은 6개의 프리미어 리그 클럽과 계약을 맺는데 성공하여Mylavaganam과 람세이는 각팀에 프로존 컨설턴트를 파견했다.


2000년 당시 볼턴 원더러스의 감독인 샘 앨러다이스가 Mylavaganam에게 연락을 한다. Mylavaganam은 볼턴과 같이 하부리그에 위치한 클럽이 프로존을 사용할 여력이 있는지 의구심을 품었으나 동시에 볼턴에서 프로존이 성공을 거둔다면 맨체스터 유나이티드의 트레블 못지않게 주목을 받을 수 있는 기회일 것이라 생각했다. 볼턴은 하부 리그에서 최초로 프로존을 도입한 클럽이 되었고 결국 챔피언십 플레이오프에서 프레스턴을 3:0으로 이기면서 프리미어 리그로 승격하게 되었다.


볼턴에서 앨러다이스 감독은 엄밀한 경기 플랜을 데이터를 기반으로 만들어냈다. 앨러다이스의 보좌진으로는 과거 프로존의 분석가인 데이비드 팔로우(David Fallows)가 있었고 앞서서 언급했던 설리와 휴즈 아래서 공부한 가빈 플레이그(Gavin Fleig)도 있었다. 앨러다이스 감독과 전력 분석관들은 '판타스틱4'라 불리는 경기를 승리하기 위한 4가지 요소 모델을 가지고 있었다. 우선 잔류를 위해서는 38경기에서 최소 16경기에서 실점하지 않아야한다는 것이었다. 볼턴은 자신들이 선제골을 기록할 경우 70% 확률로 경기에서 승리할 수 있다고 생각했고 또한 전체 득점의 1/3 가량의 세트 피스에서 만들어진다는 것을 알아냈다. 또한 세트 피스 상황에서도 인-스윙 크로스가 아웃-스윙 크로스보다 확률이 높다고 판단해 인-스윙 킥을 자주 연습했을 뿐만 아니라 동시에 인-스윙 코너킥을 방어하는 것도 연습하게 되었다. 


또한 앨러다이스 감독은 볼턴이 상대팀보다 속도 5.5m/s 이상으로 뛴 거리가 상대보다 길다면 지지않을 확률이 80%에 육박한다고 결론 내렸다. 또한 상대 진영 깊숙한 곳에서는 항상 롱스로인을 지시했고 만약 그 지시사항을 거부할 경우 앨러다이스 감독은 선수를 미친 듯이 갈궜다. 왜냐면 앨러다이스 감독의 판단으로는 짧은 스로인을 하는게 확률을 스스로 줄이는 행위였기 때문이다. 전력 분석관과 앨러다이스 감독의 오랜 연구 끝에 선수들을 공이 떨어질 확률이 가장 높은 위치에 배치시켰고 그로 인해 득점 가능성을 높였다. 2003년부터 2007년까지 볼턴은 연속해서 8위 이내로 리그를 마쳤고 이보다 꾸준한 모습을 보여준 클럽은 소위 빅4라 불린 팀 뿐이었다. 2005년에는 클럽 최초로 UEFA컵에 진출했고 2006년도 마찬가지였다. 앨러다이스 감독은 2007년 팀을 떠났지만 21경기에서 승점 39점을 획득하는 인상적인 기록을 남기고 볼턴을 떠났다.


앞서 언급한 <The Numbers Game>이란 저서에는 축구에서 기술 못지않게 행운이란 요소의 중요성에 대해서 언급한다. 득점 빈도는 적고 경기에서 우연한 상황에서 발생하는 경우가 44%를 차지하고 있다. 우세할 것으로 예상하는 팀이 항상 이기는 것도 아니다. 축구는 우연성이 지배하고 있는 스포츠지만 그렇다고 결과에 데이터가 아무런 영향을 미치지 못한다는 말은 아니다. 축구에 잠재된 예측 불가능성이 우리가 시행하는 분석을 더욱 의미깊게 만들고 있다. 중요한건 단순히 데이터가 아닌 데이터를 활용해 승리 방정식을 만들어내는 머리를 굴리는 것이다." 앤더슨 교수가 말한다. 





2013년 10월 11일, 잉글랜드는 웸블리 스타디움에서 몬테네그로와 월드컵 예선 경기를 치른다. 위의 그림은 프로존의 히트맵 기록이다. 빨간 부분은 에베턴 출신의 레프트백 레인턴 베인스가 경기 중에 활동한 영역에 대한 정보를 제공한다. 오른쪽 하단을 보면 베인스가 저 위치에서 코너킥을 처리했다는 것을 확인할 수 있다.


일반적으로 분석가들은 선수들의 뛴거리가 선수의 개인 퍼포먼스를 확인할 수 있는 좋은 지표라고 생각했고 또한 팀의 볼 점유율 수치가 승리와 강한 연관성을 지닌다고도 해석했다. 그러나 오늘날 들어서 그것이 점차 무의미하다는 것이 증명되고 있다. 이제는 단순히 뛴거리가 아닌 전력 질주 횟수가 더 중요해졌고 전방 1/3 지점에서의 볼 점유율이 승리와 더 높은 연관성을 지닌다는 것을 알게 되었다. 더 확실한 측정 방법이 경기에 대한 한층 높은 이해를 돕고 있다. 과거 프로존의 이사로 일했던 블레이크 우스터(Blake Wooster)는 이렇게 말한다. "우리는 선수 개인에 대해서만 생각하고 주변 상황에 대해서는 깜빡하는 경우가 많습니다. 예를 들자면, 바르셀로나의 리오넬 메시는 역사상 최고의 선수 중 하나지만, 만약 메시를 바르셀로나가 아닌 다른 팀에서 뛰게 할 경우는 어떻습니까? 주변 상황이 없는 철저한 공백 속에서 선수의 재능은 평가내릴 수 없습니다." 비슷한 맥락에서 현재 프로존은 단순한 선수 개인의 퍼포먼스가 아닌 주어진 상황과 결합한 선수의 퍼포먼스를 측정하기 위한 'Goal Expectation'이라고 불리는 모델을 개발해냈다.


이 모델은 슈팅이 시도되는 위치에 따른 가능성도 계산에 포함하여 골스코어러가 얼마나 훌륭한 경기력을 보여주는지 측정하게 된다. 지난 시즌에 가레스 베일은 전체 161회의 슈팅으로 21골을 기록했는데 'Goal Expectation' 모델로는 11골 득점이라는 결과가 나왔다. 즉 베일은 우리가 득점하기 어려울 것이라 전망하는 지점, 족히 30야드는 떨어진 지점에서 슈팅을 시도한 것이고 그걸 득점으로 연결지었던 것이다. (슈팅 대비 골 수라는) 단순한 기록이 아닌 상황을 곁들인 기록 해석을 통해서 베일이 높은 평가를 받고 있는지에 대해서 확인할 수 있었다. "





여전히 축구에서 가장 중요한 사항들은 측정되기 어려운 분야에 속하고 있다. 예를 들자면, 지난 10시즌간 프리미어 리그 데이터를 통해 분석했을 때 1득점은 평균적으로 승점 1점의 가치를 지녔으나 무실점은 평균적으로 2.5점의 가치를 만들어냈다. "우리의 직관과는 다르게 무실점이 실제 득점보다 더 가치있습니다. 그렇다면 우리는 나오지도 않는 득점에 대한 가치를 어떻게 조금 더 면밀하게 측정할 수 있을까라는 물음을 던지게 되고 보이지 않는 사건에 대해서도 손을 대기 시작하는 것이다." 앤더슨 교수가 말한다.


쉽게 이야기하면 공격은 공을 가지고 있는 상황을 토대로 측정할 수 있다. 슈팅, 패스, 크로스, 전력 질주 횟수같은 것들 말이다. 태클, 클리어링, 세이브 같은 기록은 공이 있는 상황에서 측정할 수 있지만 집단의 행동에 의해 발생하는 기록들. 가령 맨마킹, 공간으로 들어오는 패스를 차단하는 것, 수비수의 위치 선정같은 것들은 공이 없는 상황에서 발생하는 것이기 때문에 측정하기 까다롭다. 시티의 전력 분석관들은 현재 이 어려운 단계에 도전하고 있다. "우리는 현재 선수들이 동료들과 함께 시너지를 만들어내는 것에 대해 알아내기 위한 방법을 구상 중입니다. 여전히 많은 분석가들이 개별적인 변수와 선수 행동에 집중하고 있지만, 이제 우리의 핵심 목표는 이것이다 하고 선수들 사이의 상호작용을 이해할 수 있어야 한다." 마르케스가 말한다.


아래는 앞서 언급한 잉글랜드와 몬테네그로 경기에서 후반전 토트넘 핫스퍼의 안드로스 타운센드의 전력 질주를 기록한 자료이다. 노란색은 4~5.5m/s의 속도, 주황색은 5.5~7m/s, 빨간색은 7m/s 이상의 속도를 낸 경우를 표현한 것이다.





2011-2012시즌 매주마다 맨체스터 시티의 주장 뱅상 콤파니는 동료 수비수들과 함께 전력 분석관과 경기 분석에 동참해 자신들의 퍼포먼스에 대해 평가받았다. 윌슨은 당시의 상황을 이렇게 말한다. "선수들은 비디오와 통계 자료를 보면서 질문을 던집니다. 상대의 압박이 효율적인게 맞는지, 그로 인한 실책이 얼마나 나왔는지, 공을 빼앗길 경우 10초 내에 어떻게 움직여야하는지에 대해서 이야기를 합니다. 그렇게 분석을 통해서 수비 전술을 설정하게 됩니다. 굉장히 우수한 분석팀을 보유하고 있더라도 만약 거기서 생산해내는 유의미한 데이터가 선수들에게 영향을 주지 못한다면 경기에서 이길 수 없을겁니다." 


2011-2012시즌 맨체스터 시티는 리그에서 최소 실점을 기록한 팀이 되었고 윌슨은 "우리는 수많은 기록을 다시 세웠다. 수많은 찬사가 피치 위에서 고생한 이들에 대해 돌아 가야하겠지만, 30%는 우리가 철저하게 준비하여 선수들의 잠재 능력을 최대화시킨 것 때문 "이라고 자평했다. 


윌슨은 가장 중요한 경기인 QPR전을 시청하지 못했다. 시티는 맨체스터 유나이티드와 승점 동률 상황에서 골득실 차이로 우승을 확정지었는데 전반전에 맨체스터 시티가 1:0으로 앞선 채 전반전을 마쳤다. 그러나 후반전에 QPR이 2골을 기록했고 추가 시간이 2분 지난 상황에서 시티의 에딘 제코가 동점골을 기록했다. 그 때 유나이티드는 리그 최종전을 승리로 마쳤고 이대로 경기가 끝날 경우, 맨체스터 유나이티드의 리그 우승으로 시즌이 종료될 것이었다.


아래는 몬테네그로전 웨인 루니의 움직임을 기록한 것이다. 다니엘 스터리지와 대니 웰백이 최전방에서 뛰면서 루니는 조금 더 자유로운 경기를 펼칠 수 있었다.





제코의 득점이 나온지 2분 후에 세르히오 아게로가 충분히 슈팅을 시도할 수 있는 박스 근처에서 공을 잡았다. 앞에서 언급한 프로존의 'Goal Expectation' 모델에 따르면 공을 처음 받은 상황에서 아게로는 12%의 득점 확률을 가지고 있었다. 그러나 아게로는 바로 슈팅을 시도하지 않고 조금 더 전진한 위치, 본인의 득점 확률이 19%로 상승하는 곳에서 슈팅을 시도해 공은 결국 그물에 꽂히고 말았다. 




출처 : https://elitesportconsulting.wordpress.com/2014/01/04/data-analytics-in-football/



by Tim Lewis (원문은 2014년 3월 9일에 작성되었습니다)


맨체스터 시티는 선수 데이터를 분석하는 11명의 직원을 고용했다. 과연 통계적 접근은 우리의 직감을 대신할 수 있을까?



지난해 맨체스터 유나이티드의 지휘봉을 넘겨받은 데이빗 모예스는 어쩜 그렇게 호러쇼를 선보일 수 있을까? 그저 탁상공론만 펼치는 입장에서 보면 그 이유는 아주 간단하다 : 자진해서 전설적인 인물의 뒤를 잇는건 아주 멍청한 행동이다. 알렉스 퍼거슨 경을 대체한다는 것은 이미 킥오프 이전부터 결론이 나있던 것이다. 모예스의 입장에서 볼 경우, 그는 정점에 도달해있는 선수가 극히 소수인 불안정한 스쿼드를 물려받았다. 아니면 애당초 모예스는 자격이 없었다고 볼 수도 있다 : 프레스턴 노스 엔드, 에버턴을 지휘하면서 메이저 트로피란건 들어올린 적이 없고 지구에서 가장 유명한 축구 클럽이라 할 수 있는 맨체스터 유나이티드에 그가 작은 구단의 멘탈리티를 가져왔다고 평가할 수도 있다.


그러나 시끄러운 외부와 달리 모예스는 맨체스터 유나이티드의 위기에 관해 전혀 다른 관점의 시선을 가지고 있었다. 모예스 감독은 2번의 이적시장을 통해서 새로운 선수를 보강하는 것에 적극적이지 않았고 각 이적시장에서 단 1명씩 선수를 영입했다. 그러나 우리의 눈에 보이는 것과 달리 모예스는 보이지 않는 곳에서 일하는 스태프들에 변화를 주고 있었다. 결국 모예스 감독은 백룸(back-room)스태프를 갈아 엎었고 에버턴의 수석 스카우터인 로비 쿡(Robbie Cooke), 에버턴에서 모예스와 같이 일한 경력이 있는 첼시의 유럽 스카우터 믹 도허티(Mick Doherty), 에버턴 아카데미의 자랑거리이자 후에 프리미어 리그 엘리트 퍼포먼스의 최고 직책까지 겸임한 존 머토(Jon Murtough)가 맨체스터 유나이티드로 왔다. 모예스 감독의 마지막 '영입'은 에버턴의 테크니컬 스카우터 제임스 스미스(James Smith)였다.


백룸 스태프 영입은 결코 헤드라인을 장식하지 않았다. 그러나 모예스는 이들이 클럽 안팎으로 미래의 스타들을 수급하는데 있어서 핵심적인 역할을 수행할 것이라 믿었고 맨체스터 유나이티드 감독으로서 자신의 미래 역시 책임질 수 있는 투자라 생각했다.


축구에는 계속해서 혁신이 이루어져왔다. 아주 충직한 축구팬의 눈에도 여전히 어렴풋이 인식되고 있지만 말이다. 클럽은 점차 스마트하고 효율적인 방법을 추구하고 있고 우리는 이제 신문이나 매치 오브 더 데이(Match of the Day)에 통계적 시각자료가 사용되는 것에 익숙해져있다 : 통계자료는 단순히 코너킥 횟수, 슈팅수를 세는 것에서 시작해서 이제는 더욱 상세한 분야까지 확장되고 있다. 주력 최고 속도를 측정하는 것에서 피치 위에서 선수의 움직임을 보여주는 히트맵까지. 이것들 역시도 피치 위에서 수집되는 여러 사건의 일부분에 불과하다. 스포츠 통계 회사인 Opta는 매 경기마다 약 1,500종류의 사건(events)을 기록한다.


프리미어 리그의 20개 클럽, 심지어 하부리그 클럽들까지도 정보를 이해하기 위해 데이터 분석가들을 고용하고 있다. 맨체스터 시티는 11명의 데이터 분석가를 고용했고 2012년 리버풀은 연구이사(director of research) 자리를 새로 만들어 이론 물리학 박사학위를 가진 이안 그래엄(Ian Graham)을 그 자리에 임명하여 다소 논란이 있었다. 분석가들은 경기를 준비하는 과정, 경기 후 분석에 관여한다. 또한 이적 타깃을 설정하고 어린 선수들을 등급 별로 육성하는데 있어 방향을 제시한다. 사실 이러한 방식의 접근은 클럽 서포터들로 하여금 의구심과 혼란을 야기하고 있다. <뉴스테이츠먼 New Statsman>의 최근 헤드라인에는 이러한 팬들의 경향을 잘 반영한 헤드라인이 실렸다. "어떻게 데이터나 만지작 거리는 괴짜들이 축구계를 휘어잡을 수 있던건가?"


컴퓨터 분석가들이 축구계를 장악하시 시작하는 것에 당황할 수 있다. 우리 한 번 지난 달에 있었던 아스날과 바이에른 뮌헨의 경기를 떠올려보자. 바이언은 2:0 승리를 기록했고 다음날 아침 가디언에서는 2가지 기록을 추려내 기사에 실었다. 하나는 토니 크로스가 아스날 미드필더 전체를 합한 것보다 더 많은 패스를 기록했다는 것이고 둘째는 메수트 외질이 11.69km를 뛰어 피치에서 전체 3번째로 많이 뛴 선수였다는 것이었다. 통계가 직접적으로 말해준 것이 아니지만 경기를 본 사람들이 받았던 느낌을 합리적으로 추론해낼 수 있다. 크로스는 센세이셔널했고 외질은 바이언에게 골칫덩어리였다.


먼저 언급한 크로스와 외질 이야기는 아주 간단한 예시지만, 이것은 최고레벨에 위치한 축구 클럽들의 논쟁거리를 요약해준다고 할 수 있다. 한쪽 코너에는 정량 분석가들이 위치해있다 : 이들은 통계, 선거-신탁자 네이트 실버, 노벨상 수상자인 심리학자 다니엘 카네만, 특히 머니볼 스타인 빌리 빈을 신봉하는 사람들이다. 머니볼은 야구에서 데이터를 바탕으로한 혁명적인 사건을 다룬 책으로 2003년 마이클 루이스가 발간한 책이다. 이들은 야구처럼 축구 경기 역시 숫자로 해석될 수 있다고 생각한다. 해지펀드나 주식시장처럼 피치 위에서 벌어지는 사건들의 데이터는 패턴을 가질 것이라고 주장한다. 물론 이들은 축구에서 직감이 사라져야한다고 주장하지는 않는다. 그러나 통계는 사람이 결코 가질 수 없는 냉철함을 가지고 있다고 생각한다.


오클랜드 애슬레틱스의 단장 빌리 빈은 이렇게 말했다. "통계보다 내 눈(직관)을 믿어야 한다는 주장에 동의하지 않는다. 마술사가 모자에서 토끼를 꺼내는데 난 그 전에 모자 속에 토끼가 존재하지 않았던걸 봤다."


이제 반대편 코너에는 전통주의자들, 그러니까 기존의 프로 축구 구단에서 절대다수의 자리를 차지했던 감독과 구단주가 있다. 이들 역시 머니볼에 대해서 알고 있다. 적어도 브래드 피트가 출연한 작품이라는 것 정도는 알고 있다. 하지만 이들은 야구처럼 연속적이지 못한 스포츠에서 적용되는 논리가 축구처럼 유동적이며 역동적인 축구에 마찬가지로 적용되는가에 의구심을 가지고 있다. 대다수 감독들은 웬만한 높은 레벨에서 직접 경기를 뛰어본 경험들이 있고 피치 위에서 발생하는 여러 사건, 선수 영입에 있어서 자신들이 특별한 통찰력을 가지고 있다고 생각한다. 이들의 관점에 대한 일화는 잡지 <Wired>에 실려있는 해리 레드냅에 관련된 일화를 통해서 알 수 있다. 이는 레드냅의 사우스햄턴 감독시절의 일화인데 그는 경기에서 패배한 이후 분석가를 향해 "다음 주에 네놈 컴퓨터랑 상대팀 컴퓨터랑 붙여서 누가 이기나 보는건 어떠냐?"라고 조롱했다고 한다.


레드냅의 사고방식은 현실과 너무 빗나간 것이긴 하지만, 우리는 언제쯤에서야 축구 경기가 단순히 22명의 선수와 양팀 감독 사이간의 대결이 아닌 두 벤치에 앉아있는 모든 인물들의 두뇌 싸움이라는 것을 받아들일 수 있을까?


그 가능성에 대해 알아보기 위해 우리는 에버턴에서 출발하고자 한다. 파이낸셜타임즈의 칼럼니스트이자 사커노믹스의 공동저자인 사이먼 쿠퍼는 지난 10년간 에버턴보다 더욱 꾸준하게 기대 이상의 성과를 만들어낸 클럽은 없다고 말한다. 2007년부터 2013년까지 데이빗 모예스 아래서 에버턴은 8위 혹은 그 이상의 성적을 기록했다. 에버턴은 다른 라이벌 클럽들과 비교했을 때 선수들에게 줄 수 있는 주급도 부족했고 빅네임을 영입하기 위해서 돈을 화끈하게 지르지도 못했다. 그런데 그들은 웨인 루니, 잭 로드웰, 로스 바클리같은 뛰어난 재능들을 배출해내며 이를 달성했다. 또 여기에 레인튼 베인스, 레온 오스만같이 평소에는 주목을 받지 못했지만 통계적으로 주목을 받기 시작한 인물들까지 가세하면서 에버턴은 기대 이상의 성적을 낼 수 있었다.





사실 베인스는 데이터 혁명의 상징과도 같은 선수라 할 수 있다. 더벅머리 베인스는 수년간 탄탄한 수비를 선보이며 듬직한 레프트백으로 인식되었으나 언제나 국가대표팀에서는 그보다 더 화려한 에슐리 콜의 철저한 백업멤버였다. 그러나 통계는 완전히 다른 스토리를 만들기 시작했다 : 2012년 Opta는 유럽 톱리그 선수들 중에서 가장 많은 득점 기회를 만들어내는 선수가 바로 레프트백 레인튼 베인스라는 사실을 공개했다. 38%의 정확성을 지닌 베인스의 크로스는 매 21.6분마다 득점 기회를 만들어냈고 이는 다비드 실바나 산티 카솔라처럼 유명한 플레이메이커들보다 더 우수한 기록이었다. 어찌보면 2명에게는 부끄러운 발표일 수도 있다. 어쨌든 머지않아 베인스는 국가대표팀 첫번째 옵션이 되었고 맨체스터 유나이티드의 이적 타깃이 되었다. (물론 통계와는 어떠한 연관성도 없었을 수도 있다. 단순히 베인스의 경기력이 더 향상되었기 때문일 수도 있다)


에버턴에서 해를 거치면서 인상적인 결과들을 만들어 왔기에 모예스가 똑같은 구조를 (에버턴보다 큰 규모 구단인) 맨체스터 유나이티드에서 이어가길 바란 것은 결코 놀랍지 않다. 마찬가지로 에버턴이 위건 애슬레틱의 로베르토 마르티네즈를 선임한 것을 이해할 수 있다. 마르티네즈 역시도 기대 이상의 결과물을 만들어내는 지도자다. 2005년 위건이 프리미어 리그로 승격한 이후, 위건은 매시즌마다 유력한 강등 후보로 손꼽혔다. 승격 이후 계속해서 위건은 20개 클럽 중에서 가장 낮은 수익을 기록했고 가장 낮은 평균 관중수를 기록했다. 심지어 위건의 트레이닝 그라운드는 노동자 클럽을 살짝 개조한 형태에 불과하다. 그러나 어쨌든 그들은 2013년까지 계속 살아남았다. 비록 2013년에 강등 당했지만 그 아픔은 FA컵 결승에서 맨체스터 시티를 상대로 승리하면서 어느 정도는 완화되었다.


시즌 막바지에 지속적으로 보여준 위건의 탄력성은 젊고 진보적인 감독 마르티네즈의 공이 컸다. 그는 전술 구성에 상당히 열중하는 감독이다. 축구의 데이터화에 대해 언급하고 있는 저서 <The Numbers Game> 에는 마르티네즈가 집에서 경기 분석하는 것에 대해 언급한다. 그의 집에는 60인치 터치 스크린 TV가 있는데 여기에 마르티네즈 감독은 프로존(Prozone)의 퍼포먼스 분석을 위한 선수 트래킹 소프트웨어를 설치했다. 그는 이 기계를 통해 경기를 돌려보는데 특히 패배한 경기는 10번 이상을 돌려보면서 피치 위에서 무슨 일이 일어났던 것인지 체크를 한다. 분석을 마친 마르티네즈의 해답은 결코 평범하지 않으며 동시에 매우 창조적이다. 잉글랜드 대다수 클럽들은 기본적인 4-4-2 포메이션을 선호하지만 마르티네즈 감독 지휘 아래 위건은 4-3-3과 3-4-3, 4-2-3-1을 넘나들었다. 즉, 굉장히 진보적인 생각을 지닌 마르티네즈는 에버턴 감독으로 아주 적합한 인물이었던 것이다.


마르티네즈를 에버턴의 훈련장 핀치 팜에서 만날 수 있었다. 리버풀 교외에 위치한 곳이지만 시설은 최신식이라고 불러도 손색이 없을 수준이었다. 그러나 티 레이디(tea lady)가 돌아다니며 차와 비스킷을 권하는 아주 친절한 분위기가 흐르는 곳이기도 했다. 마르티네즈는 스카우팅팀의 케빈 리브스(Kevin Reeves), 스티브 브라운(Steve Brown)과 같이 있었고 우리 모두는 리브스의 사무실에서 앉아 대화를 진행했다. 책상에 iMac 하나 있는 사무실은 사실 앞에서 먼저 언급했던 제임스 스미스가 맨체스터 유나이티드로 떠나기 이전에 사용했던 곳이라고 한다. 이제 막 리브스가 정착한 사무실이라는 것이다. 리브스는 한 때 영국 내에서 가장 비싼 선수이기도 했다. 1980년대 "자신이 바로 최초의 £1.25m 이적료를 기록한 선수" 라고 자랑스럽게 말하는 리브스는 마르티네즈를 따라 위건에서 에버턴으로 왔다.


이들은 막 훈련을 마치고 왔다. 과연 경기를 준비하기 위한 트레이닝에서 얼마나 많은 수치의 데이터를 수집했을까? 마르티네즈는 "피치 위에서 발생하는 모든 발걸음 하나 하나가 측정되고 있다. 매 트레이닝 세션마다 우리는 GPS와 심박수를 측정하는 기계를 통해 선수들을 관찰한다. 피지컬적인 포인트에서 가장 중요한 데이터이기도 한 스프린트 횟수, 스프린트 거리, 선수가 고강도 움직임을 얼마나 보여주는가 등을 측정한다. 우리는 시즌을 소화하면서 이러한 데이터들을 관찰하며 선수들에게 충분한 휴식이 제공되고 있는지 알아보기 위한 지표로 활용한다." 라고 말한다.


에버턴은 4가지 분야에 대한 선수들 데이터를 수집한다 : 테크닉(technical), 전술(tactical), 피지컬(physical), 심리적(psychological). 특히 먼저 언급한 3가지 분야에서 데이터가 차지하는 비중은 상당히 중요하다. 아주 기본적인 수준에서 이야기하자면, Opta나 프로존같은 회사는 경기에서 일어나는 선수들의 모든 동작을 다양한 각도의 카메라 영상으로 담아 코치진에 제공하고 그들은 이를 선수 퍼포먼스 분석에 활용한다. 아마도 에버턴 코치진은 선수들이 더 많은 숏패스를 시도하는 것을 선호할지 모른다. 특히 마르티네즈가 지도하는 팀에서 말이다. 더욱 근면성실하게 볼 소유권을 유지하려는 모습을 보여주길 원할거다. 이처럼 세부적인 피드백은 몇몇 클럽들에선 9세 이하 팀에서부터 그 위로 모두 활용되고 있을지도 모른다. "선수 개인의 퍼포먼스를 확인할 수 있는 다양한 기술들이 갖춰졌고 선수의 플레이에서 특정한 한 단면만 골라서 그 능력에 대해 측정을 할 수 있다. 믿을 수 없는 수준이다." 라고 마르티네즈가 말한다. 두명의 분석관은 다가오는 에버턴 1군의 일정에 맞춰 상대팀 자료를 수집한다. 상대팀이 치른 최근 6경기를 지켜보고 프로존에서 경기 데이터를 확보해 자신들이 지켜본 것과 실제 데이터를 합쳐 분석을 펼친다. 스카우팅에 관련해서는 리브스와 브라운이 유럽 전역에 파견된 10명의 스카우터들과 연락을 취하며 ProScout7 데이터베이스를 주시한다. 이 ProScout7 데이터베이스는 130개국 130,000의 선수에 대한 프로필이 수록되어 있다.


마르티네즈는 볼소유권 퍼센티지, 상대 페널티 박스 내에서 패스 성공률같은 기록에는 모순이 존재하며 대다수의 스탯이 무의미하다고 주장한다. "우리가 가장 피해야할 위험은 데이터의 홍수에 침몰되어 데이터가 경기를 펼치는 것에 영향을 주도록 내버려두는 것이다. 이렇게 생각해보자. 한 선수는 10번의 슈팅을 시도해 10번의 유효 슈팅을 기록하지만 득점이 없다. 반면에 다른 한 선수는 10번의 슈팅을 시도해 단 1번의 유효 슈팅을 기록하지만 단 1번의 슈팅이 골키퍼가 막을 수 없는 곳을 향한다고 하자. 누구의 스탯을 더 선호해야만 하는가?"


마르티네즈가 처음으로 이러한 맹점을 지적한 것은 아니다. 그는 통계(stats)과 계량(metircs)의 구분을 하고 있는 것인데, 보통 무의미한 통계는 체계적인 분석을 통해 계량화되고 이렇게 계량화된 통계는 선수와 팀의 퍼포먼스를 분석하는데 있어서 측도가 될 수 있다. 마르티네즈가 이런 관점을 가지고 있다는건 놀라운 일이다. 왜나면 위건에서 40세의 나이에도 선수 생활을 유지하던 그가 맨체스터 대학에서 경영햑 & 마케팅 석사 학위를 취득했기에 당연히 이러한 분석법에 대해서 열렬한 신봉자일 것이라 생각하기 쉽다. <The Numbers Game> 에는 마르티네즈 감독이 '영웅'으로 묘사되어 있다. 책의 공동 저자인 크리스 앤더슨과 데이비드 샐리는 위건 감독으로 마르티네즈가 이뤄낸 업적을 높게 평가하며 그의 축구를 '게릴라식 축구'라고 표현했다.


마르티네즈는 특히 이적 타깃을 선별하는데 있어서 데이터를 활용하는 것에 부정적인 입장을 취하고 있다. 선수의 유용성이 영입순간 확실치 않은 선수를 발굴해내는 머니볼을 믿지 않는다. 마르티네즈는 이런 시도에 대해 굉장히 부정적이다. 아르센 벵거가 1경기에서 14km를 뛰어다니는 마티유 플라미니의 통계 기록으로 그를 영입한 것은 아주 유명한 일화이다. 리버풀이 당시 이사직을 담당하고 있던 다미앙 코몰리 아래서 2011년 조던 헨더슨, 스튜어트 다우닝을 영입했던 것도 마찬가지다. 리버풀이 두 선수 영입게 큰 돈을 투자한 것은 그들이 전방 1/3지점에서 상대의 소유권을 뺏어내는 기록이 높았기 때문이다.


마르티네즈와 그의 수석 스카우터 리브스&브라운은 에버턴이 선수를 데려왓을 때, 사람들이 그 선수를 영입한 이유를 통계 때문이라 말하는 것이 굉장히 우스꽝스러운 일이라 말한다. "우선 선수를 보고 선수와 사랑에 빠져야만 한다. 선수를 지켜보게 되면 어떻게 워밍업을 하는지, 주심에게 어떤 방식으로 어필을 하는지, 기회를 놓친 이후에 동료들에게 어떻게 말을 전하는지, 세레머니 방식, 득점을 기록했을 때 동료들이 어떤 반응을 보이는지 등을 모두 확인하기 마련이다. 물론 데이터는 에러의 발생 가능성을 줄여줄 것이다. 그러나 여전히 결정은 감정, 직감이 내리는 것이다."


마르티네즈는 선수의 성패 여부에서 가장 중요한 부분을 차지하는 것은 심리적인 부분이라고 말한다. 선수의 심리적인 부분은 통계와 통계적 접근법이 다가가기 어려우며 신뢰할 수 없는 영역이기도 하다. 에버턴은 잠재적인 영입 대상에 대한 모든 뉴스 리포트를 살필 것이고 선수의 성향 파악을 위해 지인들과 접촉을 시도할 것이다. 어떤 클럽은 선수의 개인 페이스북, 트위터 계정까지 확인할지 모른다. 그러나 최종적인 결정은 언제나 도박이다. 과연 우리는 이런 상황들에서 어떻게 선수들이 반응할지 예측할 수 있을까? : 머지사이드 더비, 시간은 93분. 안필드에서 콥들을 앞에 두고 페널티를 차야하는 상황에 선수는 어떤 반응을 보일 것인가? 만약 해외에서 슈퍼스타를 데려왔지만 영어를 배우는걸 어려워하고 아내가 고향으로 돌아가길 원하는 상황이 발생한다면? 마르티네즈는 이런 가능성에 대해 경고한다. "축구 선수들은 일주일에 딱 1번 축구 선수일 뿐이다. 그 외의 시간은 선수들도 사람이고 아버지이자 한 여자의 남편이다. 데이터는 이런 것들에 대해서는 알려주지 못한다."


축구에서 데이터를 활용하는 것이 무결점 그 자체라고 생각하는 사람은 없으나 데이터 활용은 점차 정교해져가고 있고 사람들은 점차 데이터 활용을 적극적으로 시도하려고 한다. 이러한 시도를 최초로 한 아버지는 영국공군(RFA) 중령이자 회계사였던 찰스 리프(Charles Reep)로 1950년 3월 처음으로 첫번째 경기를 기록에 남겼다. 그는 1990년 중반까지 총 2,200경기를 분석했고 1경기 데이터를 남기는데 소요된 시간은 약 80시간이었다. 때로는 벽지 두루마리에 기록을 해야할 때도 있었다. 리스 말고도 다른 선구자가 있다. 그 이름은 바로 발레리 로바노브스키다. 디나모 키예프의 감독이자 1970년대부터 2002년까지 소련의 감독이었던 그는 컴퓨터 프로세서가 팀버스처럼 거대한 크기던 시기부터 컴퓨터가 축구를 바꿔놓을 수 있다고 생각했다. 꼼꼼한 경기 준비와 과학적인 스카우팅으로 유명세를 떨친 그는 "경기에서 실수 빈도가 15~18% 이하인 팀은 무적이다."라고 말했다.


리프와 로바노브스키의 연구는 한 인물에게 큰 영감을 주었는데 아마 이 사람이 거론될 것이라고 여러분들은 생각조차 못했을 것이다 : 그 이름은 바로 샘 앨러다이스다. 선수시절 앨러다이스는 1983시즌을 플로리다의 템파 베이 로우디스에서 보내고 있었다. 비록 11번의 경기 출전밖에 기록하지 못했지만, 축구팀은 NFL의 템파 베이 뷰캐니어스와 같은 훈련 시설을 사용하고 있었다. 앨러다이스는 템파 베이의 경기 준비 과정과 통계에 심취한 그들의 준비 방식에 깊은 인상을 받는다. 1990년대 초 감독으로 새출발을 시작한 그는 비슷한 모델을 축구계에 들여놓을 수 있는가에 대해 고민했다. 그러나 기술의 발전이 더 우선적으로 뒷받침 되어야만 했다.


Opta는 경영 컨설턴트 집단이 세운 회사다 : 1996년 Opta의 축구 통계 첫번째 구매 고객은 스카이스포츠와 더 옵저버(the Observer)였다. 그런데 Opta가 선점하고 있는 시점에 본래 마사지용 팔걸이 의자 배송업을 운영하던 프로존이 이 사업에 뛰어들었다. 프로존의 회계 팀장 폴 보아나스는 "여러분들이 고속도로 휴게소에서 £1을 지불하고 사용하던 검정색 의자가 우리 회사의 제품이었습니다." 라고 말한다. 프로존 사업에 초창기 관심을 보인 인물 역시 우리의 예상 범위를 벗어나는 인물이다. 그 주인공은 당시 더비 카운티의 코치던 스티브 맥클라렌이다. 그는 프로존의 의자를 좋아했지만 선수들은 매 트레이닝 세션 이후 15분 넘게 의자에 앉아있어야 했던걸 싫어했다. 그래서 그는 프로존에 이런 요청을 했다. "선수들이 의자에 앉아있는 시간동안 경기 영상을 볼 수는 없습니까?"


맥클라렌은 맨체스터 유나이티드 수석 코치를 거쳐 잉글랜드 감독 자리까지 맡았고 당시 앨러다이스는 볼턴 원더러스의 감독이었다. 둘은 프로존의 초창기부터 고객이자 가장 열렬한 구매자이기도 했다. 특히 빅샘은 새로운 소프트웨어에 열렬한 지지를 보냈다. 그는 젊은 스포츠과학 대학원생들을 고용해 볼턴의 경기 스타일을 구성하기 위해 비디오 분석을 요구했다. 이에 분석팀은 상대보다 더 많이 뛰고 더 빨리 뛰어다니는 클럽은 어떤 팀이건 80%의 확률로 이기거나 비길 수 있다는 결론을 내렸다. 또한 볼턴은 'pomos'(positions of maximum opportunity, 최적의 기회를 만들 수 있는 위치)를 발견해 그곳을 타깃으로 선정하여 스로인, 코너킥, 프리킥 역습을 반복적으로 시행했다. 그 결과 볼턴은 팀 득점의 절반 가까이를 세트 피스로 만들어냈고 이는 프리미어 리그 평균치를 상당히 높은 수준으로 상회한다. 앨러다이스는 타팀에서 적응하지 못한 선수들, 한물 간 과거의 선수들, 외국 용병들을 바탕으로 팀을 만들었고 노장 개리 스피드가 이들을 이끌었다. 2004년 이적료 없이 볼턴에 합류한 스피드는 당시 35살이었으나 경기당 12km를 소화하며 평균적으로 80% 이상의 패스 성공률을 기록하면서 여전히 자신이 쓸모있다는 것을 증명해냈다. 그로부터 그는 4시즌간 볼턴의 부적이 되었다.


빅샘의 볼턴은 일상적인 논리에 도전했다 : 볼턴은 2003년부터 2007년까지 매시즌 8위 이내의 성적을 기록했고 UEFA 본선 무대에는 2차례 진출했다. 그러나 'pomos'는 데이터 혁명의 사전에 등록되지 못했고 현재 데이터 활용은 더욱 진화하여 빅샘의 아이디어는 구식이 되었다.


어쩌면 축구의 데이터 혁명에 관한 앨러다이스의 가장 위대한 공로는 그가 영향을 미친 인물들일지도 모른다. 볼턴에서 앨러다이스와 함께한 인물들은 현재 세계 축구계의 야심찬 클럽들의 분석팀을 이끌고 있다 : 에드 설리(Ed Sulley)는 맨체스터 시티의 퍼포먼스 수석 분석장이며 가빈 플레이그(Gavin Fleigh)는 역시 맨체스터 시티의 수석 기술 스카우터이다. 데이브 팔로우스(Dave Fallows)는 리버풀의 선수 선발에 있어서 가장 높은 직책을 담당하고 있다. 이들은 마누엘 펠레그리니, 브랜단 로저스만큼이나 클럽의 미래를 만드는데 있어서 상당한 영향력을 행사할 수 있다.


몇몇 구단에서는 권력 이동이 발생하고 있고 그러한 움직임 중심에는 데이터 분석이 있다. 프리미어 리그 클럽 감독의 평균 수명이 1년이 조금 넘는걸 생각한다면 (올시즌에 벌써 7명이 경질되었다) 선수 선발을 비롯해 클럽의 장기적인 전략 요소를 모두 감독에게 일임한다는 것은 굉장히 시대착오적인 발상이라고 본다. 


"클럽 입장에서 가장 완벽한 모델은 모든 것이 갖춰진 상황에서 감독을 자리에 앉히는 것 입니다. 감독에게는 같이 일할 스태프 2명을 데리고 오도록 허락하는 것 뿐이죠. 아마 이것이 클럽이 바라는 가장 이상적인 상황일 것 입니다." 프로존의 보아나스(Boanas)가 말한다. "감독의 평균적인 수명은 굉장히 짧아지고 있습니다. 따라서 그들은 이렇게 생각하게 되겠죠. '내가 왜 클럽의 미래를 계획해야하는데? 난 단지 이곳에 6개월만 머무를 수도 있어. 클럽의 미래를 책임지라는건 완전 헛소리야!'라고 말이죠. 따라서 감독들은 어린 선수들을 영입하는 대신 검증된 기록과 같이 일해본 경력이 있는 31살 선수를 데려오게 됩니다. 아주 단기적인 관점으로 일을 처리하는 것이죠."


<The Numbers Game>의 저자이자 뉴욕의 코넬 대학 정치 과학 교수인 크리스 앤더슨은 이러한 생각에 동의한다. "동기부여는 엄청 중요합니다. 올바른 동기부여란 구단을 다음주 토요일 이후에도, 나아가 올 시즌 이후에도 건강하게 유지시킬 수 있습니다. 에버턴의 데이빗 모예스나 아스날의 아르센 벵거처럼 감독이 장기집권하는 곳은 감독의 목표와 구단의 목표가 가깝게 일치하게 됩니다. 그러나 우리가 살고 있는 현실에서 보통 감독은 그러지 못하고 있습니다."


하지만 앨러다이스의 제자들, 영국 축구의 데이터 분석법 사용을 주도하던 사람들이 벽에 부딪히기 시작했다. 그들은 스포츠 과학자이지 수학자가 아니었다. 당시까지는 에버턴에서 일하고 있었던 제임스 스미스는 지난해 11월 아스날의 에미레이츠 구장에서 개최된 <Elite Minds in Sports Analytics Summit>에서 이에 대한 실망감과 축구 클럽에서 분석가가 되는 것이 외로운 일이 될 수도 있다는 것을 아주 잘 전달했다.


"에버턴에서 우리는 GCSE(영국의 중등교육자격시험) 수학 세계에 있을 때가 종종 있었죠. 우리는 한숨을 쉬면서 사무실로 들어가 미친 듯이 노트북을 두드립니다. 우리는 평균을 내고 벤치마크 시험을 하고 막대 차트(bar charts)의 세계에 뛰어듭니다. 현재 우리는 회귀분석 이상의 정교한 작업을 시행하고 있지 않습니다. 하지만 우리는 이것이 앞으로 나아가는 옳은 방식이며 우리가 조만간 목표지점을 향한다고 생각합니다."


스미스는 축구와 야구, NFL같은 미국 스포츠를 비판적인 관점으로 대조한다. "현재 잉글랜드 클럽에서 데이터를 다루고 있는 사람들은 스포츠 과학 대학원생들입니다. 저같은 사람들이죠. 하지만 미국에서는 주로 하버드 법대 출신, MIT에서 컴퓨터공학 석사 학위를 취득한 사람들이 그 자리를 차지하고 있습니다. 잉글랜드 축구의 문제는 스태프들에게 충분한 돈을 투자하지 않는다는 겁니다. 양적으로도 질적으로도 투자가 부족합니다. 어쩌면 우리가 이적료, 선수 주급, 에이전트 수수료 같은 곳에 너무나 많은 돈을 투자해서 돈이 남지 않기 때문일지도 모릅니다. 미쳐버린거죠."


사실 잉글랜드에도 스마트한 수학자들이 축구계에서 일을 하고 있다. 그러나 대다수 클럽들이 아주 전통적인 접근법에 집착하기에 그들은 보통 베팅 회사나, 프로존같은 데이터 생산 회사에서만 직업을 얻을 수 있다. 이런 불균형을 해결하기 위해서 2012년 8월 맨체스터 시티의 케빈 플레이그는 혁신적인 계획안을 발표한다. 그 계획은 MCFC 애널리틱스라 불리는 프로젝트로, 맨체스터 시티는 2011/2012시즌부터 Opta에 의해 수집된 방대한 양의 데이터 기록을 일반인에게 공개했다. 이것은 블로거, 박사 과정의 학생, 축구에 대한 호기심과 흥미를 가진 사람들 중에서 숫자를 가지고 놀고 싶어하는 사람들에게 무기가 될 수 있었다.


MCFC 애널리틱스 실험의 근원은 야구였다. 건물 경비원이자 일과 후 통계 분석으로 야구에 스포츠 혁명을 가져온 빌 제임스는 그런 영감을 불어넣은 사람이다. 플레이그는 사이먼 쿠퍼에게 이렇게 말했다. "우리의 산업에서 빌 제임스를 발견하길 원한다. 빌 제임스에겐 데이터가 필요했다. 그러나 축구계의 빌 제임스가 되고싶은 사람들은 데이터를 가지고 있지 못할 것이다. 왜냐면 데이터를 보유하려면 돈이 필요하기 때문이다."


MCFC 애널리틱스는 1년 후에 끝나지만, 그 프로젝트가 성공적이었는가를 판단하는 것은 굉장히 어려운 일이 될 것 같다. 분명히 사람들은 이번 프로젝트에 관심을 가졌다. 데이터를 공개한지 36시간만에 1,500명 넘는 사람들이 정보를 조회했다. 하지만 여기에는 굉장히 기본적인 데이터들만 공개되었다는 비판도 있다. 하워드 해밀턴 박사(Dr Howard Hamilton)는 자신의 블로그에 '심각하게 부적절한 데이터'라고 표현하기도 했다.


구단은 특정 데이터를 철저하게 숨기려는 경향을 보인다. 특히 그들이 비교 우위를 점하는 정보에서는 더욱 그런 성향을 보인다. 그래서 나는 옥스퍼드 대학 수학과 교수이자 열성적인 아스날 서포터 마르커스 두 사토이(Marcus du Sautoy)에게 더 심도있는 수학적 지식을 갖춘 것이 축구 경기에 어떤 영향을 미치는지 물어봤다. "축구는 사람들 생각보다 훨씬 체스에 가깝다. 클럽의 행동은 랜덤하게 이뤄지는 것이 결코 아니다. 패턴이 존재하기 마련인데 수학의 강점은 모든 행동을 숫자로 바꿔서 패턴을 발견하고 미래의 사건을 예측한다는 것이다. 해지-펀드에서 사람들이 행동하는 것과 본질적으로 비슷한 일이다." 라고 두 사토이가 말한다.


두 사토이는 우리가 피치를 하나의 네트워크, 11명의 선수들을 서로 이어주는 채널을 가진 네트워크로 봐야한다고 말한다. 그는 "이것은 마치 작은 인터넷과 같다"라고 말하는데 바르셀로나처럼 완벽한 예시를 들어보자면, 성공적인 팀은 항상 이러한 연결들을 열어놓을 수 있는 특별한 능력을 가지고 있다. 모든 클럽들이 보다 이론적인 방법을 통해 그런 역학을 분석하지 못하란 법은 없다. 말하자면 더 큰 이득을 취하는 것을 택해야 한다. 두 사토이는 프리킥 상황을 예시로 활용한다 : 왜 수비하는 팀은 항상 키커 앞에 일렬 형태의 벽을 형성할까? 아마도 그러는 이유는 그 방식이 공을 막는데 있어서 가장 효과적인 수비법이기 때문일거다. 하지만 그들은 보다 방법론적인 가정들을 시험해볼 수 있다.


"축구는 믿을 수 없을 정도로 보수적인 종목이다. 다른 사고 방식을 가진 사람들을 수용한다면, 아스날과 리버풀도 충분히 확실한 우승 경쟁력을 가질 수 있다. 만약 벵거 감독이 아스날 벤치에 수학자를 앉혀두길 원한다면, 난 기쁘게 그의 요청을 수락할 것이다." 라고 반쯤 진지하게 말했다.


데이터 분석 가능성으로 인해 우리는 이전보다 휩쓸리기가 쉬워졌다. <Elite Minds in Sports Analytics Summit>에서 또 다른 발표자이자 볼턴 원더러스의 분석 개발팀 수석인 브라이언 프레스티지(Brain Prestidge)는 다음 일화를 말한다. 그는 볼턴의 골키퍼가 상대팀 페널티 키커의 데이터를 공부하기 시작하면서 이전보다 더 페널티킥을 막지 못하게 되었다고 말한다. (지난 2시즌간 선방 확률이 고작 9%) "우리는 인간적인 요소를 완전히 제외하고 생각했습니다. (그건 실수였고) 선수만의 본능을 무시한 것이죠. 그러나 이것이 분석이 어떠한 이점도 없다고 말하고자 하는 것은 아닙니다."


만약 데이터가 축구팀 운영에 더 큰 영향력을 행사한다면, 감독들보다 구단주들로 하여금 그 분야에 더욱 활발한 발전이 이루어지도록 유도할 것이다. 리버풀의 존 W 헨리처럼 머니볼에 깊은 인상을 받아 보스턴 레드 삭스를 운영하고 있는 사람들에게 더더욱 말이다. 선수들 역시도 데이터 활용을 더욱 원할지 모른다. 첼시의 퍼포먼스 시스템 개발부서 수석인 벤 스미스(Ben Smith)는 에당 아자르같은 젊은 선수들이 데이터, 지속적인 피드백과 함께 성장해왔기 때문에 매 경기, 매 트레이닝 세션마다 데이터 분석을 요청할 수도 있다고 말한다. 이는 변화를 완강하게 거부하던 과거 세대와 확실하게 대조되는 모습이다.


감독들은 숫자 놀음하는 사람들이 자신보다 더 감독 일을 잘할 수 있다는 것을 결코 인정하지 않을 것이다. "만약 감독들이 굉장히 정교하거나 분석적인 방법을 시행하고 있다면, 그는 자신이 그런 행위를 하고 있다고 전 세계에 광고하지 않을 것 입니다. 왜냐면 그렇게 이야기하면 감독들 본연의 모습이 더욱 초라해보여지고 감독을 괴짜처럼 보이게 만들겠죠. 축구계처럼 남자들이 주도하는 세계에서 멍청이처럼 보이고 싶지 않을겁니다. 어찌보면 감독 입장에선 그렇게 비쳐지는 것이 최악의 상황인거죠." 라고 벤 스미스가 말한다.


앤더슨은 최근에 프리미어 리그 클럽들이 25명 스쿼드를 24명으로 줄이고 그 남은 1자리에 수학자를 고용해야한다는 주장을 펼친다. 수학자의 주급은 의심할 여지없이 1명의 선수 주급보다 쌀 것이다. 그 어떤 클럽도 앤더슨의 주장을 심각하게 받아들이지 않을 것이다. 나는 핀치 팜에서 마르티네즈에게 맨체스터 시티가 11명의 분석관을 보유하고 있는 것이, 배후에서 상대의 약점을 발견하기 위한 많은 분석가를 고용하는 것이 부럽지 않은지 물어봤다.


"100명과 함께 하면서 '어떻게 그들이 내가 경기에서 승리하도록 도울 것인가?'라고 말하지 않을 것이다. 숫자가 100이든 3,000이든 상관하지 않는다. 그렇게 많은 숫자는 질적 수준을 희석시키는 결과를 만들 것이다. 우리는 우리가 원하는 바를 무엇이든 얻어낼 수 있는 힘을 가지고 있다. 적은 인원에 우리가 실망해야할 필요나 더 많은 자금을 필요로 한다고 생각하지 않는다.  그렇기 때문에 나의 대답은 '아니오'라고 전하고 싶다. 우리는 굉장히 효율적으로 팀을 운영하고 있다고 생각한다." 


축구는 열정의 게임이다. 만약 축구가 계산의 스포츠가 된다면 일부 팬들은 떠날 것이다. 그러나 동시에 데이터의 힘을 부정하는 감독 역시도 상당히 불리한 포지션에 위치하게 될 것이다. 어떤 관점에서 축구의 데이터화는 상당히 긍정적인 발전이다 : 역사적으로 축구는 두터운 지갑을 가진 클럽들의 지배 아래 주도되었다. 분석의 시대가 도래하면서 클럽의 혁신적인 생각을 보상받기 시작했고 주머니 사정이 넉넉하지 못한 클럽들이 데이터화의 발전을 주도하는 동기를 유발한다. 현명함은 돈을 이길 수 있다. 물론 맨체스터 시티같은 경우는 두 분야 모두에서 우위를 점하고 있다.


관중석에 앉아서 경기를 지켜보는 팬들은 앞으로 어떤 관점으로 경기를 바라보게 될까? 교체 선수가 나와서 첫번째 터치로 골을 성공시켰다. 당신은 그 공을 천재적인 교체를 단행한 감독에게 돌릴 것인가? 아니면 철저한 계산을 해낸 퍼포먼스 분석가에게 돌릴 것인가?



출처 : http://www.theguardian.com/football/2014/mar/09/premier-league-football-clubs-computer-analysts-managers-data-winning