by Simon Kuper (원문은 2013년 6월 5일에 작성되었습니다)


지금으로부터 10년 전, 마이클 루이스(Michael Lewis)는 <머니볼, Moneyball>을 출판했다. <머니볼>은 비인기구단 오클랜드 애슬레틱스 단장 빌리 빈(Billy Beane)의 이야기며 그는 새로운 통계를 활용하여 야구 선수의 가치와 경기 전략을 평가했다. 루이스는 흥행하기 어려운 주제를 가지고 출판했지만, <머니볼>은 베스트셀러가 되어 100만부 이상 판매되었다.


지금까지 책이 사회를 바꿔온 경우는 얼마 없었지만 <머니볼>은 달랐다. <머니볼>은 야구의 변화를 유도했고 이제는 농구부터 크리켓까지 공을 다루는 모든 스포츠에 적용되고 있다. 또한 스포츠를 넘어 실생활에도 영향을 주고 있다. 2004년 미국 대선을 앞두고 공화당의 선거 사무장 켄 멜맨(Ken Mehlman)은 사무실 직원들에게 <머니볼>을 읽으라고 지시했다. 그는 <머니볼>이 단순 스포츠만을 이야기하는 것이 아님을 깨달았다. <머니볼>은 숫자를 기민하게 처리함으로써 우위를 가져가는 완벽한 성공 사례이다.  


축구는 오랫동안 숫자가 만들어내는 혁명에 맞서 싸워온 완고한 스포츠로 자리 잡아왔으나 최근에는 축구도 변화하기 시작했다. 크리스 앤더슨(Chris Anderson)과 데이비드 샐리(David Sally)가 출판한 <숫자의 게임, The Numbers Game> 에선 "실생활의 데이터화는 이제 축구 속에 스며들고 있다." 라고 주장한다. 축구는 "지금까지 계속 그렇게 결정해왔어" 라는 이유로 그들의 결정을 합리화 시켰다. 역사적으로 구단은 독재권력을 가진 감독에 의해 지배되었는데 감독 역시 선수 출신이기 때문에 16세부터는 공부와 인연을 끊은 사람이었다. 그런데 이제 구단 내부에서부터 중대한 변화가 일어나고 있다.


<머니볼>과 마찬가지로 <숫자의 게임> 역시 축구계에 급진적인 영향을 행사하고 있다. 독일 태생의 앤더슨은 코넬 정치대학의 교수가 되기 전 세미-프로 축구 선수였다. 공동 저자인 샐리는 하버드에서 투수로 활약한 적이 있고 다트무스 경영대학원에서 행동경제학자로 활약하고 있다. 두 사람은 같이 축구를 시청하면서 축구가 숫자와 애널리틱스 부족 속에서 경기하는 모습에 큰 관심을 보였다.


축구계 숫자 부족을 해결하기 위해 도전한 선구자는 공군 중령 찰스 리프(Charles Reep)다. 그는 파일럿이 아니었고 부대 내에서 회계사 역할을 담당한 인물이었다. 현재 리프는 축구의 "매치 데이터"를 최초로 기록한 사람으로 알려져 있다. 1950년 스윈든 타운 경기를 지켜보면서 리프는 스윈든의 후반전 147회 공격을 기록했다. 굉장히 적은 샘플 속에서 추론한 결과, 리프는 축구에서 공격 시도 중 99.29%가 실패로 돌아감을 주장했다. 리프는 90대 후반까지도 구단에게 이러한 데이터를 제공하는 임무를 담당했다. 그런데 앤더슨과 샐리는 리프가 굉장히 부질없는 행동을 한 것이라 주장한다. 리프는 올바른 축구를 위한 단 1가지 방법이 있다고 가정했고 자신이 그것을 발견했다고 믿었다. 리프는 "공을 길게 차서 상대 진영 가까이 도달하면 경기에서 승리할 수 있다." 라고 주장했다.


하지만 앤더슨과 샐리가 <숫자의 게임>에서 주장하듯, 축구에는 100% 승리할 수 있는 공식이 없고 올바른 플레이에 대한 정답 역시 없다. 서로 다른 팀이라면, 서로 다른 전술을 사용하는 것이다. 리버풀의 위대한 감독인 밥 페이즐리는 이런 말을 한 적이 있다. "롱볼인가 짧은 패스인가가 중요한게 아니다. 그것이 올바른 패스인지가 중요하다."


1990년대 중반부터 컴퓨터 보급이 확산되었고 데이터 혁명은 한 단계 더 도약했다. Opta와 프로존(Prozone)은 축구 경기 통계를 수집하기 시작했고 구단은 자기 팀 선수가 얼마나 많은 패스를 성공시켰는지, 태클을 얼만큼 성공했는지, 몇 km를 뛰어다녔는지 알 수 있게 되었다.


어떠한 산업에서든지 데이터가 사용가능해지면, 모두가 데이터를 사용하게 된다. 하지만 때로는 잘못 활용한다. 미국에서 야구와 선거를 분석하는 네이트 실버(Nate Silver)는 이렇게 말한다. "우주를 진공이 채우고 있는 것처럼, 수많은 데이터 역시 그저 노이즈에 불과하다." 맨체스터 유나이티드의 알렉스 퍼거슨 경은 2001년 야프 스탐을 판매하는데 그 이유는 스탐의 태클 횟수가 줄어들었기 때문이었다. 퍼거슨은 스탐의 기량이 하락하기 시작했다고 생각했다. 하지만 스탐은 이후에도 계속 빅클럽에서 선수 생활을 이어갔다.


태클은 수비수를 올바르게 평가하기 위한 척도가 되지 못한다. 태클은 노이즈다. 위대한 수비수 파올로 말디니는 태클을 거의 시도하지 않았다. 말디니는 상대 선수가 어디로 달려들지 미리 알고 있었고 그 자리에 먼저 가 있었다. 따라서 태클을 할 필요가 없었다. 앤더슨과 샐리 역시 이러한 맹점을 지적한다. 애초 수비수가 먼저 자리를 잡고 있어서 공격 상황이 발생하지 않으면, 개가 짖지 않아도 되는 것(수비수가 태클을 할 필요가 없는 것)이다. 그런데 이것은 매치 데이터로 굉장히 발견하기 어려운 사실이다. 축구 통계는 실제로 발생한 것에 포커스를 둔다. 또한 골과 관련된 것들에 대해 더 많은 포커스를 둔다.


데이터 혁명이 진행되면서 구단은 숫자를 다룰 수 있는 영리한 방법을 찾아가고 있다. 시간이 흐르면서 통계 회의론자수는 줄어들고 있다. 이제는 많은 사람들이 <머니볼>을 읽었거나 브래드 피트가 출연한 영화를 봤을지도 모른다.


그렇다고 축구계 전통주의자들이 물러나는 것은 아니다. 이들은 스프레드시트를 다루는 괴짜들의 침투로부터 자신들의 자리를 지킬 책략을 모색 중이다. (데이터 혁명을 지지하는) 진보주의자들은 자신의 눈으로 본 것을 믿지 않는다. 빌리 빈은 이렇게 말했다. "통계가 아닌 내 눈을 믿어야 한다는 주장을 신뢰하지 않는다. 마술사가 모자에서 토끼를 꺼내는데 나는 그 전에 이미 모자 속에 토끼가 없는 것을 봤다."


데이터 혁명은 계속해서 새로운 사실을 발견하게 해준다. 맨체스터 시티의 애널리스트들과 로베르토 만치니의 의견 충돌이 있었다. 시티의 애널리스트들은 최적의 코너킥은 안쪽으로 휘는 킥(inswinger)이라 주장했고 만치니는 자신의 경험을 바탕으로 그 반대(outswinger)라 주장했다. 만치니는 결국 애널리스트들의 손을 들어줬다. 2011/2012시즌 맨체스터 시티는 프리미어 리그 타이틀을 따냈고 코너킥으로 15골을 넣어 리그에서 가장 많은 코너킥 득점을 기록한 구단이 되었다. 또한 가장 결정적인 득점, 에티하드에서 맨체스터 유나이티드를 침몰시킨 뱅상 콤파니의 골 역시 인스윙 코너에서 시작되었다.


잉글랜드 축구에서는 여전히 감독이 가장 큰 권력을 가지고 있고 데이터를 신뢰하는 감독이 있는 구단이 통계적 혁명을 선도하고 있다. 지금까지는 아르센 벵거, 샘 앨러다이스, 맨체스터 유나이티드의 새로운 수장 데이빗 모예스 정도를 거론할 수 있을 것이다.


지난 3월 에버턴에서 모예스와 대화할 수 있었고 구단의 애널리스트 중 한 명이 이렇게 말했었다. "모예스는 애널리스트 사무실로 와서 끊임없이 질문을 던진다. 다음 상대팀에게 우리의 크로스 공격이 어느 정도의 효율을 가져갈 수 있는가? 상대 미드필더들은 어떤 형태의 패스를 시도하는가? 토트넘의 가레스 베일이 공을 받는 위치는 어떻게 되는가?"


그렇다고 모예스가 전적으로 데이터에만 의존하는 것은 아니다. 데이터는 모예스가 사용할 수 있는 여러 무기 중 하나다. 선수들의 평균적인 연봉 £1.5m으로 30여명의 통계학자를 고용할 수 있고 남들보다 더 많은 정보는 상대적 우위를 확보하게 해준다. 앤더슨과 샐리는 한 가지 주의 사항에 대해 언급한다. "데이터는 감독의 업무를 완벽하게 대체할 수 없다. 데이터를 해석하는 것은 과학을 뛰어넘는 하나의 예술이다."


2004년 무명의 프랑스 미드필더에 대한 통계가 벵거를 깜짝 놀라게 만들었다. 이 선수는 놀랍게도 한 경기에서 14km를 뛰었다. 하지만 '뛴 거리 14km' 만으로 이 선수가 올바른 방향으로 뛰었는지 알 수 없다. 벵거는 그 선수를 관찰하기 위해 직접 움직였고 아주 적은 금액으로 그 선수를 영입했다. 그 선수는 바로 마티유 플라미니다.


<숫자의 게임>은 축구가 "약한 고리"의 게임이라 말한다. 좋은 선수들을 데리고 있는 것이 중요하지만 그것보다 더 중요한 것은 쓰레기같은 활약을 하는 선수를 데리고 있지 않는 것이다. 웨인 루니보다 2011년 플레이오프에서 레딩의 프리미어 리그 승격을 날려버렸던 주랍 키자니쉬빌리 같은 선수들이 더 강하게 경기 결과에 영향을 미친다고 주장한다. 두 사람은 약한 고리를 업그레이드 시키는 것이 슈퍼스타를 구매하는 것보다 팀을 업그레이드시키는 훨씬 좋은 방법이라 말한다. 그럼에도 불구하고 감독, 팬, 저널리스트들은 슈퍼스타를 희망한다.


<숫자의 게임>은 우리의 수많은 통념에 대해 반박한다. 보통 "득점을 한 직후 실점할 확률이 가장 높다" 라고 말하지만 통계는 전혀 아니라고 주장한다. 또한 행운이 경기 결과에 미치는 역할이 상당하다고 말한다. 43,000 경기를 조사한 결과 언더독의 승리 확률은 45.2%다. 다른 스포츠에 비해서 축구는 우세할 것으로 예상되는 팀이 승리하는 경우가 적다. 가장 큰 원인은 골의 희소성이다. 90분 내내 공격할 수 있지만, 상대팀이 운이 좋아 1골 넣으면 패배할 수 있다. 


<숫자의 게임>은 또한 감독을 경질하는 것이 무의미하며 이것은 현대적인 형태로 인간을 제물로 바치는 것과 다를게 없다고 주장한다. 일반적으로 팀 퍼포먼스가 바닥을 찍고 있을 때, 감독이 경질된다. 하지만 평균으로 회귀하는 통계적 성질에 의해 바닥을 찍으면 반드시 정상적인 궤도로 돌아오게 된다. "놀라울 정도로 형편없는 경기력은 단지 일시적인 현상이다. 선수가 부상에서 회복하고 골대를 맞추는 불운이 사라지면 정상 상태로 돌아오게 된다." 라고 두 사람이 이야기 한다.


최근 선덜랜드는 새로운 감독 파올로 디 카니오 아래서 경기력이 향상되었다. 두 사람은 선덜랜드의 경기력 향상이 디 카니오의 파시즘적 업무 때문이 아닌 단순히 평균으로 회귀하는 성질 때문이라 주장한다.


또한 두 사람은 전통적으로 평가절하 당해온 수비수와 골키퍼의 가치가 점차 상승할 것이라 예상한다. 골키퍼와 수비수는 연봉 및 이적시장에서 공격수에 비해 낮은 가치로 평가받았다. 통계는 득점보다 클린 시트가 승리에 기여하는 바가 더 크다고 말한다. 데이터 혁명이 진화할수록 우리는 보이지 않는 기여도(태클하지 않는 말디니 같은)에 대해서도 측정할 수 있을 것이다. 또한 한 선수가 공을 소유하는 시간은 90분 경기 중에서 단 53초에 불과하기 때문에 앞으로 오프 더 볼 상황에 대한 분석이 필요함을 강조한다.


오클랜드 애슬레틱스처럼 혁신은 가난한 구단에서 시작된다. 강팀은 혁신할 필요가 없다. 하지만 약팀은 변화하지 않으면 사망선고를 받는다. 첼시처럼 부유한 구단은 위대한 선수를 구매하는 것만으로도 성공을 이어갈 수 있다. 애널리틱스가 구단의 성공을 도울 수 있다. 하지만 돈 역시 마찬가지로 구단의 성공을 이끌 수 있다.


<숫자의 게임> 부제는 이렇다 : "당신이 알고 있는 축구는 전부 틀렸다." 하지만 우리는 <머니볼>의 파급력만큼 획기적인 변화를 느끼지 못하고 있다. 하지만 부족한 연구는 이제서야 시작이다. 변화의 한 가운데 위치한 선구자들은 막 출발선을 넘어섰고 외부에 있는 사람들은 이제서야 조금씩 변화가 시작되고 있음을 느끼고 있다.




출처 : http://www.newstatesman.com/culture/2013/06/how-spreadsheet-wielding-geeks-are-taking-over-football



축구판 머니볼을 꿈꾸는 미드쉘란

The Guardian 2016. 5. 24. 22:37 Posted by Seolskjaer



브렌트포드의 구단주인 47살 매튜 벤험은 축구 경기 결과를 예측하는 수학 모델을 활용하고 이렇게 수학식을 거쳐서 나오는 결과값들이 이적시장과 피치 위에서의 성과에 아주 중대한 역할을 시행할 것이라 믿고 있다. 그는 미드틸란드에 £6.2m을 투자했고 그의 철학은 미드쉘란에서 실현되고 있다. 


미드쉘란은 킥전문 코치를 영입했고 하프타임 대화에서 통계를 적극적으로 활용하고 있으며 세트피스에 대한 전문적인 분석이 이루어지고 있다. 이에 미드쉘란은 벤험의 사고방식, 통계와 수학으로 인한 의사결정이 자신들에게 큰 이점을 가져다준다고 생각하며 마치 우리에게 잘 알려진 머니볼과 같은 일이 벌어지고 있다고 주장한다. 


지난시즌 미드쉘란이 기록한 득점의 절반 가량이 세트피스 득점이었다. 아틀레티코 마드리드와 맞먹는 수준의 비율이었는데 이는 어시스턴트 매니저인 Brian Priske의 업무 덕분이다. 미드틸란드는 세트피스 연구실을 별도로 설치해두고 있고 여기에는 세트피스에 대한 각종 통계, 비디오 클립등 여러 자료가 존재한다. 여기서 미드쉘란의 세트피스 루틴이 개발된다. "한번은 매튜가 20년 전 코너킥 영향을 Youtube에서 검색해서 보여주더니 이 방식을 다시 한 번 되살려보는 것이 어떻겠냐고 제안을 했습니다. 매튜는 미드쉘란이 진심으로 성공하길 바라고 있습니다." 세트피스 루틴은 이렇게 생성되기도 한다. 


킥전문 코치 Bartek Sylwestrazak은 한 달에 2회 선수들의 킥 영상 분석을 제공하며 개별적으로 연습을 실시할 수 있는 트레이닝 프로그램을 고안한다. 


미드쉘란은 경기를 더욱 객관적인 시선으로 바라보기 위해서 감독에게 정제된 통계 자료들을 제공한다. 미드쉘란의 분석 전문가들은 하프타임 시간과 경기 종료 후 감독에게 통계에 대한 문자 메세지를 넣어준다. 몇가지 용어가 눈에 들어온다. 단순한 기회, 절반 정도의 기회로 득점 찬스를 구분하고 그 찬스의 퀄리티에 따라서 득점 수 예측을 해낸다. 그들의 사고 방식은 이렇다 : 축구에서 골은 굉장한 희소성을 지니고 따라서 놓친 기회, 행운, 심판의 잘못된 판단 등이 다른 스포츠에 비해서 강팀이 자주 미끄러진 경우를 발생시킨다. 골이 적게 나오는 스포츠에서 통계를 활용한 득점량을 명확하게 추정하는 것은 중요하다 할 수 있다.


통계를 활용한 분석 모델은 미드쉘란이 선수를 영입하는데도 적용된다. 22~26세이면서 지난 18개월간 큰 부상 이력이 없는 양발잡이 레프트백을 영입하는데 그들은 데이터 베이스를 활용한다. 최근 들어서 트래킹 데이터까지 축구계에 등장하고 있고 이는 더 큰 효과를 불러오고 있다. 미드쉘란의 이사는 "과거 우리의 스카우터는 자신의 시간의 절반 가량을 선수들 코칭에 투자했어야만 했습니다. 그러나 이제 런던에 숫자를 다루는 분석팀을 보유하게 되었고 그 숫자들은 우리에게 적합한 타깃을 제안해줍니다. 우리는 선수 영입 시 감성에서 벗어나 이성을 활용하고 있습니다." 라고 말한다.




출처 : http://www.theguardian.com/football/2015/jul/27/how-fc-midtjylland-analytical-route-champions-league-brentford-matthew-benham