by Daivd Sumpter

 

통계학적 관점에서 축구 경기 결과의 노이즈(noise)는 신호(signal)만큼 크다. 그래서 글로 쓰는 자세한 매치 리포트와 토요일 밤 TV에서 진행하는 분석이 일치하는 것은 굉장히 어렵다. 결과는 오직 소량의 인사이트(insight)만 제공할 뿐이다. 두팀이 실제로 얼마나 잘 경기를 펼쳤는가를 단순 1경기 결과만으로 알 수는 없다.

 

수학적으로 포아송 분포(Poisson distribution)을 활용하여 이 현상을 즉시 설명할 수 있다. 골은 포아송 분포를 따른다. 각팀은 경기당 평균적으로 1.4골을 기록하며 포아송 분포에서는 평균과 분산의 크기가 동일하다. 따라서 표준편차의 크기는 1.4의 제곱근인 1.18이다. 따라서 노이즈 값이 1.18, 신호값이 1.4 로 노이즈에 비해 조금 클 뿐이다. 

 

만약 수학을 믿지 않는다면 이렇게 생각해보자. 맨체스터 시티는 허더스필드를 상대로, 아스날은 번리를 상대로 경기 종료 직전에 나온 득점으로 가까스로 승리했다. 축구는 골이 적게 나오는 스포츠다. 골이 적게 나온다는 말은 곧 근소한 차이로 승패가 결정된다는 것과 같다. 신호(강팀이 갖는 이점) 는 노이즈(축구에서는 어떠한 일도 발생할 수 있다는 사실) 보다 조금 클 뿐이다.

 

그래서 축구에 대해 분별 있는 글을 작성하기가 어렵다. 대중은 최근 경기 결과에 관심을 둔다. 만약 저널리스트가 "글쎄 그 결과들은 대다수 노이즈에 불과하니까 열광할 이유가 없어" 식의 글을 쓴다면 굉장히 지루할 것이다.

 

기대득점(expected goals)은 한 가닥의 희망을 준다. 기대득점은 각 팀이 생산한 찬스의 퀄리티를 측정한다. 따라서 단순한 득점보다 기대득점이 한 경기 내에서 더 많은 정보를 줄 수 있다. 일반적으로 기대득점은 더 많은 신호를 포함하며 노이즈는 작다.

 

이제 우리는 축구를 주제로 글을 쓸 때, 기대득점을 어떻게 활용해야 하는가에 대한 경험적 규칙을 마련해보고자 한다. 아래 그림은1시즌간의 퍼포먼스 측정 과정에서 노이즈의 크기(y축)가 경기수(x축)에 따라 어떻게 변화하는지 보여준다. 이 결과를 바탕으로 기대득점을 어떻게 활용하여 글을 작성해야 하는지에 대해 이야기 해보고 싶다. 절대적인 기준은 아니지만 충분한 도움이 되리라 생각한다.

 

 

1~2경기 : 실제득점, 기대득점 모두 상당한 크기의 노이즈 값을 갖는다. 따라서 2경기 까지는 무슨 일이 일어났는지, 전술, 선수의 움직임에만 중점을 둔 매치 리포트 작성을 추천한다. 현재의 플레이가 장기적으로 어떤 의미를 갖는지 추측하는 보도는 권하지 않는다. 2경기 만으로 트렌드를 확인할 수 없고, 기대득점 통계로도 트렌드를 확인해볼 수 없다. 펀딧들이 "기대득점 통계 상으로 승리했다." 라고 표현할 수 있지만 그건 실제 스코어 이상의 의미를 가지지 못한다.

 

3~6경기 : 만약 연승 또는 연패를 이어가고 있다면, 3~6번째 경기부터는 그 팀에 대한 명확한 그림을 그릴 수 있다. 여기서부터는 기대득점 활용이 효과가 있다. 이 구간에서 기대득점의 노이즈값은 경기당 0.5골 미만으로 떨어져 실제득점보다 더 많은 인사이트를 제공한다. 만약 기대득점과 실제득점이 정반대 이야기를 하고 있다면, 이 경기는 두 눈으로 확인한 것보다 한팀이 훨씬 나쁜 (혹은 좋은) 결과를 받았다고 말해주어야 한다.

 

7~16경기 : 이 구간은 기대득점 저널리즘에서 가장 흥미로운 구간이다. 이제 실제득점도 합리적인 퍼포먼스 측정도구가 되었다. 행운이 10경기 넘게 따라주긴 어려우며 팀이 정말로 형편없지 않는 이상 10경기 연속으로 나쁜 결과만 받아들이진 않는다. 만약 기대득점과 실제득점이 서로를 부정한다면, 두가지 방법을 비교하여 이야기를 풀어가면 된다. 올시즌 번리가 그 예시라 할 수 있다. 번리는 굉장히 낮은 기대득점 값을 기록 중인데, 결과는 정말 잘 얻어내고 있다. 두가지 통계의 괴리 현상을 설명할 요인을 발견해내는 것은 충분한 가치가 있는 일이다.

 

17경기 이후 : 16경기 이후부터 기대득점의 노이즈값과 실제득점의 노이즈값 차이는 경기당 0.1골에 불과하다. 이제 실제값과 예측값의 차이는 작아졌고 이제부터는 기대득점 예측모델이 틀릴 수 있다는걸 무시할 수 없다. 기대득점은 수학적 모델이다. 수학적 모델은 결코 현실이 아니다. 하지만 실제 기록된 득점이 현실이다. 만약 경기당 0.1골의 우위를 가져올 선수, 감독 혹은 멘탈리티가 있다면 이제는 기대득점보다 실제득점을 활용하는 것이 낫다. 시즌이 진행될수록 기대득점 테이블의 의미는 줄어들게 된다. 따라서 이 구간부터는 실제 기록된 득점에 집중해야 한다.

 

(중략...)

 

빨간 커브는 경기당 1.4골이 기록되는 실제 득점에 기반하여 득점의 에러값(노이즈)을 표현한 그래프다. 에러가 1.4/n의 제곱근 값에 비례한다고 가정했고 여기서 n은 경기 수를 의미한다. 포아송 분포의 신뢰구간을 측정할 수 있는 방법은 최소 19가지가 존재하는데 여기서 가장 간단한 방법을 쓰기로 했다. n의 크기가 커질수록 훨씬 믿을 수 있는 값을 제공한다.

 

파란색 커브는 올시즌 현재까지의 기대득점 통계를 바탕으로  득점의 노이즈를 표현한 그래프다. 기대득점 모델에서 분산의 크기가 0.61로 나왔다. 따라서 여기에서는 에러의 값을 0.61/n의 제곱근에 비례한다고 가정했다. 마찬가지로 여기서도 n은 경기 수를 의미한다. 분산의 추정값인 0.61은 결코 완벽한 값은 아니다. 각자의 방식으로 분산을 추정할 수 있으며, 그에 따라 기대득점 모델의 그래프 모형은 달라질 수 있다.

 

 

 

출처 : https://medium.com/@Soccermatics/should-you-write-about-real-goals-or-expected-goals-a-guide-for-journalists-2cf0c7ec6bb6

 

 

 

   




by David Sumpter


우리는 공격 포지션에서 활약하는 선수들에게 열광하지만, 축구는 수비수와 골키퍼의 활약으로 승리를 만들 수도 혹은 우승을 만들어낼 수 있다. 올시즌 첼시는 굉장히 효율적인 공격을 선보일 뿐만 아니라 단 17실점에 그치는 탄탄한 수비를 자랑하고 있다. 2위를 달리고 있는 토트넘 핫스퍼는 단 16실점만 허용했다. 리그 1,2위를 달리고 있는 이들의 실점 수는 29골, 28골, 30골을 허용한 맨체스터시티, 아스날, 리버풀의 기록과는 확실히 대조된다.


이미 우리는 기하학적 접근을 통해 슈팅을 시도할 수 있는 최적 포지션에 대해 논의했었다. 박스 중앙에서 시도하는 슈팅일 때, 박스 바깥에서 시도하는 슈팅 & 사선 방향에서 시도하는 슈팅보다 훨씬 많은 골을 기대할 수 있다.


이번에는 슈팅을 허용하는 입장을 살펴볼 것이며 등고선 선도(contour plot)를 활용할 것이다. 아래은 상대에게 실점을 내줄 확률에 대한 등고선을 나타내는데 왼쪽이 프리미어 리그 20개 구단의 평균값, 오른쪽이 첼시의 기록을 표현한다.






첼시는 다른 프리미어 리그 구단들과 비교했을 때, 사선 방향 슈팅이 실점으로 연결될 확률을 잘 막아내고 있다. 첼시의 실점확률 30% 등고선은 리그 평균보다 훨씬 폭이 좁다. 또한 첼시가 리그에서 슈팅을 적게 내주는 3번째 구단(경기당 7.25회 허용)이라는 점까지 고려하면, 첼시가 극히 적은 실점만 허용한걸 이해할 수 있다.


아래는 극단적인 등고선을 기록하고 있는 리버풀과 맨체스터 시티의 자료다. 









두팀의 실점확률 등고선은 리그 평균보다 폭이 넓다. 특히 리버풀은 정면에서 시도되는 슈팅에 취약하다. 리버풀은 현재 경기당 슈팅 허용수가 6.29회로 20개 구단 중 가장 적은 슈팅을 허용하는 구단이다. 그럼에도 불구하고 30% 실점확률 등고선 범위가 저렇게 넓다는건 골키퍼가 리버풀의 취약 포지션이라는걸 이야기한다. 맨체스터 시티 역시 마찬가지다. 맨체스터 시티 역시 등고선의 범위가 너무 넓다.






헐 시티는 20개 구단 중 페널티 박스 내 슈팅수 허용대비 실점이 적은 팀이다. 토트넘 핫스퍼 역시도 허용하는 전체슈팅 수에 비해 실점이 적은 구단이다. 스퍼스의 등고선 형태는 굉장히 독특한 모양을 형성하고 있다. 공통적으로 두 구단은 리그 평균에 비해서 상대의 슈팅을 골키퍼가 잘 막아내고, 수비수들이 몸으로 방어하고 있다고 할 수 있다.


리버풀과 맨체스터 시티가 기대값보다 더 많은 실점을 기록하는데 3가지 가능성을 언급할 수 있다 : '불운', '형편없는 수비','형편없는 골키퍼'. 반대로 헐 시티와 토트넘 핫스퍼가 기대값보다 훨씬 적은 실점을 기록하는데 '행운','좋은 수비','좋은 골키퍼'가 영향을 미쳤다고도 볼 수 있다. 


펩 과르디올라와 위르겐 클롭은 리그 평균과 큰 차이를 보인다는 사실을 진지하게 받아들여야 한다. 클라우디오 브라보는 평균적인 슈팅까지 골로 허용했고 리버풀은 헐 시티 원정에서 앞서 언급한 바로 그 취약 지점에서 2골을 내줬다. 게다가 두팀은 시즌 내내 같은 문제를 해결하지 못해 발목을 잡히고 있다. 하지만 골키퍼들 못지않게 수비수들도 더 잘해줘야한다. 확률이 높은 구역은 어느 골키퍼나 다 막기 힘든 곳이다. 따라서 수비수들은 확률이 높은 지점에서 슈팅이 시도되기 전에 미리 상대 선수를 차단해줄 필요가 있다.




출처 : https://medium.com/@Soccermatics/which-team-has-the-best-defence-in-the-premier-league-acf0c116105e#.xqi0a4bn6



 

 


by David Sumpter


경기를 제대로 분석하기 이전까지 나는 공을 지배하는 것이 축구라 생각했지만, 사실 그렇지 않았다. 축구 전술은 공간을 지배하고 창출하기 위한 것이다. 물론 선수들은 공을 패스하고 받는 능력이 좋아야한다. 다만 이것은 선수 개인 능력의 영역이다. 한 순간에 22명의 선수들 중에서 공을 가질 수 있는 선수는 단 1명 뿐이니 개인 기술은 분명히 중요하다. 하지만 집단적인 수준에서 볼 때, 나머지 21명의 선수들은 공간을 사용할 줄 아는 능력이 있어야 한다.


공간을 만들어내는 과정 속에 숨겨진 수학적 과정을 알아보기 위해 공간을 활용하는데 있어서 가장 완벽했던 팀, 2010/2011시즌의 바르셀로나를 예시로 삼고자 한다. 바르셀로나 팀의 중심은 리오넬 메시지만 바르셀로나는 메시 주변에도 정말 뛰어난 선수들이 많은 팀이었다. 챠비, 안드레스 이니에스타, 페드로는 역대 최고의 팀인 바르셀로나가 공간 창출에 있어 귀신같은 팀이 되는데 큰 역할을 했다. 이들은 메시가 뛰어다닐 수 있는 공간을 만들었고 이는 바르셀로나의 경기 스타일을 표현하는 다이어그램을 통해서도 확인할 수 있다. 아래 그림에서 회색점이 바르셀로나 선수들이고 흰색점은 파나티나이코스 수비수들을 의미한다.

 

 

 

 


 

각 점을 연결하는 선을 연결하면 델로네 삼각분할(Delaunay triangulation)을 할 수 있다. 델로네 삼각분할을 통해 우리는 가능한 패스 길을 시각화할 수 있다. 바로 위에 있는 그림에서 우리는 메시가 선택할 수 있는 패스옵션이 다양하다는 것을 확인할 수 있다. 이 그림이 묘사하고 있는 상황에서 메시는 챠비에게 공을 연결했다.

 

 

 

 


이번에는 보로노이 다이어그램(Voronoi diagram)을 통해 우리는 바르셀로나가 어떻게 공간을 분할하는지 확인할 수 있다. 각 점선으로 만들어진 다각형은 바르셀로나 선수들이 차지하고 있는 공간을 표현한다. 메시가 챠비에게 패스를 연결하는 순간, 파나티나이코스 선수 2명이 바르셀로나 선수 2명에게 가깝게 붙어있었고 그 결과 바르셀로나는 이후 더 쉽게 동료에게 패스를 연결할 수 있었다. 공을 다루는 것뿐만 아니라 기하학적으로 정교하게 포지셔닝을 해야 패스를 시행할 수 있다.


이제는 모든 구단이 트래킹 데이터를 사용하며 적어도 10초 단위로 선수들과 공의 위치 데이터를 수집한다. 따라서 이제는 거의 모든 순간마다 보로노이 다이어그램을 사용할 수 있다. 이를 통해 우리는 공격하는 팀 선수들이 공간을 만들어가는 과정, 수비하는 팀이 공격팀의 공간을 죽이는 과정을 볼 수 있다.

 

 

 

 

이 영상에서 우리는 킥오프 순간부터 빨간팀이 어떻게 압박을 시행하는지, 어떻게 실수를 유도하는지, 공의 소유권을 어떻게 되찾아오는지 확인할 수 있다. 빨간팀은 상대에게서 자유로운 미드필더 1명을 만들어냈고 득점 기회를 만들어내기 전까지 패스를 여러번 주고받았다. 파랑팀 입장에서는 왜 상대팀 선수에게 그토록 넓은 공간을 내줬는지 연구해봐야할 것이다.


보로노이 다이어그램 뿐만 아니라 다른 자동화된 방법을 통해 공간을 점유하는 과정을 측정할 수 있으며 이것은 오늘날 감독들이 경기를 분석하는 방법 중 하나다. 펩 과르디올라는 상대가 내주는 공간을 사용하기 위해 끊임없는 연구를 하고 있다. 과르디올라는 바르셀로나를 상대하는 팀이 피치 중앙에서 강한 싸움을 걸어오자 이후 바이언에서는 측면에서부터 공간을 만들어냈다.


이러한 분석 기법들은 여전히 초기 단계에 머물러있다. 컴퓨터를 사용한 분석은 과르디올라를 비롯해 여러 감독들이 공략할 빈 공간을 찾게 만들 것이다. 마찬가지로 수비하는 팀 입장에서 그들이 놓치고 있는 공간들도 알려줄 것이다.




출처 : https://www.nordicbet.com/en/blog/football/the-geometry-of-attacking-football




by David Sumpter


2015/2016시즌 맨체스터 유나이티드에서 폴 포그바의 중요성에 대해 의문을 제기하는 사람은 바로 아래 첨부되는 이미지를 한 번 봐야한다.





이것은 맨체스터 유나이티드가 번리를 상대로 0:0 무승부를 기록한 날의 패스 네트워크이다. 빨간 점은 선수를 나타내며 각 점의 위치는 선수들이 공을 주고받은 평균적인 위치를 의미한다. 각 점들을 연결한 회색 선은 2명의 선수 사이에서 성공한 패스의 횟수를 의미한다. 즉 선이 두꺼울수록 많은 패스를 주고받은 것이다. 가장 두꺼운 선은 바로 포그바와 즐라탄 이브라히모비치 사이에서 시행된 패스다. 둘은 총 28차례 공을 주고받았으며 포그바가 즐라탄에게 패스한 횟수는 16회, 그 반대는 12회였다.


포그바의 지배력이 이 경기에서만 특출났던 것은 아니다. 아래는 헐 시티를 1:0으로 이겼을 때의 패스 네트워크다. 이 때 역시 마찬가지로 포그바는 맨체스터 유나이티드의 패스 연결에 가장 많이 연관된 선수였다. 







이번에는 맨체스터 유나이티드가 패배한 날의 패스 네트워크를 살펴보자. 왓포드에게 3:1로 패배한 날의 기록이다.






프리미어 리그 경기에서는 평균적으로 800~1100회의 패스가 시행된다. 지금까지 살펴본 패스 네트워크는 팀이 어떻게 경기를 펼치는가에 대해 시각화한 자료로 유의미하다 할 수 있다. 우리는 맨체스터 유나이티드에서 포그바가 굉장히 중심적인 역할을 수행하는 것을 알 수 있었다.


지금부터는 다른 구단의 패스 네트워크를 살펴보자. 아스날과 왓포드 경기에서 아스날의 패스 네트워크다. 





아스날과 맨체스터 유나이티드의 차이는 2가지를 이야기할 수 있다. 우선 아스날은 맨체스터 유나이티드보다 더 중앙 지향적이다. 둘째 아스날은 맨체스터 유나이티드보다 한 선수에게 집중되어있지 않다. 아스날의 패스는 팀 전체에 걸쳐 아주 골고루 분배되어 있다. 마찬가지로 왓포드를 상대로 인상적인 승리를 거둔 리버풀의 패스 네트워크를 살펴보자.





아스날과 마찬가지로 리버풀 역시 한 선수에게 집중하지 않는 축구를 구사하고 있다. 팀 전체가 동등한 비중을 가지고 패스 연결에 참여하고 있다. 


수학을 사용하는 사회학자 토마스 그룬드 교수는 2006~2008년 사이의 프리미어 리그 경기를 대상으로 한 가지 연구를 진행했다. 그의 주장은 이러하다 : 일반적으로 선수들의 패스 네트워크가 불균형한 팀은 패스 네트워크가 균형잡힌 팀보다 성적이 낮다.


(패스 네트워크가 골고루 퍼진) 아스날과 리버풀은 왓포드에게 승리했지만 (평소 포그바에게 집중된) 맨체스터 유나이티드는 왓포드에게 패배했다. 이미 앞선 글에서도 누누히 강조했지만 단 1경기 스코어에 지나치게 큰 비중을 두지 않아야 한다. 


다만 폴 포그바에게 과하게 의존하는 맨체스터 유나이티드의 '잠재적인' 약점에 대해서는 논의를 해볼 수 있다. 왓포드 전에서 포그바는 총 98회 패스를 주고받았다. 한편 앙토니 마시알과 38분 경 그를 대신해 투입된 에슐리 영의 기록을 합쳐도 총 45회에 불과했다. 세계에서 가장 비싼 선수인 포그바는 엄청난 기대를 받고 있는데 감독과 동료 선수들도 그에게 마찬가지 수준의 기대를 하는 것 같다.맨체스터 유나이티드의 대다수 경기에서, 특히 하위권을 상대하는 경기에서 포그바는 맨체스터 유나이티드의 공격 플레이에 포커스를 두고 있다.


연구 결과는 한 선수 혹은 소수에게 과하게 의존하는 팀이 평균적으로 나쁜 결과를 받아들인다고 말한다. 어쩌면 지금까지 맨체스터 유나이티드보다 한 선수에게 과하게 의존하지 않는 맨체스터 시티, 리버풀이 결과 면에서 더 좋은 팀으로 보일 수 있던게 이러한 이유 아니었을까 싶기도 한다. 


cf)

패스 네트워크에서 사용하는 수학은 가중그래프(weighted graph)다. 선수를 표시하는 각 점은 그래프의 점에 해당하고 우리는 패스 횟수에 따라 선 두께에 가중치를 준다. 2012년 그룬드 교수가 발표한 논문에서 구심성(C)은 이렇게 구해진다. 





개막 후 11번째 경기까지 맨체스터 유나이티드의 평균적인 C값은 14.5%였다. 한편 리버풀과 맨체스터 시티의 C값은 10.1%와 10.3%이다. 


아스날은 우리가 자료로 활용한 왓포드 전에서 C값 10.0%를 기록했지만 11경기 평균값은 14.6%이다. 특히 아스날은 리버풀, 첼시와의 경기에서 C값이 아주 컸다.




출처 : https://www.nordicbet.com/en/blog/football/premier-league/pogba-ett-problem-for-man-united

펩 과르디올라의 패스 퍼즐

Soccermatics 2016. 12. 19. 21:07 Posted by Seolskjaer




by David Sumpter


펩 과르디올라의 관점은 이렇다. 팀이 공격을 시작하기 위해서 최우선으로 공간을 발견해야 한다. 찬스를 만들어낸다는 것은 상대 진영에 공을 찔러줄 공간을 발견했다는 말과 동등하다. 또한 과르디올라에게 수비는 공간을 최소화시키는 것이며 과르디올라는 그 2가지 접근법 모두에서 최고의 수준을 보여주고 있다.


바이에른 뮌헨을 지도할 때, 과르디올라는 공간 활용을 위해 여러가지 새로운 시도를 했다. 첫번째 혁신은 풀백을 중앙 자원처럼 활용하는 것이었다. 바이언 풀백들은 측면에서 윙어를 따라 움직이지 않고 중앙 지향적인 움직임을 보였다. 아래 그림은 바이언의 패스 네트워크로 과르디올라는 이 전술을 통해 큰 성취를 해냈다.  




각 화살표는 각기 다른 두 선수사이 시행된 패스의 평균적인 위치를 의미한다. 즉 조슈아 키미히에서 필립 람을 향하는 빨간색 화살표는 키미히가 람에게 시도하는 패스가 시행되는 평균적인 위치를 보여준다. 반대로 람에서 시작해 키미히로 향하는 검정색 화살표는 람이 키미히에게 넘겨주는 패스의 평균적인 위치를 의마한다고 할 수 있다. 두 선수 사이의 패스가 5회 이상일 경우 이 그림에 모두 포함되어져 있다. 또한 선수 개인의 화살표를 연결해 그 선수가 어떻게 공간을 활용하고 있는지 시각화 할 수 있었다.


필립 람은 과르디올라가 지도하는 바이언에서 아주 중요한 역할이었다. 과르디올라 밑에서 중앙 미드필더처럼 경기를 소화한 람은 중앙에서 공격을 할 수 있는 자원이었을 뿐더러 더글라스 코스타가 공격적인 움직임을 취할 때 중앙에서 수비적으로 꽉 잡고 있기까지 했다. 람의 포지션 덕분에 바이언은 중앙에서 점유율을 지배할 수 있었다. 상대팀이 바이언의 공격을 끊어내고 클리어링을 해내면, 람이 다시 그것을 되찾아와 바이언의 공격을 다시 시작하게 만들었다.


과르디올라는 맨체스터 시티 감독이 된 이후에도 이 '가짜 풀백(false fullbacks)' 방식을 이어가려고 했다. 아래는 시티의 올시즌 첫번째 리그 경기 패스 네트워크이다. 






바카리 사냐와 가엘 클리시 모두 가짜 풀백으로 경기를 소화했고 라힘 스털링과 케빈 데 브라이너는 공격 쪽에서 굉장히 자유로운 경기를 펼칠 수 있었다. 


하지만 시티와 바이언의 공 연결에는 2가지 차이점이 존재했다. 우선 바이언 패스 네트워크에는 노이어가 존재했지만, 맨체스터 시티에서는 조 하트의 이름을 찾을 수 없었다. 이 경기에서 조 하트는 다른 동료 선수들과 5회 이상 패스를 주고받은 경우가 없었다. 바이언 빌드업 과정에서 노이어가 상당히 중요한 역할을 담당하는 것과 큰 대비를 보인다.


둘째, 데 브라이너와 스털링, 세르히오 아게로, 놀리토까지 모두가 바이언과 비교하여 상대 박스에서 멀리 떨어져있다. (이들과 리베리, 뮬러, 더글라스 코스타, 레반도프스키의 위치를 비교해보자)


아마도 이러한 차이들 때문에 과르디올라가 PL에서 가짜 풀백 전술 활용을 적극적으로 하지 않았던 것으로 보인다. 시티가 맨체스터 유나이티드 원정에서 승리할 때, 과르디올라는 4-3-3 포메이션을 사용했고 이 날 풀백으로 경기를 뛴 사냐와 콜라로프는 이전과 달리 전통적인 풀백처럼 경기를 뛰었다. 







이 경기에서 시티는 아주 인상적인 퍼포먼스를 선보였다. 맨체스터 더비에서 좋은 경기를 펼쳤기 때문에 이후 과르디올라가 이 시스템에 정착한 것을 이해할 수 있다. 지난 주말에는 역습을 주전술로 하는 번리와의 대결에서 승리했는데, 과르디올라는 그런 번리를 상대로도 (새로운 포진이 아닌) 아주 전통적인 방식의 라인업을 구축했다. 






선덜랜드와의 경기와 달라진 점이 하나 바로 보인다. 클라우디오 브라보가 이적한 이후 시티의 패스 네트워크에는 브라보의 이름이 보인다. 마누엘 노이어처럼 브라보는 박스에서 공을 다루고 있고 시티의 빌드업 과정에 관여하고 있다. 조 하트의 임대는 과르디올라식 시스템을 수행할 골키퍼의 필요성 때문이었다. 아마 다음 이적시장에는 필립 람처럼 해줄 수 있는 풀백을 영입할 것이다. 과르디올라는 대체적으로 현재까지의 팀 성적에 만족하고 있는 것처럼 보이나 굉장히 다양한 포메이션 활용을 위해 스쿼드 보강을 꾸준히 요구할 것이다.




출처 :  https://www.nordicbet.com/en/blog/football/premier-league/the-pieces-in-peps-passing-puzzle




by David Sumpter


시즌 초반에는 득점 수나 어시스트 수가 적기 때문에 히트맵을 적극 활용하여 선수나 팀을 평가하게 된다. 득점은 패스보다 발생하는 빈도가 극히 적으며 시즌 초에는 행운 유무에 따라 성적이 더 강한 영향을 받기 때문에 히트맵은 시즌 초반에 사용하기 아주 좋은 자료다. (시즌이 흐르면 전반적으로 모든 구단에게 행운이 동등하게 적용될 것이며 그 때부터는 골로 비교해도 상당히 합리적일 것이다) 우리는 패스 자료를 통해서 선수들이 어느 지점에서부터 상대팀을 골치아프게 하는지 확인해볼 수 있다.


우선 지금 리버풀이 그리워하고 있을 선수인 필리페 쿠티뉴부터 살표보자. 90분 기준으로 쿠티뉴가 많이 패스를 시도하는 구역은 색이 더 진하다. 파란색 화살표는 그 지역에서 쿠티뉴가 시행하는 패스의 평균적인 방향을 보여준다.





쿠티뉴는 박스 앞 지역에서 최고의 활약을 펼친다. 또한 화살표가 전방을 향해 나아가고 있다는 점은 그가 꾸준히 위험 지역으로 공을 보내고 있다는 것을 의미한다. 쿠티뉴의 패스 히트맵(passing heat map)은 올시즌 PL 자료 중 가장 흥미로운 것 중 하나이다. 위험지역에서 상당히 많은 패스를 연결하고 있다.


또한 리버풀은 애덤 랠라나의 복귀 역시 반기고 있다. 아래 그림은 현재까지 랠라나의 패스 히트맵이다.





랠라나 역시 공격형 미드필더지만 쿠티뉴보다 더 자유롭게 피치를 누비고 있다. 여기서 상당히 재밌는 점은 랠라나의 패스가 쿠티뉴가 선점하고 있는 지역을 향한다는 것이다. 두 선수가 동시에 출전했을 때, 리버풀이 최고의 시기를 보냈던 것을 떠올려 보자.


박스 근처에서 쿠티뉴의 페너트레이션에 대해 살펴보았는데 지금부터 또 다른 뛰어난 공격형 미드필더 에당 아자르의 기록을 살펴보도록 하자.





아자르는 올시즌에 경기력이 다시 향상되었고 쿠티뉴와 상당히 유사한 지역에서 많은 패스를 시도하고 있다. 하지만 쿠티뉴와 다른 점은 분명히 존재한다. 쿠티뉴가 전방으로 공을 연걸하는데 치중한다면 아자르는 공을 중앙으로 보내는 것에 집중한다. 이런 부분에서 첼시와 리버풀의 공격 방식의 차이를 엿볼 수 있다. 첼시가 상대 박스로 들어가는데 있어서 리버풀보다 드리블과 돌파에 더 의존한다면, 리버풀은 첼시보다 원터치 패스를 더 많이 활용한다. 


쿠티뉴에 버금갈 정도로 박스 앞쪽으로 전진 패스를 시도하는 선수는 아스날의 메수트 외질이다.





페널티 지역으로 메수트 외질만큼 꾸준하게 전진 패스를 시도할 수 있는 선수는 없을 것이다. 아스날에 합류한 이후 외질의 패스 히트맵 패턴은 거의 동일하다. 전반적인 아스날의 공격 전개는 상대 지역에서 길을 발견해는 외질의 능력에 의해 만들어진다.


아스날과 리버풀은 높은 점유율을 기록하는 팀이다. 그렇다면 역습을 주무기로 하는 구단의 공격형 미드필더는 어떤 부분에서 다른지 살펴보고 싶다. 우선 웨스트 햄 유나이티드의 디미트리 파예의 패스 히트맵은 다음과 같다.






파예의 패스는 앞에서 살펴본 선수들과 조금 다르다. 측면에서 시작되는 경우가 많고 중앙을 향해 길게 넘기는 패스가 더 많다. 파예는 지난시즌만큼 전진 패스를 시도하고 있지 못하며 웨스트 햄  다른 선수들 역시 지난 시즌만큼 기회를 만들어내지 못하고 있다.


마지막으로 레스터 시티의 리야드 마레즈를 살펴보자.






올시즌 레스터는 지난시즌만큼 힘을 못쓰고 있다. 하지만 맨체스터 시티와의 경기를 통해 여전히 자신들이 위협적일 수 있다는 것을 증명해보였다. 마레즈는 지난 시즌과 동일한 역할을 수행하고 있다 : 공을 전방으로 움직이고 오른쪽 측면에서 위협적인 기회를 만들어내는 것

 

이처럼 히트맵은 서로 다른 선수들을 비교할 수 있는 아주 효과적인 방법이다. 하지만 이것 역시 선수들의 개인 스킬과 더불어 소속팀의 전술적 특징이 녹아든 자료이며 우리는 그 패턴을 명확하게 분석하는데 있어 2가지 사항을 모두 고려해야할 것이다.




출처 : https://www.nordicbet.com/en/blog/football/premier-league/liverpool-are-missing-coutinhos-heat


슈팅의 기하학

Soccermatics 2016. 11. 3. 21:28 Posted by Seolskjaer



by David Sumpter



슈팅은 물론 슈팅을 시도하는 지점에서의 각도를 생각해보자. 슈팅을 시도할 때 더 많은 사항을 시야에 둘 수 있다면, 득점을 기록할 확률이 높아질 것이다. 10세가 되면 선수들은 각도를 줄이는 방법을 배우게 된다. 선수를 골문에서 멀어지게 하는 방법을 배우게 되는데 그말은 즉슨, 초등학생도 이 때부터 득점과 관계있는 슈팅 각도에 대한 지식을 갖게 된다는 것이다.


수학은 슈팅에서도 영향을 미치고 있다. 아래 그림은 3가지 슈팅 포지션과 각 지점에서 골포스트 사이의 각도를 나타낸 자료다. 가장 왼쪽에서 볼 수 있는 그림은 55도 각도를 유지하고 있으며 이 지점에서는 슈팅을 성공할 확률이 꽤 높을 것으로 생각해볼 수 있다. 중앙에 위치한 그림은 17도를 유지하고 있어 골이 들어갈 확률이 낮을 것으로 예상된다.





수학과 데이터는 기존 우리가 알고 있는 지식에 대해 보다 심도있는 통찰력을 불어넣어준다. 아래 그림은 슈팅 각도에 따른 득점 성공률을 시각화한 것이다. 지난 2시즌간 Opta 데이터를 가지고 만들어낸 시각 자료이다. 붉은색에 가까워질수록 그 지점에서 슈팅의 성공확률이 높아진다. 빨간색이 짙은 지점은 최소 20%의 슈팅 성공확률을 보장한다. 노란색 부분은 5% 미만의 성공확률을 기록하는 곳이고 주황색은 둘 사이의 확률을 기록한다. 멀어질수록 성공 확률은 급격하게 떨어진다.





확률을 계산하기 위해서는 통계적 모델을 적합시켜야만 하고 여기서는 득점 확률을 예측하기 위해 슈팅을 시도하는 지점과 골포스트 사이의 각도를 활용하게 된다. 즉 서로 다른 지점이더라도 골포스트와 형성하는 각도가 동일하다면, 동일한 슈팅 성공률을 예측하게 되는 모형이 만들어진다. 위에서 우리는 55도 각도와 17도 각도에 대해서 살펴봤었는데, 55도 각도 지점은 30%가 넘는 성공 확률을 보장하는 곳이고 17도 각도 지점은 6% 미만의 성공 확률을 기록한다. 각이 클수록 더 좋은 찬스라 할 수 있겠다.


이러한 분석은 xG 모델 (expected goal models)에 대한 시발점이 될 수 있다. 또한 단순히 슈팅을 시도하는 지점에서 골대와의 거리를 바탕으로 예측 모델을 만드는 것보다 더 좋은 효율성을 지닌 모델을 만들어낼 수 있을 것이다. 아래 그림은 슈팅하는 지점에서 골대와의 각도 및 거리를 계산하여 만들어낸 득점 확률 분포이다.





미묘한 차이지만, 이 자료는 슈팅 성공률에 대한 더 정확한 예측을 해낸다. 앞서 우리는 단순히 슈팅 각도만 가지고 예측을 시행했지만 지금은 슈팅 거리까지 고려하게 되었고 붉은 지점은 더 이상 원모양을 유지하지 않는다. 


바르셀로나는 '높은 슈팅 퀄리티'를 보장하는 지점에서 찬스를 만들어내는 것에 도가 텄다. 아래는 지난 2015/2016시즌 메시, 네이마르, 수아레즈가 시도한 슈팅을 보여준다. 굵게 표시된 것은 실제 골로 연결된 슈팅이다.





바르셀로나와 대조적으로 레알 마드리드는 슈팅의 퀄리티보다 슈팅의 양으로 승부한다고 할 수 있다. 아래는 같은기간 베일, 벤제마, 크리스티아누 호날두가 시도한 슈팅을 보여준다.





레알 마드리드와 바르셀로나는 슈팅 시도에 대해 서로 다른 전략을 유지하고 있다. 둘중에 하나는 희생해야 한다. 먼 지점에서부터 쉽게 슈팅을 시도할 수 있으나 낮은 성공 확률로 찰 것인가? 좋은 기회를 만들지만 그에 비례하여 슈팅의 시도를 줄일 것인가. 호날두가 중거리 슈팅으로 골을 기록하면, 그 장면은 반드시 경기 하이라이트에 잡히게 된다. 하지만 우리는 그러한 중거리 슈팅이 성공하기 이전에 수차례 실패가 동반된다는 것도 결코 잊지 말아야할 것이다.




골포스트와의 각도 θ를 계산하는 방법은 다음과 같다. 좌표 개념을 도입하여 x를 슈팅 지점에서 피치 끝부분까지의 거리, y를 피치 중앙과의 거리로 설정한다. 따라서 (0,0)에 해당하는 지점은 골문 바로 앞이 된다. 여기서 벡터 개념을 활용해 계산한 각도는 다음과 같다. 7.32는 골포스트의 사이 거리임을 생각하자. 고등수학 수준의 삼각법(trigonometry)을 사용하면 증명할 수 있다. 







슈팅 성공 확률 모델을 적합시키기 위해서 나는 로지스틱 회귀를 사용할 것이다. 2가지 모델을 만들 것인데 첫번째는 오직 각도만 사용해 모델을 만들 것이다. 두번째는 슈팅을 시도하는 곳에서 골라인까지의 거리를 고려할 것이며 각각 첫번째 히트맵과 두번째 히트맵을 만드는데 사용되는 회귀식이라 할 수 있다. 두가지 방법의 회귀 모형은 다음과 같다. 두번째 방법이 득점을 예측하는데 있어서 더 좋은 통계적 모델이라 할 수 있다.









출처 : http://sports.nordicbet.com/en/the-geometry-of-shooting/

축구 : 행운과 기술 그리고 임의성

Soccermatics 2016. 10. 14. 22:55 Posted by Seolskjaer



by David Sumpter



축구와 관련하여 내가 가장 많이 받는 질문은 다음과 같다 : 축구에서 기술이 어느 정도의 비중을 차지하는지, 행운이 어느 정도의 비중을 차지하는지 알려달라. 축구 경기는 임의성에 어느 정도까지 영향을 받는 것일까?


리오넬 메시, 토마스 뮬러, 크리스티아누 호날두, 즐라탄 이브라히모비치, 웨인 루니같은 선수들을 보라. 축구에는 기술이 분명한 영향을 미친다. 지금 언급한 선수들은 빅매치에서 아주 큰 영향력을 행사하는 선수들이고 커리어 내내 계속 그래왔다. 이 선수들은 오랫동안 성공적인 축구 선수 인생을 걸어오고 있고 이것은 단순히 그들이 운이 좋았기 때문인 것은 아니라 할 수 있다.


좋은 방식으로든 나쁜 방식으로든 행운은 축구에 영향을 행사한다. 이번 여름 전까지 크리스티아누 호날두는 메이저 대회 트로피가 없었다. 포르투갈이 조별 리그에서 탈락하지 않은 것은 호날두에게 상당한 행운이었다. 결승전에서 호날두의 부상이라는 불운이 닥쳤지만 포르투갈은 대회 우승을 차지하게 되었다.


'임의성(randomness)'이 가장 크게 영향을 미치는 분야는 바로 득점 찬스다. 공격수가 골키퍼와 1:1 찬스를 맞이했다고 가정해보자. 공격수가 골을 넣게되면, 그가 기술적으로 골을 넣은 것처럼 보이게 된다. 마찬가지로 골키퍼가 선방해내면, 우리는 골키퍼가 상대 공격수의 슈팅을 읽어냈다고 본다. 그런데 이와같은 시선으로 접근하게 되면, 우리는 최종 결과물에 영향을 미치는 작은 요소 하나를 놓치게 된다. 골키퍼와 스트라이커 모두 자신의 포지션에 있어 상당한 기술력을 갖춘 선수들이다. 하지만 최종 결과물에는 행운이라는 아주 중요한 요소가 영향을 행사하게 된다.



시티는 에버턴을 상대로 몇골을 넣을 수 있을까?


축구 경기는 어느 정도의 임의성을 가질까? 맨체스터 시티가 에버턴보다 골을 2배 더 기록할 것이라는 가정을 해보자. 어떠한 행운의 요소도 영향을 미치지 않는다면, 우리는 홈에서 맨체스터 시티가 에버턴을 상대로 2골을 기록할 것을 에버턴이 원정에서 맨체스터 시티를 상대로 1골을 기록할 것을 기대할 수 있다. 맨체스터 시티의 2-1 승리에 베팅할 것인가? 우리는 임의성에 대해서 전혀 고려하지 않았기 때문에 임의성을 배제한 상태에서 시티의 2-1 승리에 베팅하는 것은 현명하지 못한 행동이라 할 수 있다. 도박사들은 경기 결과 모델을 만드는데 포아송 분포라는 수학적 도구를 사용한다. 


맨체스터 시티가 에버턴보다 골을 2배 더 잘 넣는다는 가정에서 출발하여 우리는 경기 결과 임의성을 추측하는데 포아송 모델을 사용한다. 아래 그림은 다가올 주말 경기에 대한 포아송 시뮬레이션 결과다.





가로축은 경기 결과가 발생할 확률을 나타낸다. 우선 우리는 2-1 스코어가 발생할 확률이 10%를 갓 넘기는 수준이라는 것에 주목할 필요가 있다. 시티가 에버턴보다 골을 2배 더 잘 넣는 기술을 가졌다고 가정한 상태에서 출발했지만, 거의 90%에 육박하는 수준으로 그것과 다른 스코어가 발생한다.


포아송 모델은 시티의 승리 확률이 61%라 말하고 있다. 무승부 확률은 21%, 에버턴의 승리 확률은 18%라고 말한다. 시티의 승률 61%와 에버턴의 승률 18%의 차이인 43%는 두 구단의 실력 차이에 의한 확률이라 할 수 있다. 하지만 여전히 57%에 육박하는 경기 결과에 영향을 미칠 행운이 남아있다.


현재 배당률은 맨체스터 시티가 1.49, 에베턴이 6.95를 받고 있다. 현재 시티가 3번 붙어서 2차례 이길 수 있다고 예상된다는 것이다. 지금 두 팀의 기술력 차이와 행운에만 의존해서 경기 결과를 예측했다. 정말 어려운 과제는 두 팀의 기술력 차이를 정확하게 측정하는 것이다. 정말로 맨체스터 시티는 에버턴보다 골을 넣는 능력이 2배 앞서고 있을까?


앞으로 우리는 각 팀의 기술력을 측정하는 다양한 방법에 대해 논의할 것이다. 60%에 가까운 확률로 행운이 영향을 미치지만, 진정한 우위를 만들어내느 40% 요소를 정확히 파악하는 것도 중요하다.



포아송 분포


포아송 분포는 경기 결과를 시뮬레이션하는 아주 간단한 방법이고 실제로도 효과가 있다. 이 모델을 활용하기 위해서 우리는 각 득점이 독립적인 사건이라 생각해야하고 경기 도중 어느 시간대라도 득점이 나올 확률은 동일하다고 가정해야 한다. 실제로도 경기 도중 골이 유별나게 많이 나오는 시간은 없다.


우선 우리는 1경기에서 나올 총 득점의 기대값을 λ로 설정해야 한다. 한 경기에서 k득점이 나올 확률 p는 (λ^k)*exp(-λ)/k! 이다. 우리가 앞서 언급했던 것처럼, 맨체스터 시티가 평균적으로 2골을 기록한다고 했을 때(λ=2), 시티가 3골을 기록할 확률은 18%가 된다. λ의 값이 꼭 자연수일 필요는 없다. 7라운드까지 맨체스터 시티의 평균 득점은 2.57골이고 위의 식에서 λ=2.57로 바꿀 경우, 시티가 3골을 기록할 확률은 21%로 상승한다.


포아송 분포가 이 논의의 출발점이지만 이것만으로 모든게 설명되는 것은 아니다. 도박사들은 무승부 확률에 대한 분포를 연구 중이기도 하다. 연구들이 합쳐지면 경기를 예측하는데 사용되는 가장 기본적인 모델이 더 좋은 추정을 하게될 것이다. 




출처 : http://sports.nordicbet.com/en/luck-skill-randomness/




페널티킥을 완벽하게 차기위한 통계

Soccermatics 2016. 7. 16. 01:19 Posted by Seolskjaer




by David Sumpter




독일과 이탈리아의 승부차기 대결에서 10명의 키커 중 6명이 실축했다. 그 6명 중에 4명은 메수트 외질, 바스티안 슈바인슈타이거, 그라치아노 펠레, 시모네 자자로 이들은 포스트를 맞추거나 유효슈팅조차 기록하지 못했다. 하지만 최근 페널티킥을 놓친 월드-클래스 선수는 이뿐만이 아니다. 리오넬 메시조차도 코파 아메리카 승부차기에서 실축했고 크리스티아누 호날두도 마찬가지로 오스트리아전에서 포스트를 맞췄다. 세계 최고의 선수일지라도 페널티킥을 놓칠 수 있다.


수없이 많은 훈련을 거치는 프로 선수들이 너비가 7.29m나 되는 골문에 11m 거리에서 어떻게 골을 넣지 못할 수 있을까?




심리적 요소


보통 승부차기를 앞둔 선수의 긴장감을 실축의 원인으로 이야기한다. 페널티킥을 차는 것, 특히 승부차기에서 킥을 하는 것은 기술적 능력보다 집중력을 유지하는 것의 싸움이기도 하다. 차분하고 과감해야만 한다. 물론 심리적인 요소가 페널티킥을 차는 것에 영향을 미치겠지만, 심리적 문제가 모든 것을 설명하진 못한다. 따라서 페널티킥에 대해 더 알아내기 위해 우리는 더 자세히 들여다볼 필요가 있다. 어떻게 해야 페널티킥을 완벽하게 찰 수 있을까?



이 자료는 이탈리아와 독일의 맞대결 이전까지 유로2016에서 시행된 모든 페널티킥을 보여준다. 경기 도중 발생한 페널티킥과 승부차기 데이터를 모두 표현한 것이다. 총 29번의 시도에서 23번이 킥 성공으로 이어졌고 3차례 선방이 있었으며 3차례는 유효슈팅으로도 이어지지 않았다. 호날두가 오스트리아전에서 포스트를 맞췄고 오스트리아의 알렉산더 드라고비치도 아이슬란드전에서 똑같이 포스트를 맞췄다. 폴란드와 스위스의 대결에서는 그라니트 쟈카가 완전히 엉뚱한 방향으로 공을 차기도 했다.


일반적으로 골문의 가장자리를 향한 킥이 성공으로 연결된다. 따라서 페널티 성공이란 극단적인 부분을 향해 공을 보내는 것이다. 골을 넣기 위해서는 골키퍼에게 떨어진 곳을 향해 공을 차면 되고 포스트와 골문 상단에 상당히 근접하게 공을 차는 경우 골키퍼는 그것을 굉장히 막기 어려워한다. 아래 그림은 슈팅이 어느 지점을 향하는가에 따른 득점 확률을 나타낸 것이다.



하얀 부분은 성공확률이 100%에 근접하는 구간이다. 검정색 구간은 성공률이 50% 근처인 지역이며 다른 색깔은 100%와 50% 사이를 오간다. 그림을 그리기 위해서 지난 2시즌간 챔피언스 리그, 프리미어 리그, 라 리가, 분데스리가 페널티킥 자료를 참고했다. 승부차기까지 포함하여 총 680번의 킥이 있었고 페널티킥의 성공률은 평균 76%였다. 평균이 76%지만, 극단적인 지점을 향해 시도되는 슈팅은 대부분 성공으로 이어졌다.



골키퍼의 손에 닿지 않는 곳으로 차라


(페널티킥의 완벽한 예시, 저 구역은 확률적으로 10,000번 시도해야 1번 실패하는 곳이다)



유로2016 최고의 페널티킥은 바로 레반도프스키의 시도였다. 스위스와의 승부차기에서 레반도프스키는 오른쪽 상단을 향한 킥을 시도했고 얀 좀머는 그 공에 손을 댈 수가 없었다. 레반도프스키가 시도한 유형의 킥은 사실상 막는 것이 불가능하다. 페널티킥 성공에 대한 모델을 추정했을 때, 저 구역은 10,000번 시도할 경우 단 1번만 실패할 확률을 보장한다.


이탈리아와 독일의 승부차기는 완벽한 페널티킥과 거리가 멀었다. 토마스 뮬러의 슈팅은 골키퍼가 충분히 막을 수 있는 범위 속으로 향했고 실제로 부폰이 그걸 막아냈다. 헥토르 역시 비슷하게 실패할 위험성이 높은 곳으로 슈팅을 시도했지만, 운이 좋게도 공은 부폰의 팔 사이로 빠져버렸다.






슈바인슈타이거는 완벽하게 벗어나는 킥을 시도했고 메수트 외질은 포스트를 맞췄다. 이들의 실축은 선수들이 굉장한 불안감에 시달렸기 때문이라고 볼 수도 있다. 하지만 페널티킥 성공에 대한 모델은 다른 설명방법을 추구한다. 페널티킥 모델은 포스트나 크로스바 바로 밑처럼 극단적인 지점을 향해야 완벽한 페널티킥인 것으로 인식한다. 외질과 슈바인슈타이거는 분명 그 지점을 노리고 킥을 시도했을 것이다.


외질은 이미 슬로바키아와의 경기에서 페널티킥이 상대 골키퍼에게 막힌 경험이 있었다. 당시 외질은 골키퍼의 왼쪽으로 포스트 근처를 향해 킥을 시도했지만 선방에 막히고 말았다. 따라서 외질은 저번보다 더 포스트에 가까이 킥을 시도하려했고 그 결과 골대를 맞추게 되었다. 슈바인슈타이거는 대담하게 골대 상단을 노린 것 같다. 만약 킥이 제대로 이루어졌다면 부폰은 슈바인슈타이거의 킥을 막지 못했을 것이다. 


승부차기에서 심리적인 요소가 작용하는 것을 완전히 부정하려는 것이 아니다. 하지만 완벽한 페널티킥에 대한 수학적 연구는 실축을 새로운 관점에서 바라볼 수 있게 한다. 1990년 잉글랜드에게 패배를 안겼던 크리스 와들의 킥도 결과만 따라주지 않았을 뿐, 절대로 막을 수 없는 왼쪽 상단을 노린 것임은 틀림없다.


골키퍼의 방어 범위에서 벗어난다고 보장받는 곳일지라도 살면서 언젠가는 킥이 막히는 것을 목격하게 될 것이다. 우리는 그런 실축의 원인을 선수가 긴장한 것에서만 찾을 수 없다. 수학적으로 성공이 보장되는 곳을 향해 찼음에도 골키퍼가 막아내는 경우가 발생한다면, 우리는 그 자료를 완벽한 페널티킥을 위한 연구 과정의 일부로 받아들여야만 할 것이다.




출처 : http://www.fourfourtwo.com/features/soccermatics-stats-behind-executing-perfect-penalty












잉글랜드의 폴 개스코인은 이렇게 말했던 적이 있다 : "나는 그 어떤 것도 예측하지 않고 앞으로도 그럴 것이다.(I never predict anything and I never will)" 그러나 나는 개스코인의 이 8개의 글자만으로 우리가 왜 예측이란 것을 피할 수 없는지에 대해서 말할 수 있다. 개스코인은 단 4글자만에 오류를 범했다. 비록 가짜(Gazza)이 오류가 있는 말을 했을지라도 그는 우리에게 심오한 질문을 던졌다는 의미를 둘 수 있다 : 모든 것에서 우리는 패턴을 발견할 수 있다.


아침 출근길 러시아워를 지나 직장에 도착하는데까지도 패턴이 존재하고 우리의 친구 관계에도 패턴이 존재한다. 우리의 저녁 식사에도 또 그 식사를 위한 장보기에도 패턴이 존재한다. 따라서 자연스럽게 축구에도 패턴이 존재하게 된다. 우리의 과제는 패턴을 파악하고 그것에 대한 충분한 이해를 하는 것이다. 만약 우리가 아주 정확한 패턴을 발견해낸다면, 우리는 그것을 통해 예측을 시작할 수 있게 된다.


프리미어 리그 2012/2013시즌은 흥미롭고 예측 불가능한 경기들의 연속이었다. 리버풀은 2차례 연속으로 5-0 승리를 기록했고 그 다음에는 6-0 승리까지 기록했으나 유럽 대항전 진출에 실패했다. 시즌은 경기 막바지 예측 불가능한 상황을 가장 잘 만들어내는 알렉스 퍼거슨 경이 이끄는 팀의 우승으로 마무리 되었는데 맨체스터 유나이티드 감독으로서 퍼거슨 경이 지도한 마지막 경기 역시 예측 불가능에서 벗어나지 않았다. 웨스트 브롬위치 알비언은 맨체스터 유나이티드를 상대로 마지막 10분간 3골을 기록했고 퍼거슨 경은 다시 한 번 'Football, Bloody hell !'을 외칠 수 밖에 없었다. 


사람들 머릿 속에 강력하게 기억될 멋진 경기들도 있었지만 이미 사람들에게 잊혀져버린, 그저 그랬던 0:0 무승부 경기도 비슷하게 양산되었다. 팬들은 그런 0:0 경기를 잊었을지 모르지만 기록은 결코 그러지 않는다. 우리는 경기 결과 속에 숨어있는 패턴을 파악하기 위해서 우리의 머릿속에서 잊혀진 경기들을 다시금 꺼내야만 한다. 아래 그림은 2012/2013시즌 경기당 득점 수에 대한 히스토그램이다. 경기당 평균 득점은 2.79골로 3골에 못미치는 수준이었다.


히스토그램은 다양한 득점수가 어느 정도의 빈도를 가지는지 보여준다. 첫번째 바인 0:0 무승부는 총 35차례 발생했다. 퍼거슨 경의 마지막 경기였던 5:5 무승부는 총 10골이 나온 2경기 중 하나였다. 히스토그램의 중앙에서 우리는 총 3골이 나오는 경기가 가장 빈번하게 발생함을 알 수 있다. 3골이 나온 경기 중에서도 2:1 승부가 가장 많았다. 패턴은 우리가 그림을 통해 보는 바와 같다. 그렇다면 이제 우리는 이 패턴이 어디서 발생했는가에 대해서 이해해야 한다. 그러기 위해서 우리는 수학적 모델을 도입할 수 밖에 없다.









축구 경기 결과는 랜덤하다. 축구와 다른 스포츠가 사람들의 흥미를 이끄는 것은 승부를 예측할 수 없음에 기인한다. 경기를 보고 있지만 잠시라도 한 눈을 팔게 되면 그 순간 중요한 빌드업 과정이나 급작스레 터진 골을 놓치게 된다. 골은 경기의 어느 순간에라도 나올 수 있는 이벤트이다. 하나의 시뮬레이션을 해보자. 축구를 정확히 90분짜리 경기라 생각하고 각 1분마다 득점이 나올 수 있는 확률은 동등하다고 하자. 앞서 경기당 평균 2.79골이 나온다고 이야기했다. 따라서 우리는 1분에서 32분 사이에 1골을 볼 수 있게 된다. 


컴퓨터로 시뮬레이션을 돌려보는데 1분동안 득점할 수 있는 확률을 0.031로 둔다. (2.79골/90분) 이 시뮬레이션을 많이 정말로 수없이 많이 돌려보면 우리는 시즌의 전체 득점 패턴이 어떻게 형성되는지 파악할 수 있다. 시뮬레이션을 통해 얻은 결과는 아래 그래프에서 실선 부분과 같다. 우리는 이를 통해서 시뮬레이션을 통한 예측과 실제가 어느 정도 겹친다는 것을 확인하게 된다. 


시뮬레이션과 실제가 연관성을 가진다는 것은 시뮬레이션이 굉장히 성공적이라는 것을 의미한다. 감독이 터치 라인에서 선수들을 향해 소리지르는 것, 팬들이 선수들을 향해 쓸모없다고 조롱하는 것, 선수 스스로 지금이 득점 찬스라고 생각하는 것들은 우리가 추정한 모델에 영향을 주지 않는 요소다. 그런 사항들은 득점의 분포에 대해 영향을 행사하지 못한다. 오히려 이 모든 것들이 추정한 모델 내에서의 함께 어우러져 무작위성이 발생하도록 영향을 준다고 할 수 있다. 








그래프에서 실선에 해당하는 부분, 즉 시뮬레이션으로 추정한 부분은 포아송 분포(Poisson distribution)로 알려져있다. 포아송 분포의 성질 중 하나는 과거의 발생한 사건이 미래에 발생할 사건에 영향을 주지 않는다는 것이다. 포아송 분포의 이 성질은 내가 이 분포를 사용한 이유이며 축구 경기에서도 이와 같은 특징은 적용될 수 있다 : 지금까지 몇골이 나왔는가, 어느 시간에 골이 나왔는가는 앞으로 발생하는 득점에 영향을 미치지 못한다. 포아송 분포를 활용한 시뮬레이션과 실제 결과는 꽤나 일치하는 모습을 보여준다. 득점은 무작위성을 가지지만 우리는 그 속에서 특정한 패턴을 또 발견해낼 수 있다.


랜덤 시뮬레이션과 포아송 분포는 어느 곳에서나 발견할 수 있는 사항이다. 대학교 통계학 수업에서는 버스 정류장에서 버스를 기다리는 것이 포아송 분포를 따른다고 배운다. 실제로 버스 회사는 정시에 버스를 출발시키지만 노인을 태우는 과정에서 시간이 더 소모되고 도로 위를 달리는 자전거 등으로 인해 현실에서는 변화가 발생한다. 또 다른 일상생활 예시로는 1년마다 갈아끼우는 전구의 개수를 언급할 수 있다. 전구를 갈아끼우는 매 순간마다 아주 작게나마 고장의 확률을 동반하게 된다. 우리는 그 곳에서도 포아송 분포를 발견할 수 있다.


포아송 분포란 이름은 19세기 초 프랑스의 시몽 데니스 포아송의 이름을 따서 만들어졌다. 그러나 포아송은 그 분포에 대한 수학적 요소에만 관심이 있었을 뿐 실제 삶에 어떻게 활용되는지에 대해서는 크게 관심을 두지 않았다. 포아송 분포를 실제 삶에 반영한 인물은 1898년 독일에서 일하고 있었던 라디슬라우스 보르트키예비치였다. 보르트키예비치가 조사하고 있던 자료 중 하나는 우연히 기병대의 말의 발길질에 맞아 사망하는 군인의 숫자였다. 그는 20년간 14개 연대의 사망자 수를 조사했고 말의 발길질에 맞아 죽은 사람들이 얼마나 되는지 플로팅을 하기 시작했다. 여기서 그는 이 자료가 포아송 분포와 굉장히 일치하는 모습을 보인다는걸 발견했다. 말의 발길질에 걷어차여 사망하는 것은 흔하게 발생하는 사건이 아니다. 20년간 14개 연대에서 사망한 병사의 수는 144명이었는데 불행하게도 1년에 4명이 사망한 연대가 2곳이 있었다. 그러나 포아송 분포를 적합시킨 결과 보르트키예비치는 이 2곳 연대가 특별히 더 말을 다루는데 있어서 조심할 필요가 없다는 결론을 내렸다. 그냥 그 해에 운이 없었던 것일 뿐이다. 축구가 사람의 목숨만큼 중요할 수도 있고 중요하지 않을 수도 있다. 어쨌든 축구도 같은 규칙을 따르게 된다.


포아송 분포는 수학적 유추의 첫번째 단계이다. 굉장히 다양한 분야에서 포아송 분포를 따르고 있고 축구 역시 그 중 하나일 뿐이다. 사건이 갑자기 발생하고 동시에 각 사건이 독립적이며 이전 사건들이 앞으로 일어날 사건에 영향을 미치지 않는다면 우리는 합리적으로 그 사건이 포아송 분포 형태와 유사할 것이라 가정할 수 있다. 통계학자들은 자동차 추돌사고, 비행기 엔진의 고장, 은행의 파산, 자살과 살인, 건축 현장에서의 산업재해 모두 포아송 분포의 형태를 보인다는 것을 발견해냈다. 


우리는 축구에서 1분 뒤에 어떤 상황이 펼쳐질지 예측하지 못한다. 평균적으로 경기당 몇골이 나오는지는 알 수 있지만 그 골이 나오는 시점은 예측하기가 어렵다. 그러나 우리는 최종적인 결과로 특정 스코어가 다른 스코어보다 많이 발생하는 것을 확인할 수 있다. 우리는 바로 이 임의성 속에서 역설을 발견하게 된다. 득점은 임의의 시간에 나오지만 그것이 모여 하나의 패턴을 형성하게 되고 결국 우리는 최종적인 결과를 예측할 수 있게 된다. 굉장히 임의로 발생하는 사건들이 사건의 발생을 설명할 수 있게 만들고 빈도에 대해 예측할 수 있게 만든다. 


무작위성은 미래를 예측하는 도구로 활용되고 수학자들 역시 항상 이런 방법을 활용한다. 새로운 시즌이 개막하고 월드컵이 시작하고 오스카 시상식을 앞둔 순간마다 언론사들은 어떤 팀이 우승할지, 어떤 영화가 수상을 할지에 대한 확률을 예측한다. 언론사가 제시하는 확률은 때로는 굉장히 합리적으로 보이고 정말 딱 알맞을 때도 있다. 그렇다면 그들의 예측은 어디서 비롯되는 것일까? 그들 역시 포아송 분포를 활용한다. 축구 경기 결과를 모델링하는 것은 각 팀의 득점 기록과 실점 기록을 토대로 시뮬레이션을 돌리는 것에서 시작된다. 


예를 들어보자면, 2012/2013시즌 아스날은 평균적으로 홈경기에서 2.47골을 넣었고 원정에서는 1.32골을 기록했다. 한편 홈에서는 평균 1.21골을 내주었고 원정에서는 0.74골을 내주었다. 모든 팀을 대상으로 이와 동일한 데이터를 구하고 각각의 경기 조합에 맞춰 시뮬레이션한다. 그렇게 우리는 다가오는 시즌에 대한 예측을 하게 된다. 아래는 2012/2013시즌 데이터를 바탕으로 2013/2014시즌을 예측한 것이다.



L

Pts 

맨시티

38 

22 

71 

42 

73 

리버풀 

38 

22 

11 

64 

43 

71 

첼시 

38 

21 

12 

74 

51 

68 

맨유 

38 

19 

12 

61 

45 

64 



이 예측은 실제 데이터와 크게 다르지 않았다. 실제로 맨체스터 시티는 리버풀에게 2점차로 앞서 리그 챔피언이 되었고 첼시는 정말로 3위에 랭크되었다. 그러나 이것은 컴퓨터에서 돌린 1차례의 시뮬레이션에 불과하다. 컴퓨터에서 '실행'을 누를 때마다 결과가 달라진다. 아래는 또 다른 시뮬레이션 결과이다.



Pts 

리버풀 

38 

23 

68 

37 

76 

첼시 

38 

22 

8

75 

52 

74 

맨유 

38 

22 

11 

72 

43 

71 

맨시티 

38 

19 

11 

64 

42 

65 




만약 스티븐 제라드가 첼시와의 경기에서 미끄러지지 않았다면 바로 위에 있는 결과를 마주했을지도 모른다. 리버풀이 25년만에 리그 타이틀을 차지하는 결과 말이다. 리버풀의 우승을 바탕으로 스티븐 제라드가 잉글랜드 월드컵 팀에 더 긍정적인 기운을 불어넣었을지도 모른다. 시뮬레이션으로는 이것과는 또 다른 굉장히 다양한 결과를 얻을 수 있다.


그렇지만 객관적인 과학자 입장에서 시뮬레이션은 여러차례 시도해야하고 그 모든 결과를 종합한 결론을 내려야만 한다. 나는 이 시뮬레이션을 10,000회 돌렸고 여기서 얻은 결론이 가장 합리적인 답을 내놓을 것이다. 여기서 리버풀의 우승 확률은 11.5%에 불과했다. 한편 2012/2013시즌 우승을 차지한 맨체스터 유나이티드의 우승 확률은 26.2%였고 첼시가 19.2% 아스날이 17.6% 맨체스터 시티는 12.8% 토트넘 핫스퍼는 6.0%의 확률을 기록했다.


그러나 우리는 이미 결과를 다 알고 있고 이 예측이 진실에서 벗어났다는 것을 알고 있다. 맨체스터 유나이티드는 감독을 교체했고 최악의 시즌을 맞이했다. 맨체스터 시티와 리버풀이 리그를 지배했고 두 팀 모두 100득점을 넘었다. 아주 정확한 예측 모형을 만들었다고는 할 수 없다. 그러나 가장 중요한 사실은 매우 정확할 수는 없어도 크게 틀리지 않는 모형을 발견했다는 것이다. 리그에서 우승권에 근접할 것이라 예측되는 팀들은 대체적으로 경기를 잘 치렀고 리그 상위권을 차지한 팀은 예측한 바에서 크게 어긋나지 않았다. 무엇보다도 우리는 어떠한 개인적 판단없이 수학적인 접근만으로 예측을 시도했다. 득점이 무작위하게 발생한다는 것, 각 팀의 득점률만을 활용해 우리는 어느 정도까지는 비슷하게 리그 순위를 예측할 수 있었다. 폴 개스코인이 축구는 예측 불가능하다 말했지만 우리가 맞이한 결과는 그것과는 정반대이다. 매 주말마다 400명 가량의 선수들이 공을 차면서 90분 경기를 소화한다. 그리고 최종적으로 런던의 빅클럽이나 맨체스터의 빅클럽이 트로피를 차지한다. 축구는 예측 가능하다.


무작위성을 바탕으로 예측이 이루어지는 것은 실제 우리의 삶에서도 수학적인 접근이 큰 역할을 하고 있음에 기인한다. 우리가 서비스 센터에 전화를 걸었을 때, 상담원은 대략적으로 어느 정도의 대기 시간이 필요한가에 대해 즉각적으로 알려준다. 은행에서 대출 받을 때도 이미 은행에서는 파산 가능성에 대한 계산을 다 끝내놓은 상황이다. 


대기 시간이 얼마나 필요한지, 회사의 파산여부 같이 어떤 클럽이 리그에서 우승할 것인가는 정확하게 예측할 수 없다. 우리의 예측은 과거의 사건을 종합해 미래에 발생할 확률을 계산하는 것에 불과하다. 그리고 그 수학적 계산법은 독일 군인들이 말의 발길질에 차여 사망하는 것을 예측하는 모델에서 만들어졌다. 수학을 통해서우리는 버스의 도착, 축구 경기, 파산, 암발생률, 전화 대기 시간이 공통점을 가진다는 것을 확인할 수 있었다. 그 결과 우리는 사건이 어느 빈도로 발생하는가에 대해 예측을 할 수 있게 된다.


득점은 무작위로 발생하지만 수학은 최종적으로 예측이 가능하게 만든다. 그러나 무작위성으로 모든 현상을 다 설명하지는 못한다. 2013년 알렉스 퍼거슨 경의 은퇴 이후 데이빗 모예스는 20여년만에 맨체스터 유나이티드를 최악의 성적으로 몰아넣었다. 우리는 이 현상을 설명하는데 있어서 불운을 빼놓을 수가 없을 것이다. 브라질은 2014년 자국 월드컵에서 18분 사이에 독일에게 5골을 내주었다. 브라질이 단숨에 5골을 내준 요소로 압박감 속에 브라질이 무너진 것, 독일이 분위기를 탄 것을 무시할 수 없다. 득점의 무작위성 말고도 다른 것이 분명히 작용한다. 


무작위성만으로 퍼거슨의 성공 스토리와 독일 축구의 강력함을 온전히 설명할 수 없다. 그 둘의 성공을 파악하기 위해서 우리는 내부적으로 어떠한 노력을이 이루어지는지 파악해야만 한다. 그런 노력들은 무작위성을 가지지 않고 따라서 지금까지 우리가 논의한 방법으로는 이해할 수 없는 사항들이다. 


생태학을 전공하는 학자는 나에게 이런 말을 해주었다. "주변에 포식자가 없다면, 물고기들은 굉장히 무분별하게 퍼져있다. 그러나 포식자를 발견한 순간 그 물고기들은 모여 굉장히 조밀한 물레방아 형태의 포진을 형성한다." 특정한 한 마리의 물고기가 그 물레방아를 형성하기 시작하는가? 그 물레방아 형태가 회전하는 속도는 얼마나 빠른가? 각 물고기마다 선호하는 위치가 있을까? 과연 물레방아 형태가 포식자에게서 피할 수 있는 가장 최적의 포메이션인가? 등은 실질적인 수수께끼가 될 수 있겠다. 무작위성을 활용하는 모델이 실패하는 순간 이러한 질문들은 굉장한 흥미를 불러일으키게 된다.


선수들의 움직임은 동시다발적으로 이루어지며 패스 네트워크 역시 하나의 구조를 형성한다. 공의 움직임은 물리학의 법칙 뿐만 아니라 감독이 전술이라 생각하는 것들을 반영하게 된다. 그런 사항들을 하나하나 캐내기 위한 모델은 지금 우리가 사용한 무작위성과는 다른 이야기일 수 밖에 없다. 그러나 적용하는 수학적 이론이 달라질 뿐이지 결과를 관측하고 가정을 세우고 (또 다른) 수학적 모델을 활용해 시뮬레이션을 하고 그 가정이 맞다는 것을 입증하는 방법은 동일하다. 


현상을 가장 잘 설명하는 모델을 발견하는 것은 수학자에게 큰 도전 과제라 할 수 있다. 만약 시즌 전체적으로 어느 정도의 골이 발생하는가에 대해서 궁금하다면 지금까지 논의한 것만으로도 충분하다. 그러나 포메이션, 선수들의 움직임과 기술에 대해서도 이해하고 싶다면 우리는 더 깊은 논의를 진행해야만 한다. 이것이 앞으로 우리에게 주어진 과제다.

 


출처 : <SOCCERMATICS : Mathematical Adventures in the Beautiful Game, David Sumpter著>