Expected Assist (xA) 란?

Football Stats 2017. 8. 15. 22:22 Posted by Seolskjaer



Expected assists (이하 xA) 는 패스가 주(primary) 어시스트가 될 확률을 추정한다. 패스의 마무리 지점, 패스의 유형, 기타 요인을 기반으로 xA 모델링을 한다. 모델링 과정에서는 패스로 인해 슈팅이 나왔는지는 크게 중요하지 않다. 패스의 결과로 슈팅이 생성되었는지 관계없이 모든 패스에 대해 xA 값을 추정한다.


지금부터 모델링에 대해 간략이 소개하고 퍼포먼스를 평가하는데 있어 xA가 어느 정도의 가치가 있는지에 대해 소개하고자 한다.


다음과 같은 상황을 가정해보자. 산드로 라미레스가 웨인 루니를 향해 크로스를 올렸는데 루니가 헤더 타이밍을 잘못 잡았거나, 루니의 헤더가 크로스바 위로 지나갈 수도 있다. 라미레스는 루니의 점프 타이밍, 루니가 골문 안으로 공을 넣는지 여부를 컨트롤 할 수 없다.


이러한 이유에서 오직 어시스트만으로 선수의 창조성을 대표하기 어렵다. (단순히 어시스트만 고려하기에는) 창조자(creator)는 패스를 받아주는 선수의 마무리 능력에 의존하기 때문이다. 물론 슈팅으로 이어지는 모든 키패스가 동등한 퀄리티의 득점 기회로 연결되는게 아님을 인지하고 있다. 우리는 이런 사항들을 반영하여 창조자 역할을 수행하는 선수를 평가할 수 있어야 한다.


그렇다면, 득점 기회를 만들어내는 선수의 능력을 어떻게 평가할 수 있을까? 지금 3가지 득점 상황을 예시로 이야기를 시작하고자 한다.





페르난도 요렌테의 헤더로 이어진 길피 시구르드손의 코너킥이 첫번째 사례다. 시구르드손의 코너킥의 xA 값은 0.05다. 이는 시구르드손이 시행한 킥이 어시스트로 연결될 확률이 5% 라는 것이다.





이번에 소개하는 사례는 2015/2016시즌 제이미 바디의 득점이다. 크리스티안 푹스가 제이미 바디를 향해 스루볼을 넣어줬고 바디는 공을 가지고 박스 안으로 들어가 골을 기록했다. 푹스의 패스의 xA 값은 0.12였다. 





첼시는 숏-코너(short-corner)를 진행했고 3차례 패스가 더 이어진 이후 파브레가스가 골을 기록한 페드로를 향해 패스를 시행했다. (빨간색 선) 파브레가스가 시행한 패스의 xA 값은 0.02다. 즉 파브레가스가 시행한 퀄리티 수준의 패스가 어시스트로 연결될 확률이 2% 라는 의미다.


키패스로부터 xG 값을 추정하는 초기 xA 모델은 간단한 작업이었다. 하지만 이는 공을 연결받는 선수가 슈팅을 시도하는 상황만 고려한다는걸 의미한다. 메시가 아슬레틱 빌바오와의 경기에서 넣었던 골처럼 패스를 받은 선수가 공을 소유한채 직접 더 좋은 슈팅 포지션으로 이동한 상황을 포함할 수 없다. 하지만 향상된 xA 모델은 선수의 기여가 적절히 반영될 수 있도록 했고 각 상황을 보다 정확하게 반영한다.


xA 는 패스가 주요 어시스트가 될 확률을 추정하는 통계량이다. 패스를 연결받는 위치, 패스의 유형 등 다양한 요인을 고려하여 모델링 한다. 발전된 xA 모델은 패스로부터 슈팅이 만들어졌는지에 의존하지 않는 통계량이다. 따라서 (슈팅으로 이어지는) 마지막 패스가 아닌 패스에도 가치를 부여할 수 있다. 창조자 역할을 수행하는 선수가 만들어내는 퀄리티를 평가함으로써 우리는 단순히 찬스를 만들어낸 횟수를 넘어선 심도있는 통찰력을 얻을 수 있다.





크리스탈 팰리스와의 경기에서 나온 앤디 캐롤의 멋진 바이시클 킥을 예시로 소개하고자 한다. 여기서 마누엘 란지니(10번)의 패스는 미카일 안토니오(30번)에게 연결되었고 안토니오는 9번 앤디 캐롤을 향해 크로스를 올렸다. 캐롤은 오른쪽 코너 상단으로 멋지게 공을 꽂아넣었다.


캐롤이 맞이한 찬스의 특성에 기반하여, Opta의 xG 모델은 캐롤의 슈팅이 골로 연결될 확률이 5%라는 답을 냈다. 캐롤의 xG 값이 0.05 이기 때문에 과거의 xA 모델이라면, 안토니오의 xA 값은 그대로 0.05가 되었을 것이다. 하지만 새로운 모델에서 패스로 인해 발생하는 슈팅의 결과는 무관하다. 안토니오의 xA 값은 0.034 이다. 이는 안토니오의 크로스가 필연적으로 캐롤의 슈팅으로 이어지지 않는다는걸 반영한 모델인 것이다. 즉, 저 위치에서 안토니오가 시도한 유형의 패스가 어시스트로 이어질 확률이 3.4%인 것이다. 





2015년 코파 델 레이 결승전에서 메시가 혼자서 만들어낸 골을 이야기 해보자. 여기서는 22번 다니 알베스가 메시에게 공을 연결했고 메시가 빌바오 선수 여럿을 제친 이후 골을 만들어냈다. 메시의 슈팅이 골로 연결될 확률은 9%였다. 빌바오 수비 여럿을 제친 메시는 본인 스스로 득점 기회의 퀄리티를 상당히 끌어올렸다. 물론 메시가 알베스에게 공을 연결받은 지점에서 골을 넣을 확률이 9% 가 아닌 것은 분명해 보인다.


만약 고전적인 xA 방법을 사용한다면, 알베스의 xA 값은 메시의 xG 값인 0.09 를 그대로 이어받게 된다. 하지만 이렇게 반영할 경우, 메시가 직접 만들어낸 찬스라는걸 명확하게 반영하지 못한다. 


이러한 이유에서 성공한 모든 패스는 xA 값을 가지게 된다. 비록 그 패스가 바로 슈팅으로 연결되지 않더라도 xA 값을 가질 수 있다. 메시의 골은 모든 패스가 정말로 어시스트가 될 수 있다는 논리를 보여주는 완벽한 사례이다. 사실 알베스의 패스가 어시스트로 이어질 확률은 1%도 안 되지만 말이다.


최근 Optapro 는 점유에 관한 연구를 소개했다. 새로운 연구를 통해 키패스, 슈팅 이전의 사건들에 대해 평가하고 분석할 수 있다는 것은 중요하다.


따라서 향상된 모델은 동료 선수가 슈팅으로 상황을 이어가주느냐에 관계없이 위협적인 지역으로 패스를 넣어주는 선수에 대해 적절한 보상을 해줄 수 있다. 공을 받은 선수가 공의 소유권을 내주어 슈팅으로 상황을 이어가지 못하더라도 찬사를 받을 수 있다. 또한 동료들이 위치한 지점보다 훨씬 더 좋은 포지션을 향해 공을 넣어주더라도 그러한 판단의 가치를 인정받을 수 있다.

  





다비드 실바의 기록은 흥미롭다. 7개의 어시스트를 기록한 실바는 10.1의 xA 값을 기록했다. xA가 직접적으로 골, 슈팅으로 연결된 패스 뿐만 아니라 모든 유형의 패스를 고려한 통계라는 점을 확인할 수 있다. ProVision 에서 제공한 2016/2017시즌 다비드 실바의 패스맵을 보자. 첫번째 패스맵은 실바의 패스가 시작된 지점을 보여주고 두번째 패스맵은 실바의 패스가 끝난 지점을 보여준다. 우리는 이를 통해서 실바가 높은 평가를 받는 이유를 이해할 수 있다.





마르코 아르나우토비치의 기록 역시 흥미롭다. 스토크 시티는 20개 구단 중 13번째로 슈팅을 많이 시도한 구단이었다. 소속팀의 슈팅 횟수가 적은 편에 속함에도 불구하고 아르나우토비치는 xA 랭킹 7위에 이름을 올렸다. 아르나우토비치의 패스가 슈팅으로 이어지지 않았다 할지라도, 그가 위험 지역으로 패스를 보내는 선수였음을 확인할 수 있다.


선수의 창조성을 수량화하고 평가하는 과정에서 단순히 슈팅, 골로 연결된 패스만 대상으로 하는 통계가 아닌 모든 패스를 대상으로 계산하는 xA 가 훨씬 더 많은 정보를 제공하는 체계임을 알 수 있다.




출처 : http://www.optasportspro.com/about/optapro-blog/posts/2017/blog-expected-assists-in-context/








 



세트-피스에 대한 시각을 바꾸자

Football Stats 2017. 7. 31. 14:57 Posted by Seolskjaer



by Ted Knutson


세트-피스에 대한 고전적인 시각에는 토니 퓰리스와 샘 앨러다이스 두 사람의 영향이 컸다. 


두 감독은 기술적 역량이 부족한 팀을 지도하면서 강등을 피하기 위해 세트-피스를 상대에게 치명타를 날리는 무기로 활용했다. 두 감독 모두 키가 크고 건장한 선수들 선호했고 공격 상황에서 선수들을 대거 박스 안으로 투입했다. 이는 논리적으로도 타당한 시행이었고 실제로도 성공한 전략이었기 때문에 두 감독은 이를 반복 시행했다.


하지만 기술적 역량까지 뛰어난 구단이 세트-피스를 제대로 활용하면 어떻게 될까? 디에고 시메오네가 이끄는 아틀레티코 마드리드는 리오넬 메시와 크리스티아누 호날두가 버티고 있는 바르셀로나와 레알 마드리드 상대로 승리할 수 있다. 아틀레티코 마드리드는 이적료 지출, 임금 지출에서 바르셀로나, 레알 마드리드와 현저한 차이를 보이고 있지만 2013/2014시즌 라 리가 우승을 차지했다. 


뜻밖이겠지만, 잉글랜드에서도 비슷한 경우가 있었다.





알렉스 퍼거슨 경은 마지막 2시즌동안 맨체스터 유나이티드의 세트-피스 작업에 굉장한 주의를 기울였고 맨체스터 유나이티드의 세트-피스 데이터는 스토크 시티같이 보일 정도였다. 파트리스 에브라가 머리로 골을 넣기 시작했으며 명백하게 스트라이커 포지션에서 뛰는 웨인 루니와 로빈 반 페르시는 정확한 킥을 담당하기 위해 박스 바깥으로 빠졌다. 






알렉스 경 말년의 스쿼드가 노쇠화 되었으며 당시 적은 이적료를 지출했음에도 불구하고 맨체스터 유나이티드가 리그에서 뛰어난 퍼포먼스를 보여줄 수 있던 것은 세트-피스에서의 효율성을 극대화시켰기 때문이라고도 볼 수 있다.


마지막으로 저예산 구단이 리그 우승을 차지하는 스토리는 세트-피스 활용에 더욱 강력한 힘을 실어줄 것이다. FC 미트윌란은 적극적인 세트-피스 활용으로 덴마크 리그 우승을 차지했다. 미트윌란은 코너킥 말고도 다른 상황에서 엄청난 우위를 가져갔는데 그 상황은 다음 영상과 같다.






대다수 구단은 스로인 상황을 제대로 활용하지 못하고 스로인 상황에서 오픈 플레이 상황보다 득점을 기대할만한 플레이를 펼치지 못한다. 스로인이 그렇게 허비되어서는 안 될 기회임에도 불구하고 말이다.







아틀레티코 마드리드는 2014/2015시즌 스로인 상황에서 3골을 만들어내는 재미를 봤다. 앞서 영상에서 목격했듯이, FC 미트윌란 역시 스로인 상황에서 골을 만들어낸다. 하지만 이러한 전략의 선구자로 2008/2009시즌 토니 퓰리스의 스토크 시티를 언급하지 않을 수가 없다. 다른 구단은 그 어떤 생산성도 보이지 못했던 스로인 상황에서 스토크는 53번의 슈팅을 만들어냈고 8골을 기록했다. 스토크는 로리 델랍이 활약한 기간동안 스로인 상황에서 경기당 1.5회의 슈팅을 생산했고 이는 스토크 시티가 시도한 전체 슈팅 횟수의 15% 비중을 차지했다. 


세트-피스는 단순히 키가 큰 선수를 배치한다고해서 만들어지는게 아니다. 당연히 충분한 훈련 시간이 뒷받침 되어야 한다. 


필자는 여러 구단의 세트-피스 전략에 대해 컨설팅을 해주는데 "세트-피스 훈련에 시간을 얼마나 투자합니까?" 란 질문에 돌아오는 대답은 대다수 "5~15분" 이었다. 그것도 1주에!


1시즌간 생산되는 전체 득점의 25~33% 가 세트 피스에서 만들어진다. 세트-피스 득점이 차지하는 비중을 고려한다면, 적어도 하루 훈련에 15분은 투자한다고 말하는 것이 더 이치에 맞아보인다. 하지만 대다수 구단이 세트-피스에 별다른 신경을 쓰지 않고 있다.


대다수 구단은 경기당 0.3골을 세트-피스에서 만들어낼 수 있고 엘리트 구단은 이를 0.75~0.8골 수준까지 충분히 끌어올릴 수 있다. 결코 과장하는 것이 아니다. 


오늘날 1시즌에 15~20골 넣어줄 수 있는 스트라이커의 가격이 €100m 까지 솟아올랐다. 스트라이커 구매 비용을 들이지 않고서 세트-피스를 정교하게 가다듬어 15~20골을 더 생산해낼 수 있다면 그 가치는 정말 대단할 것이다.


세트-피스로 만들어내는 골은 결코 우연이 아니다.


필자는 뛰어난 성과를 거둔 팀들을 연구했고 세트-피스 퍼포먼스를 급진적으로 향상시킬 수 있는 프로그램을 개발해냈다. 새롭게 만들어낸 세트-피스 프로그램의 원리는 아주 간단하지만, 축구의 다른 것들과 마찬가지로 높은 수준으로 실행하기 위해서는 코치진과 선수들의 충분한 학습이 필요하다. 필자가 이야기하는 것들이 굉장히 뻔한 이야기라 느껴질 수 있는데 수많은 구단이 그 뻔한 것들을 시행하지 않는다는 것이 놀라울 따름이다. 지금부터 문제를 분석하고, 해결책을 발견해내어 훈련을 거쳐 경기날 피치 위에서 시행하는 일련의 과정들을 실제 사례를 통해 소개하고자 한다.



첫번째 스텝 : 수비 전략을 탐색하다




자, 이 그림에서 상대팀의 코너킥 수비 전략을 확인할 수 있다. 이 팀은 3명의 선수가 가까운 포스트(near post) 존에 위치해 있고 거기에 맨마킹 시스템을 혼합하고 있다.


두번째 스텝 : 상대의 전략을 깨부술 방법을 생각해낸다.





앞서 우리는 상대팀의 코너킥 수비 전략을 확인했다. 그렇다면 이제는 그 전략을 어떻게 깨부숴야 하는지 생각해봐야 한다. 시행할 수 있는 방법은 다양하다. 필자가 생각했던 방법은 다음과 같다. 


상대팀 골키퍼를 가리고(screen) 있을 1명을 배치한다. 그 이후에 마치 짧은 코너킥을 시행할 것 마냥 이 선수가 코너 플래그 진영으로 뛰어가게 만드는 것이다. 상대팀은 가까운 포스트 지역에 3명의 선수를 배치하고 적어도 1명의 선수가 자연스럽게 따라 자신의 구역을 벗어날 것이다. 따라서 자연스럽게 이 지역의 방어력이 떨어진다. 만약 어느 누구도 따라오지 않는다면, 우리 팀은 코너 부근에서 2명 vs 0명의 상황을 만들어낼 수 있다. 만약 뛰어난 드리블러가 이 지역에 있다면 상대팀에게 큰 혼란을 줄 수 있을 것이다. 상대팀에서 이 드리블러를 막아줄 선수가 단 한 명도 없으니까 말이다.





코너킥 플레이 방식이 결정되었다면, 이제는 선수들에게 노선을 배분하여 기억하게 만드는 일만 남았다. 반복숙달하면 선수들의 움직임은 아주 자연스러워질 것이다.


세번째 스텝 : 훈련장에서 시행한다.






네번째 스텝 : 실제 경기장에서 시행한다.


아래 영상에서 3가지 부분을 신경쓰며 보도록 하자


1. 우선 골키퍼 가까이 있는 공격팀 선수에 주목해보자. 그리고 그 선수가 움직일 때 어떤 일이 발생하는지 지켜보자.


2. 박스 주변에서 지역 방어를 수행하는 선수들을 주목해보자.


3. 공격팀 선수 중 1명이 먼쪽 포스트(far post) 방향으로 뛰어가는걸 깜빡했다. 그리고 이 케이스에서 바로 그 움직임이 없었기 때문에 골을 넣지 못했다는 점을 주목해보자.





골키퍼 앞에서 스크린을 치고 있던 선수가 완벽히 자리에서 이탈하는 순간, 이미 형성된 수비팀의 지역 방어가 어떻게 되는지 볼 수 있었다. 이 덕분에 자유로운 상태에서 가까운 쪽 포스트로 달려들 공간이 생겼고 (비록 기회를 잡지 못했지만) 먼쪽 포스트 방향으로 달려드는 선수가 있었더라면 흘러오는 공을 골로 연결할 수 있었을 것이다. 득점이라는 최상의 결과가 나오진 않았으나 이 과정은 매우 성공적이었다고 할 수 있다.


글을 마무리 하며...


세트-피스가 축구에서 가장 저평가되고 미개척 지역이라는 필자의 주장은 결코 과장되지 않았다. 


오늘날 프리미어 리그에서 1골의 가치는 대략 £2.5m 이다. 충분한 시간과 고된 훈련이 뒷받침 되어야 하겠지만, 세트-피스를 정교하게 다듬어 득점력 향상을 이뤄낸다면 그건 엄청난 가치를 창출해내는 것이다. 하지만 세계적으로 수많은 구단이 세트-피스에서 높은 수준에 도달하지 못한 상황이다.


세트-피스에 대해서 전문적인 분석과 연구가 시행된다면, 리그를 불문하고 상당한 재미를 볼 수 있을 것으로 기대 된다. 공격 루트에 대한 컨셉을 잡는 것 뿐만 아니라 스로인 공격에 대한 스케치, 능숙한 키커에 대한 충분한 훈련까지 시행된다면, 매 경기마다 1골씩은 세트-피스로 만드는 날이 올 것이다. 상상력이 풍부한 사람과 함께라면, 상대를 무력화시킬 수 있는 공격 방법은 무궁무진할 것이다.


물론 반대의 입장 (세트-피스 방어) 역시 마찬가지다. 뛰어난 능력을 가진 세트-피스 전문가는 매 경기마다 상대에 맞춰 향상된 수비 전략을 만들어낼 수 있다. 





출처 : http://statsbomb.com/2017/02/changing-how-the-world-thinks-about-set-pieces/





축구 분석에 관해 지난 몇년 사이 큰 변화가 있었다. 기존의 메트릭(metrics)이 공(ball)과 연관된 단일 사건을 중심으로 적용되었다면, 이제는 공 소유시간을 구성하는 개별 사건의 연속에 총체적인 분석을 적용하고 있다. 특정 사건만 측정하는 메트릭은 특정 사건의 전후 사정에 대해 정보를 제공하지 못한다. 하지만 연속된 상황에 대한 측정법은 전후 사정에 대한 정보를 추가적으로 포함할 수 있다. xG 메트릭도 슈팅을 시도하는 위치, 골대와의 각도 등을 활용해 득점으로 연결될 확률을 추정한다. 게다가 슈팅 이전에 어떤 패스를 받아 슈팅을 시도하는지도 고려하는 연구가 보다 활발해지고 있다.


결정적 찬스를 따지는데 어시스트 형태를 고려하는 것은 아주 합리적인 사고의 확장이다. 여기에 그 어시스트 이전의 패스 형태, 슈팅 시도 이전의 다른 이벤트(드리블 등...)를 고려하는 것 역시 우리가 시도할 수 있는 추가적인 사고의 확장일 것이다. 개별 이벤트를 측정하는 메트릭은 상황의 맥락적인 부분을 항상 요구하게 되고 이제 우리는 공을 점유하는 개념에 이를 적용하려 한다. 앞으로 우리는 2가지 용어를 정의하고자 한다. 


Sequences : 플레이의 흐름, Sequences는 수비 행위, 경기 중단, 슈팅 시도로 인해 종료된다.


Possessions : 1회 이상의 Sequences가 한 팀에게 잇달아 발생하는 것. 수차례 패스가 이어진 이후 슈팅을 시도했고 골키퍼가 이를 막아 코너킥 상황이 만들어진다면 이것은 1회 이상의 Sequence 지만 (플레이가 끊기기 때문에) 같은 팀이 계속 공격을 이어가기 때문에 1번의 Possession 으로 해석할 수 있다. 따라서 Possession 은 상대팀이 공을 다룰 수 있는 상황이 되어야 종료된다.


이 측정 모델의 주요 특징은 다음과 같다.


1. 경기장에서 발생하는 모든 이벤트가 Sequence, Possession 으로 이어지지 않는다.


2. 한 선수가 공을 컨트롤 하는 액션을 취하는 순간부터 Sequence가 시작된다. 상대에게서 공을 뺏어오는 태클, 인터셉트는 고려하지 않는다. 패스 혹은 드리블이 시작되는 순간부터 Sequence가 시작된다.


3. 새롭게 정의내리는 Possession 은 % 단위로 표시되는 기존의 개념에 반(反)한다. 하지만 A팀의 Possession 상황이 종료되면, B팀의 Possession 상황이 시작된다는 점에서는 기존의 개념과 동등하다.


다음의 Sequence 예시를 생각해보자. (물론 이것은 1번의 Possession 이라고도 볼 수 있다) 녹색으로 표시된 삼각형은 리버풀의 조엘 마팁이 헤더로 동료에게 패스를 시도한 것이다. 여기서부터 리버풀의 공격이 시작되어 녹색 화살표로 표시된 슈팅이 골대를 벗어나는 것으로 마무리 된다.





지금 예시로 든 Sequence는 리버풀이 공을 쟁취한 이후 슈팅을 시도하기 이전까지 어떤 과정을 거쳤는지 보여준다. 1번의 Sequence에 걸린 시간은 14.5초, 공이 움직인 총 이동 거리는 126.44m, 점유의 시작점부터 점유가 끝난 지점까지 직선 거리는 55.96m 이다. 

아래의 히스토그램은 경기당 Possession 횟수의 분포를 나타낸다. 일반적으로 경기당 200회 이하의 possession 상황이 발생하고 각팀의 possession 횟수는 90~100회 정도를 오간다고 할 수 있다.





아래 그래프는 2016/2017시즌 프리미어 리그에서 모든 sequence의 각 이동 거리를 보여준다. 수많은 Sequence 들이 금방 종료되며 이동 거리가 긴 Sequence의 빈도는 급격하게 줄어든다.







우리는 1번의 sequence를 통해 직행 속도(direct speed) 를 측정해볼 수 있다. sequence 의 시작 순간부터 종료 순간까지 공이 상대 진영으로 나아간 직선 거리를 sequence 의 진행 시간으로 나누어 그 속도를 계산해낼 수 있다. 앞서 우리는 리버풀이 14.5초 사이에 상대진영까지 55.96m 전진했음을 언급했다. 따라서 이 상황에서 리버풀의 직행 속도는 3.85 m/s이다. 이는 다른 수치들과 비교했을 때 비교적 빠른 속도라 할 수 있다. 

아래는 오픈 플레이 상황에서 2016/2017시즌 프리미어 리그 구단의 직행 속도 중위수를 보여준다.우리는 여기서 굉장히 흥미로운 사실을 발견할 수 있다. 아스날이 스토크 시티 & 레스터 시티와 유사한 기록을 보였다는 것, 맨체스터 유나이티드가 헐 시티, 본머스와 비슷한 기록을 보였다는 것이다. 이것은 경기 스타일이 성공적인 결과물과 반드시 상관관계를 지니는게 아니라는걸 보여준다.





공 소유에 대한 새로운 프레임은 코치들과 분석가들의 의문점에 대해 답을 해줄 수 있다. 기존의 개별 사건에 대해서만 측정하는 메트릭은 상황을 지나치게 요약해서 보여줬다. 하지만 새로운 Possession & Sequence 프레임은 행동의 연속적인 측정을 통해 패턴을 다룰 수 있다.

팀 플레이의 다이렉트함(directness)이 다음 2가지 요소 -공을 뺏어오는 위치, 측면을 적극 활용하는가? 아니면 중앙을 노리는가?- 에 어떻게 의존해 변하는지 생각해보자. 

의문을 해결하기에 앞서 우리는 Sequence의 시작점을 어떻게 구분할 것인지, 어디서부터를 측면으로 볼 것인지 정해두어야 할 것이다. Sequence의 시작점을 (자기 진영 vs 상대 진영) 으로 구분하는 것은 2가지 요소 중 첫번째에 대한 답을 준다. 측면을 사용하는 Sequence인지, 중앙을 활용하는 Sequence인지 구분하기 위해서는 주로 어떤 지역에서 전개 과정이 진행되는지를 고려하기로 했다. 





앞서 그래프에서 볼 수 있었듯이 첼시는 직행 속도(direct speed)가 뛰어난 팀이 아니었다. 우리는 Sequence 를 4(2*2)가지로 분류해서 보기로 했다. ( 자신의 진영에서 시작하는지 or 상대 진영에서 시작하는지 / 주로 중앙을 이용하는지 or 주로 측면을 이용하는지) 지난 2016/2017시즌 첼시는 자신의 진영에서 공을 되찾아와 중앙을 이용할 때, 직행 속도가 2.47m/s 까지 상승했다.  

이제 경기 중 발생한 데이터를 적용하여 경기를 분석할 때, 지금 우리가 제시한 Possession 프레임처럼 맥락을 활용하는 방식이 점차 보편화되고 있다. 이러한 방법을 통해서 선수와 팀, 혹은 리그 전반적인 경기 스타일에 대해 더 높은 이해력을 유지할 수 있다. 



오픈 플레이 상황의 Sequence 속에서 어떤 구단이 가장 많은 패스를 시도하는가?


오픈 플레이 상황만 고려하여 각 Sequence에서 20개 구단의 평균적인 패스 횟수를 구하면 다음과 같다. 맨체스터 시티는 1번의 Sequence에서 가장 많은 패스를 시도하는 구단이며, 90분 기준으로 다비드 실바가 57회 이상의 Sequence에 관여하여 맨체스터 시티 선수들 중 가장 많이 개입하는 선수라는 사실을 알 수 있다.





위와 비슷하게, 이번에는 수비 진영에서 시작하여 파이널 서드에서 끝나는 Sequence 만 따져보기로 했다. 





번리는 트렌지션(transition) Sequence 에서 평균적으로 3.9회의 패스를 시도한다. 한편 리버풀은 같은 상황에서 가장 많은 평균 7.7회의 패스를 시도하여 가장 차분하게 빌드업 플레이를 펼치는 것으로 결과가 나왔다.

이제는 각 팀별로 상대의 Sequence를 끊어내는 위치에 대해 알아보자. 각 팀이 어느 수준으로 압박을 시행하는지 알아볼 수 있는 아주 유용한 척도가 될 것이라 생각한다. 




역시 맨체스터 시티와 토트넘 핫스퍼가 탑2에 랭크되어 있다. 이들은 다른 구단보다 더 높은 곳에서 상대의 Sequence 를 종료시킨다. 한편 선덜랜드와 헐 시티는 자신의 진영에서 상대가 공을 컨트롤 할 수 있게 해준다. 번리가 9위에 랭크되어 있다. 번리의 포워드들이 공이 없는 상황에서 얼마나 효율적인지 보여주는 결과라 할 수 있겠다.


어떤 선수가 Sequence 에 많이 관여하는가?


지난시즌 탑6 구단의 중앙 미드필더들이 테이블을 장악하고 있고 하이 프레싱(high-pressing)을 거는 팀의 풀백들 또한 랭크되어 있다. 탑6 구단이 아닌 선수는 사우스햄턴의 피에르-에밀 호이베르그, 스토크의 찰리 아담 2명 뿐인데 두 사람 역시 모두 중앙 미드필더이다. 





출처 : http://www.optasportspro.com/about/optapro-blog/posts/2017/blog-sequences-and-the-premier-league/ & http://www.optasportspro.com/about/optapro-blog/posts/2016/blog-introducing-a-possessions-framework/






by Simon Kuper


잔루지이 부폰의 커리어에서 가장 중요했던 순간은 2006년 월드컵 결승전, 이탈리아와 프랑스의 승부차기였을 것이다. 승부차기에 들어가는 부폰은 결코 자신있어 보이지 않았다. 


부폰은 상대팀 키커의 승부차기 패턴을 미리 준비하는 유형의 선수가 아니며 직감에 의존하는 선수다. 하지만 프랑스에는 유벤투스 동료인 다비드 트레제게가 있었다. 다른 선수는 몰라도 트레제게와 부폰은 서로의 습관을 너무나도 잘 알고 있었을 것이다. 벤 리틀턴(Ben Lyttleton)이 집필한 페널티킥에 관련된 저서 <Twleve Yard>에는 유벤투스 훈련장에서 트레제게와 부폰이 트레이닝 세션 이후 페널티 연습을 종종했다는 이야기가 실려있다. 트레제게는 자신의 레퍼토리를 알고있는 골키퍼를 만났고 결국 막기 어려운 곳  -왼쪽 코너 상단- 으로 공을 차야겠다고 결심했다. 만약 트레제게의 공이 조금만 낮았더라면 축구 역사는 완전히 다르게 쓰였을 것이다. 트레제게의 공은 결국 크로스바를 맞췄고 부폰에게는 행운이 따랐다. 결국 부폰은 자신의 커리어에서 가장 위대한 타이틀을 따냈다.


6월 3일, 웨일즈의 카디프에서 39세 부폰은 마지막이 될지도 모르는 챔피언스 리그 결승전에 출전한다. 결승전은 종종 승부차기에 의해 결정되는데 만약 이번 경기에서도 승부차기에 돌입한다면, 부폰에게는 직감 이상의 무언가가 필요하다. 지난해 결승전에서 레알 마드리드가 승부차기는 과학적이라는걸 입증했기 때문이다.


승부차기 과학의 시대를 연 경기는 2008년 모스크바에서 열린 챔피언스 리그 결승전, 맨체스터 유나이티드와 첼시의 경기였다. 당시 첼시의 감독이었던 아브람 그란트는 스페인의 유명한 경제학자 팔라시오스 푸에르타(Palacios Huerta)에게 도움을 요청했다. 팔라시오스 푸에르타는 수천번의 페널티킥에 대한 데이터베이스를 구축한 인물이다. 세계 최고의 페널티 키커, 세계에서 페널티를 최고로 잘 막는 골키퍼를 데려다 놓더라도 그가 어떠한 선택을 할지 100% 확신할 수 있는 사람은 없다. 하지만 푸에르타는 자신의 풍부한 데이터를 바탕으로 어느 누구보다 좋은 추측을 해낸다. 그의 데이터베이스에서 에드윈 반 데 사르에 대해서 내릴 수 있던 아주 중요한 결론이 있었다 : 승부차기에서 반 데 사르는 주로 오른쪽으로 다이빙을 한다.


첼시는 푸에르타의 조언을 그대로 사용했다. 첼시의 6번 키커까지 모두 반 데 사르의 왼쪽으로 슈팅을 시도했다. 아주 간단한 전략이지만 이 전략은 통하고 있었다. 반 데 사르는 거의 반대 방향으로 뛰고 있엇고 (호날두의 슈팅을 막은 체흐와 달리) 반 데 사르는 1번의 선방도 해내지 못했다. 만약 존 테리가 미끄러지지 않았더라면 첼시가 우승을 차지했었을지도 모른다. 테리 역시 반 데 사르의 왼쪽으로 공을 찼고 반 데 사르는 이번에도 오른쪽으로 넘어졌지만 테리의 킥은 골문을 외면했다. 


7번째 키커는 니클라스 아넬카. 유나이티드 벤치에 있는 알렉스 퍼거슨 경은 점차 자신이 내세운 골키퍼의 판단에 실망하고 있었다. "나는 에드윈이 왼쪽으로 다이빙하길 원했는데 에드윈은 계속 오른쪽으로 넘어지더라." 이후 퍼거슨의 모스크바에서의 결승전에 대해 이렇게 회고했다.


아넬카가 킥을 준비하는 순간 키가 큰 반 데 사르는 양손을 뻗었다. 아마 그 순간은 아넬카의 심장을 철렁하게 만든 순간이었을 것이다. 반 데 사르가 검지로 왼쪽을 가리킨 것이다. 마치 아넬카에게 "너 여기로 찰꺼지? 내가 다 알아." 라고 말하는 것처럼 보였다.





이제 아넬카는 엄청난 딜레마에 빠졌다. 아넬카는 이전 키커들과 마찬가지로 반 데 사르의 왼쪽을 향해 차려 했는데 (키커 기준 오른쪽) 반 데 사르가 그 의중을 읽은 것이다. 이제 아넬카는 어떤 결정을 내리는가? 그는 반 데 사르의 왼쪽으로 공을 차려했던 그 결심을 접었다. 대신 반 데 사르의 오른쪽으로 공을 찼다. 거기까지는 괜찮을 수 있다. 하지만 날아가는 공의 높이가 문제였다. 푸에르타가 첼시에게 조언할 때 절대로 차지 말아야할 높이, 반 데 사르가 가장 잘 막는 높이로 공이 날아간 것이다. 예상대로 반 데 사르는 아넬카의 킥을 막았다. 이 장면을 TV로 시청하고 있던 푸에르타는 굉장히 실망했다. 아넬카는 2가지 관점에서 푸에르타의 조언을 따르지 않았고 결국 첼시는 챔피언스 리그 우승 트로피를 획득하지 못했다.


이제 승부차기 통계를 활용하는 것은 루틴(routine)이 되었다. 2012년 바이에른 뮌헨과의 챔피언스 리그 결승전을 앞둔 첼시는 푸에르타의 도움을 받을 필요가 없었다. 왜냐면 이미 첼시 스스로가 방대한 양의 페널티킥에 대한 지식을 가지고 있었기 때문이다. 페트르 체흐는 지난 5년간 바이에른 뮌헨 선수들의 페널티킥 영상이 담긴 DVD를 2시간 가량 학습했고 첼시 구단의 데이터팀은 체흐에게 바이언 선수들의 킥 정보를 체흐에게 제공했다. 그날 밤, 체흐는 바이언의 6번의 페널티킥 방향을 모두 읽었다. (1번은 경기 중, 5번은 승부차기) 결국 챔피언스 리그 트로피는 첼시의 것이 되었다.


지난해 밀라노에서 개최된 챔피언스 리그 결승전도 승부차기 끝에 승부가 갈렸다. 아틀레티코는 동전 던지기에서 승리했는데 매우 치명적이고, 절대 하지 말아야할 실수를 저질렀다. 아틀레티코가 나중에 차는 것을 선택한 것이다. 푸에르타의 연구에 따르면, 먼저차는 팀이 승리할 확률이 60%다. 나중에 차는 팀은 골을 넣어야만 스코어를 따라잡는 것이기 때문에 심리적인 부분에 미치는 영향이 굉장히 클 것으로 추정된다.


사람들은 동전 던지기에서부터 이기고 들어가는 것을 잘 모른다. 중계진은 동전 던지기에 대해서 거의 언급하지 않는다. 동전 던지기에서 이겨놓고서 나중에 차는 선택을 하는 실수를 저지른 캡틴이 또 한명 있다. 그가 바로 잔루이지 부폰이다. 유로 2008에서 부폰은 동전 던지기에서 이겼는데 스페인의 선축을 선택했다. 스페인은 승부차기 끝에 이탈리아를 이겼고 대회에서 우승을 차지했다.


대체 왜 아틀레티코는 레알 마드리드에게 선축을 넘긴 것일까? 아틀레티코가 16강에서 승부차기 끝에 PSV를 이겼을 때, 나중에 찼던 기억이 있기 때문일까? 푸에르타는 2015/2016 UEFA 챔피언스 리그 결승전 종료 이후 나에게 이메일로 "최고 수준 레벨에서 (동전 던지기를 이기고도 선축을 선택하지 않는) 이런 결정을 내린 것이 놀랍다." 라고 말했다.


푸에르타는 11,000회의 페널티킥 데이터를 바탕으로 승부차기에서 선축이 매우 유리하다는 결론을 내렸는데 아틀레티코는 나중에 차고 PSV를 이긴 단 1번의 사건을 너무 과신해 도박을 감행한 것이다.


경기가 끝난 며칠 후, 네덜란드의 분석가인 피테르 츠바르트(Pieter Zwart)는 자신의 페이스북 페이지에 아주 흥미로운 비디오를 올렸다. 그 비디오의 제목은 "레알 마드리드 선수들이 얀 오블락의 다이빙 방향을 알았던 것인가?" 이다.


그 비디오는 얀 오블락이 방향을 설정하는 과정을 담고 있다. 상대 키커가 슈팅을 시도하기 바로 전, 오블락은 자신이 다이빙하기로 마음먹은 방향으로 스텝을 밟는다. 그 스텝으로 오블락은 자신이 마음먹은 방향으로 빠르게 다이빙할 수 있지만, 문제는 상대팀 선수가 그걸 읽는다는 것이다. 레알 마드리드 선수들은 오블락의 그 습관을 알고 있는것처럼 보였다. 레알 마드리드의 5번의 슈팅 중 4번이 모두 빠르지 않은 공이었고 선수들은 오블락이 스텝을 밟는걸 기다린 후 반대 방향으로 공을 부드럽게 밀어넣었다.


유러피언컵 결승에서 데이터 분석이 승리한 것이다. 축구는 점점 더 스마트해지고 있다.


유벤투스는 부폰이 상대의 킥을 분석하고 나오길 바라야할 것이다. 유로2012에서 잉글랜드전 승부차기 승리를 거둔 이후 부폰은 스스로 잉글랜드 선수들의 페널티킥을 분석했다고 말했다. 하지만 레알 마드리드도 부폰에 대해 연구하고 있을 것이다. 토요일 결승전을 위해 부폰은 더 많은 준비를 할 필요가 있다.




출처 : http://www.espnfc.com/uefa-champions-league/2/blog/post/3136513/penalty-shootouts-in-champions-league-and-other-cups-and-tournaments-decided-by-science



IMPECT & Packing : 축구 분석의 미래

Football Stats 2017. 5. 22. 19:09 Posted by Seolskjaer





A팀 : 점유율 52%, 전체 슈팅 횟수 18회, 코너킥 7회


B팀 : 점유율 48%, 전체 슈팅 횟수 14회, 코너킥 5회


우리는 TV중계로 축구를 보면서 이러한 부류의 통계량을 쉽게 마주한다. 과연 이 숫자들이 어떠한 의미를 전달하고 있을까? 당신은 이 기록을 바탕으로 어떤 팀이 이겼는지 말할 수 있는가?


이 경기는 2014년 브라질 월드컵 준결승전 기록이다. A팀은 브라질이고 B팀은 독일이다. 독일은 7-1이라는 아주 역사적인 스코어를 남기며 결승전 진출에 성공했다. 하지만 바로 위에서 나열했던 데이터만 살펴보면 굉장히 치열한 접전이 펼쳐졌을 것처럼 보인다.


간단히 이야기하자면 이렇다. 피치 위에서 발생하는 사건을 잘 반영하지 못한다면 그 통계량은 사기나 다름없다.


지난 10년 가까이 TV 프로그램은 어떠한 세밀한 분석없이 시청자들에게 그저 셈한 숫자, 날것 그대로의 데이터를 양적으로만 제공했다. 전술에 대한 논의, 통계에 대한 논의들이 시작되면서 틈새시장을 공략한 방송, 웹사이트들이 있지만 여전히 데이터는 지금보다 더 가공처리 되어야하고 평가받을 수 있어야한다. 현재 축구를 분석하는 컨텐츠는 온라인 세계에서 이루어지고 있다. 따라서 축구소비에서 주류가 아닌 Spielverlagerung.com이나 Statsbomb.com과 같은 웹사이트는 경기 이후 가볍게 축구를 TV로만 시청하는 사람들에게 존재가 유의미하지 못하다. 


키커(Kicker), 스포츠빌트(SportBild), 슈폭스(Spox)처럼 규모가 큰 웹사이트는 이적 루머, 사진, 인터뷰로 가득 차있다. 애널리틱스와 관련된 글은 길고 내용도 어렵다. 간단히 "포그바가 인스타그램에서 FC 바르셀로나 글에 좋아요를 눌렀다. 이적이 임박한 것일까?" 같은 기사보다 접속량 자체가 적다.


2015년 스테판 라이나르츠(2016년 바이어 레버쿠젠에서 은퇴)와 옌스 헤겔러(Jens Hegeler, 당시 헤르타 베를린 소속)는 이러한 문제들을 인지하게 되었다.


수비형 미드필더인 두 사람은 커리어 내내 자신들의 실제 기여도를 제대로 반영하지 못하는 도구와 방법론을 활용해 그들의 퍼포먼스를 평가하는 감독과 미디어에 대한 짜증이 났다. NFL에선 리처드 쉐먼같은 코너백 포지션 선수들은 상대의 공격끊기, 인터셉트, 태클만으로도 스타가 될 수 있다. NBA에선 브루스 보웬, 데니스 로드맨같은 선수들은 스틸, 블록, 리바운드로 자신의 가치를 증명해낼 수 있다. 하지만 축구는 오로지 골과 어시스트 뿐이다.


발락처럼 골을 넣는 능력이 뛰어나거나, 피를로처럼 프리킥을 전담하지 않는 이상 수비형 미드필더는 언제까지나 언성-히어로가 될 수 밖에 없다. 수비형 미드필더는 상당히 중요한 역할을 수행하지만 그들의 역할은 스탯 범주에 드러나지 않는다. 이 장면에서도 마찬가지다. 비달은 유벤투스의 포그바로부터 공을 뺏어냈고 측면에 위치한 코망에게 공을 연결했다. 비달은 득점 장면을 만드는 과정에서 핵심적인 역할을 수행했을 뿐만 아니라 유벤투스의 역습 가능성을 차단했다. 하지만 이 장면에서 의미있는 통계를 획득한 선수는 오직 어시스트를 올린 코망과 골을 넣은 뮬러 뿐이다.



평상시 우리가 보던 통계는 왜 안좋은가?


우리가 평상시 마주하는 통계들 그 자체는 나쁘지 않다. 그것들도 역시 정보를 포함하고 있다. 하지만 그것은 양적(quantity)이지 질적(quality)이지 못하다. 다른 것들과 동떨어진 점유율 그 자체는 아무 의미가 없다.


티아고 알칸타라의 멋진 스루볼은 눈 깜짝할 사이에 발생하는 사건이지만, 그 패스는 바이언의 점유율에는 부정적인 영향을 미친다. 설령 그것이 레반도프스키의 골로 연결되어도 말이다.




"전체 슈팅 횟수(Total Shots)" 도 크게 의미하는 바가 없다. 가까운 거리에서 시도한 리오넬 메시의 슈팅이나 35미터 떨어진 지점에서 하이코 베스터만이 절박하게 시도한 중거리 슈팅 모두 똑같이 슈팅 1회다. 


"코너킥 횟수"의 가치는 팀마다 다르다. 티키-타카를 활용하는 스페인이나 바르셀로나는 코너킥 상황에서도 직접 박스로 공을 올리지 않는 반면, 피지컬적인 축구를 구사하는 리버풀이나 잉글랜드는 세트-피스에 크게 의존하는 경향이 있다.


"패스 성공률"은 모든 패스마다 리스크/보상 시나리오를 평가하지 않는한 결점을 보일 수 밖에 없다. 2015/2016시즌 분데스리가에서 소크라티스는 88%의 패스 성공률을 기록했고 마츠 후멜스는 85%의 패스 성공률을 기록했다. 하지만 정말로 후멜스가 소크라티스보다 패스 능력이 떨어지는가? 그건 아니다.


득점 기대값(ExpG), 전체 슈팅 비율(Total Shot Rate) 같은 발전된 메트릭이 존재하지만, 이러한 통계량은 일반적인 시청자들에게 굉장히 어려운 내용이다.


그리고 ExpG 역시 상당한 결점을 가진 통계량이다. ExpG는 피치 위 특정 지역에서 슈팅이 들어갈 특정한 확률이 있다고 가정한다. 글쎄... 직접 축구를 해본 사람들이라면 날씨, 피치 상태, 신체 컨디션, 축구화 종류에 따라서도 슈팅이 상당히 달라질 수 있다는걸 알고 있을 것이다. 축구에서 완벽하게 동등한 상황이란 없다.


3,000만명 이상의 독일인이 디 만샤프트(Die Mannschaft, 독일 국가대표팀) 경기를 본다는 것을 잊지 말자. 할머니와 애기들도 보는게 국가대표팀 경기인만큼 이해하기 쉬운 메트릭을 써야한다. 대다수 미국 국민들은 NFL의 Sack, 농구의 리바운드에 대해서 알고 있다. 하지만 ExpG를 알고 있는 독일 국민이 얼마나 될까?



새로운 메트릭은 무엇을 하는가?


Impect 메트릭은 모든 선수들의 플레이를 "퀄리티"에 기반하여 평가해야 한다는 점에서 시작한다. 공이 상대 수비를 지나쳐야만 (Gegner überspielt) 골을 넣을 수 있다. 상대 수비수를 제치는 것은 플레이의 퀄리티를 높여준다. 더 많은 수비수를 제친다면, 플레이 퀄리티는 더 높아진다. 이것은 전혀 의심할 여지가 없다.


"상대 수비수를 제친다는 것" 이것은 엄청난 약진이다. 개인의 주관적인 판단을 완벽하게 제외하면서 플레이의 퀄리티를 측정할 수 있다. 상대 수비수를 제쳤는가? 제치지 못했는가? 둘 중 하나다.


수비하는 팀은 분명히 제쳐지지 않으려고 한다. 따라서 상대에게 제쳐진 경우가 적은 것(Überspielt werden)은 그만큼 수비를 잘한다는 의미가 된다.


즉 특정 플레이가 이루어지기 전후 상황에서의 수비수 숫자를 따지는 것이다. 패스 뿐만 아니라 드리블 시도, 턴오버, 인터셉트 같은 경우에도 다 적용될 수 있다. 앞서 언급한 비달의 예시에서는, 비달은 바이언이 역습에 취약한 상황에서 공을 다시 뺏어냈고 그가 이 상황에서 기록한 가로채기는 바이언 동료 6명이 뒤에 있었을 때 기록하는 가로채기보다 더 높은 가치를 지닌다.


결국 "제친 상대팀 선수 숫자 총 합" 이 패킹-비율(Packing-Rate)라 불리게 된다.


추가로 Impect는 공격하는 입장에서 수비수를 제치는 것이 수비수가 프레싱을 걸어오는 공격수를 제치는 것보다 가치있는 사건이라 측정한다. 회사 이름 그대로 후방에 위치한 수비수가 제쳐진 횟수를 "IMPECT"라 부르며 이 역시 집계된다.



왜 새로운 메트릭이 더 좋은가?


브라질과 독일의 맞대결을 다시 생각해보자. 하지만 이번에는 라이나르츠와 헤겔러의 시스템이 말하는 기록으로 경기를 바라보자.







독일은 브라질보다 상대팀 선수를 61회 더 제쳤다. 독일이 약 15% 앞섰지만 이것만으로 7-1 스코어를 설명할 수는 없다. 그런데 IMPECT 횟수는 보다 직관적이다. 독일은 브라질보다 상대 후방 수비수를 훨씬 더 많이 제쳤다.





영상의 1분 23초에서 멈춰보자. 2명의 브라질 센터백이 크로스와 뮬러 사이에 서있다. 단테와 다비드 루이즈 특유의 머리 스타일로 쉽게 두 센터백의 위치를 파악할 수 있다. 패스가 상대팀 센터백보다 뒷쪽으로 연결이 되면, 자연스럽게 매 순간 위협적인 찬스가 만들어진다. 


이전의 메트릭이 적용된다면, 뮐러는 여기서 "패스 1회 성공" 이라는 결과를 받아들이게 된다. 크로스의 멋진 패스도 역시 마찬가지로 "패스 1회 성공"으로 기록될 것이다. 뮬러와 크로스는 통계적으로 많은 사랑을 받지 못하겠지만 클로제는 모든 것을 다 가져간다. 


이전의 메트릭은 잘 통하지 않는다. 그 대신에 IMPECT가 특정 플레이의 진정한 가치를 이야기해준다.





IMPECT 메트릭은 클로제가 골대와 상당히 가까운 거리에서 슈팅을 시도했다는 것을 고려하지 않는다. 이 플레이는 크로스와 뮬러가 거의 다 만들어낸 것이며 클로제는 그저 골대 안으로 공을 넣었을 뿐이다.


IMPECT 관점에서 바라보면, 클로제는 뮬러의 패스를 받은 것으로 +1점을 버는 것에 그친다. 그게 전부다. 분데스리가에서 뛰는 선수라면 누구나 거기서 골을 넣을 수 있다. 하지만 이 상황에서 토니 크로스가 뮬러에게 연결시킨 패스는 오직 극소수의 월드 클래스만 해낼 수 있는 패스다. 그게 가장 큰 차이다.


크로스는 뮬러에게 공을 연결시킴으로써 수비수 4명을 제쳤다. +4점. 뮬러 역시 그 공을 받음으로써 독일이 수비수 4명을 제치는데 공헌했다. 뮬러도 +4점. 뮬러는 공을 클로제에게 연결하면서 마르셀루를 무력화시켰고 추가로 +1점을 벌었다. 브라질 관점에서는 -5점이 된 것이다. 


이 과정에서 MVP는 뮬러다. 그는 아주 작은 공간 속에서도 온사이드 상태를 유지하면서 크로스의 패스 길을 만들어냈다. 또한 본인이 연결받은 공을 클로제에게 연결함으로써 총 +5점의 효과를 만들어냈다. 마침내 우리는 누가 진정한 찬사를 받아야 하는지 알 수 있게 되었다.




다른 예시 : 후멜스에서 로이스로


패킹 관점에서 후멜스와 로이스는 각 +6점을 획득한다. 후멜스의 패스와 로이스의 침투는 동등한 가치를 지닌다. 이는 미식 축구에서 쿼터백과 와이드 리시버가 같은 플레이 상황에서 스탯을 생산하는 것과 똑같다. (야드, 캐치 / 패스 성공) 후멜스의 패스도 끝내줬지만, 로이스가 침투하는 방향이나 타이밍 역시 그 못지않게 완벽했다. 만약 후멜스가 패스를 잘못 줬거나 로이스가 침투의 타이밍과 방향을 잘못 잡았다면 이 플레이의 가치는 죽었을 것이다.





이전의 메트릭에서 상대 수비수를 제치지 못하는 패스도 동료에게 연결만 된다면 패스 성공으로 간주되었지만, 패킹은 그러한 패스들을 집계하지 않는다. 즉, 패킹에서 상대 수비수를 제치지 못하는 패스나 백패스는 무시되는 것이다. 전진하지 않는 패스는 득점에 도움이 되지 않는다. 이것은 올바른 평가이다. 이에 대해 반박할 수 없을 것이다. 또 그러한 의미없는 패스들을 제외함으로써 샘플의 사이즈가 줄어들고, 데이터 분석과 처리를 더욱 빠르게 시행할 수 있다.


메시의 위대함은 숫자로도 나타난다.





이 놀라운 득점 장면은 패킹 비율로 따졌을 때 +4점을 줄 수 있다. 이 드리블이 위대한 이유는 메시가 슈팅을 시도하는 순간에도 여전히 3명의 수비수가 남아있었다는 점이다. 패스로도 +4점의 패킹 비율을 얻는 것은 굉장히 어려운 일이다. 그런데 메시는 오로지 자신의 발로 +4점을 획득했고 아주 가차없는 골까지 넣었다.


메시의 이러한 경이적인 스킬에도 불구하고 2015/2016시즌 IMPECT MVP는 메시가 아닌 토니 크로스였다. 


크로스는 경기당 85명(!!)의 수비수를 제쳣다. 수비형 미드필더의 평균치는 28명이다. 크로스가 뛰어난 패스 능력을 갖췄다는 것을 알기위해 정교한 메트릭이 필요한 것은 아니겠지만, 크로스가 독일 국가대표팀과 레알 마드리드에서 어느 정도의 가치를 지니는 선수인지 알려주는 지표라 할 수 있다.



이러한 기록이 누구에게 베팅해야 하는지도 알려주는가?


여전히 우리는 결과를 예측할 수 없다. 상대팀 수비수를 제치는 횟수가 많은 팀이 지지않을 확률이 86%라는 것만 알 뿐이다. 하지만 IMPECT는 더 좋은 플레이를 펼친 팀이 "이겨야만 했거나 최소한 지지는 말았어야 했다" 라는걸 구분하게 해준다. 이것은 다양한 부분에서 많은 이야기를 전해준다.


패킹 비율 싸움에서 이겼음에도 경기에서 패배한 14%에 속하는 팀들은 그 때서야 불운이나 선수 개인의 실수에 대해서 지적할 수 있다. 감독들은 자신의 팀이 불운했다는 것을 통계 자료를 통해 증명해냄으로써 자신의 자리를 보전할 수도 있다. 훗날 크로스와 쟈카같은 선수들이 스트라이커 못지않은 큰 돈을 벌 수도 있다.


선수 평가에 있어 혁명이 이루어져 단장들은 막대한 이적료가 지출되는 무대에서 더 좋은 의사결정 도구를 가질 수 있다. 빠른발과 압도적인 피지컬은 부상 및 선수가 나이를 먹어감에 따라 사라질 수 있지만, 가치있는 패스를 시도하는 능력은 그것보다는 느린 속도로 하락한다. 챠비와 피를로에게 물어보라. 두 선수는 35세가 넘는 나이에도 챔피언스 리그 결승전을 제대로 소화해냈다. 그렇게 패스 길을 볼 줄 아는 선수들은 나이의 영향을 잘 피해간다. 


이제 구단은 한 선수가 상대팀보다 단순히 빠르거나 신체적으로 강한 것 뿐인지 아니면 가치있는 패스를 시도할 수 있는 선수인지 구별해낼 수 있다.



메트릭의 다음 단계는?


라이나르츠와 헤겔러가 만들어낸 이 통계는 축구 애널리틱스 관점에서 그야말로 비약적인 발전이므로 자연스럽게 수요가 상당하다.


독일 국가대표팀, 바이어 레버쿠젠, 보루시아 도르트문트, RB 라이프치히는 이미 패킹 기술의 라이센스를 획득했다. 구매 고객들을 고려한다면, IMPECT가 분명히 무언가 가치있는 정보라는 것을 알 수 있다. 로저 슈미트, 요하임 뢰브, 토마스 투헬, 랄프 랑닉까지 이들 모두 오늘날 축구계에서 스마트하고 가장 혁신적인 인물이다. 만약 이들이 공통적으로 무언가를 좋아한다면, 그것은 정말 확실하다는 것이다.


유로2016에서 독일의 ARD 방송에서는 패킹 비율을 사용할 것이다. 과거 바이언에서 활약했던 스타이자 현재 ARD에서 활약하고 있는 메멧 숄(Mehmet Scholl)은 패킹 데이터를 실시간으로도 처리할 수 있다고 말한다. 그 무엇보다 중요한 것은 패킹이 이해하기 쉽다는 것이다. 가볍게 축구를 즐기는 사람에게도 결코 무겁게 느껴지지 않을 정보라는 것이다.


IMPECT 통계량은 인터넷에서 인기를 끌고 있는 ExpG과 같은 메트릭들과 결합할 수 있다. 그 결과 각 포지션이나 선수들에게 훨씬 더 잘 맞춰진 숫자들을 제공해줄 것이다. 


람이냐 말디니냐? 호날두냐 메시냐? 지단이냐 귄터 네쳐냐? 루이스 수아레즈냐 클린스만이냐?  이처럼 오랫동안 이어진 "누가 더 나은 선수인가?" 란 논쟁은 훨씬 잘 정립될 수 있을 것이다. 


"모든 통계들은 다 쓸모없는 것" 이라 주장하는 전통주의자 입장에서도 걱정할 것은 없다. 리버풀의 4-3 승리로 끝난 리버풀과 도르트문트의 맞대결 같은 케이스들은 언제든지 일어난다. 그런 경기들은 가장 발전된 예측 모형과 알고리즘이 틀렸다고 말할 것이다. 하지만 스프레드시트로 경기를 보는 사람들 입장에선 IMPECT와 같은 새로운 숫자는 엄청난 발견이다.


내가 걱정하는 것은 단 하나다. 가장 발전된 메트릭이 유행을 타기 시작한다면 레알 마드리드와 바이언같은 구단이 도르트문트나 비야레알에서 근무하고 있는 최고의 분석가들과 기술자를 데려갈 것이라는거다. 불행하게도 정보 전쟁은 돈으로 이길 수 있다. 따라서 야구처럼 진보된 메트릭이 빈부격차를 좁혀줄 것이라 기대하지 않는 것이 좋다. 바르셀로나 라 마시아의 데이터 센터는 다름슈타트98의 데이터 센터보다 더 클 것이다. 그럴 것이라 확신한다.


어쨌든 유럽 최상위 리그에서 "머니볼" 시대가 도래했다고 생각한다. 이제 그럴 때가 왔다.




출처 : http://bundesligafanatic.com/impect-packing-the-future-of-football-analytics-is-here/







마무리 능력에 대한 재검토

Football Stats 2017. 5. 8. 11:20 Posted by Seolskjaer




선수를 영입 및 평가하는 과정에서 우리는 서로 다른 길을 걸어온 선수, 커리어의 서로 다른 단계에 있는 선수들을 비교하는 실수를 흔하게 저지른다. 극단적이면서 아주 분명한 예시를 통해 이야기를 이어가자. 시즌 초에 마커스 래시포드와 웨인 루니에 대해 비교했던 것을 떠올려보자. 래시포드는 프리미어 리그 출전 횟수가 단 11번에 불과한 18세 선수이고 루니는 프리미어 리그 출전 횟수만 400경기가 넘는 30대 선수이다.


이번 글에서는 전환율(conversion percentage)이란 간단한 통계량을 중심으로 이야기를 이어갈 것이다. 지금부터의 접근법에서 우리는 선수의 과거 퍼포먼스 뿐만 아니라 미래 퍼포먼스에 대한 우리의 예측에 대한 다양한 수준의 불확실성까지 고려할 것이다. 


우리는 축구를 분석하는 국면에 접어들었고 이제는 xG같이 한층 발전된 통계량이 공격수를 평가하는 과정에서 등장하고 있다. 하지만 전환율은 충분히 좋은 논의의 시작점으로 활용될 수 있다. 평균적인 전환율을 꾸준히 뛰어넘는 선수가 분명히 존재할 것이기 때문이다. 그렇다면 우리는 분석할 선수들을 어떻게 뽑아내야 할까?


나는 야구의 타율(batting averages)를 추정하는 데이비드 로빈슨(David Robinson)의 방식을 사용할 것이다. 우선 2005/2006시즌부터 2015/2016시즌까지 프리미어 리그, 라 리가, 분데스리가, 세리에 A, 리그 앙에서 뛴 선수들의 전환율을 전수조사했다. 아래 첨부된 테이블은 조사기간 최고의 전환율을 기록한 선수들을 보여준다.






아주 뛰어난 전환율에도 불구하고 마르셀 지메르(Marcel Ziemer)는 분데스리가에서 뛴 시간이 총 37분에 불과하다. 또 1번 슈팅해서 1골을 기록한 골키퍼 팀 하워드가 프리미어 리그 최고의 피니셔라 불릴 수는 없을 것이다. 5명 모두가 충분한만큼의 슈팅을 시도하지 않았기 때문에 이들을 최고의 피니셔로 선정하기에는 분명한 문제가 있어보인다. 전환율이 아주 작은 표본을 가진 선수들에 의해 왜곡되었다고 말할 수 있다. 그렇다면 적어도 30회 이상 슈팅을 시도한 선수들을 대상으로 따져본다면 어떤 결과가 나올까?





아까보다는 조금 더 좋아보인다. 하지만 최고 수준의 전환율을 보여주는 선수가 아우스크부르크의 라이트백인 폴 베르헤흐인 것으로 나온다. 포지션이 스트라이커인 바스 도스트와 다리오 시타니치가 포함되어 있어 아까보다는 나아졌다고 할 수 있지만 여전히 이것만으로는 불만족스럽다.


우리가 분석의 문제점을 느낀 순간으로 돌아가 보다 더 많은 정보를 포함한 접근을 시도해보자. 평균적으로 슈팅 11번에 1골이 나온다. 따라서 우리는 슈팅 11번당 1골이 선수들의 평균적인 전환율이라 가정을 할 수 있을 것이다. 즉 슈팅을 30회 이상 시도한 선수들의 평균적인 전환율이 9.12%인 것이다.



 

 

여기서 우리는 더 많은 슈팅을 시도할수록 전환율이 빨간색 실선으로 표시된 평균에 가까워짐을 알 수 있다. 슈팅을 적게 시도한 선수들 사이에서는 전환율의 변동성이 크다. 더 많은 슈팅을 시도할수록 평균적인 전환율에 가까워지는 것은 "통계적 회귀 현상" 이다. 따라서 폴 베르헤흐처럼 슈팅 횟수가 적고 전환율이 높은 선수들은 슈팅수가 늘어날 경우 점차 평균에 가까워질 것으로 전망할 수 있다.

 

하지만 우리는 평균으로 회귀하는 현상 말고 다른 요인들도 영향력이 있다는걸 알고 있다. 따라서 단순히 통계적 회귀만으로 예측하는 것은 지나치게 현상을 단순화할 위험을 내포하고 있다. 그런 오류를 조정하기 위해서 경험적 베이지안 추정 같은 방법들을 사용하기도 한다.

 

우리는 모든 선수들이 적어도 9.12%의 전환율을 기록할 것이라는 믿음에서 논의를 시작했지만 새로운 데이터는 우리가 믿는 추정의 출발점을 변경할 것을 권한다. 따라서 한 선수가 단 1번 슈팅으로 1골을 기록한다고해서 그 선수의 전환율이 즉시 100%가 되어서는 안 될 것이다. 





지금 우리가 받아들인 표가 훨씬 더 합리적인 것처럼 보인다. 상위 5명에 맨체스터 유나이티드와 바이어 레버쿠젠에서 인상적인 득점률을 선보인 하비에르 에르난데스가 포함되어 있고 마찬가지로 세비야와 AC 밀란에서 냉철한 득점력을 보여주는 카를로스 바카 역시 포함되어 있다. 하지만 여전히 고작 51번 밖에 슈팅을 시도하지 않은 폴 베르헤흐가 포함되어 있어 의심스럽다. 


우리는 차트에서 또 다른 추세를 확인할 필요가 있다. 고전 통계는 더 많은 슈팅을 시도하면 할수록 전환율이 평균에 수렴하는 추세를 보일 것이라 이야기하지만, 우리가 보고있는 자료는 그렇지 않다. 고전적인 통계 이론에서 벗어난 것을 이해하기 위해서 우리는 축구란 경기 그 자체를 이해할 필요가 있다.





파란색 실선은 매우 직관적이다. 커리어 통틀어 500회 이상 슈팅을 시도한 선수들의 산포를 보자. 슈팅을 500회 이상 시도한 선수들 대다수가 평균적인 성공률 9.12%를 뛰어넘고 있다.


그렇다면 왜 이러한 추세가 나타나는 것일까? 본래 슈팅 능력이 뛰어난 선수가 더 자주 슈팅을 시도하는 법이다. 슈팅 능력이 좋은 선수가 더 많은 출전시간을 부여받고 자신의 슈팅 능력을 신뢰하는 선수 본인은 더욱 자주 슈팅을 시도한다. 슈팅 능력이 좋은 선수는 슈팅 기회를 보다 더 자주 잡기위해 노력하고 동료 선수들은 그를 향해 패스를 넣어준다.


더 많은 슈팅을 시도하는 선수는 더 높은 전환율을 기록하게 되고 이것이 평균값을 뛰어오르게 만든다. 따라서 평균적인 선수의 전환율이 9.12%일 것이라 가정하고 들어가는 것이 잘못되었다고 볼 수 있다. 베타-이항 회귀(Beta-binomial regression)를 활용하여 새로운 방식으로 접근할 경우, 우리는 슈팅 능력이 좋은 선수가 더 많은 슈팅을 시도한다는 것까지 고려할 수 있다.





마침내 우리는 지난 10년간 유럽에서 가장 정밀한 슈팅력을 지닌 선수 5명을 골라낼 수 있었다. 이것은 선수의 마무리 능력을 살펴볼 수 있는 여러가지 방법들 중 하나에 불과하다. 다른 통계량, 계산기법을 적용할 수 있으며, 그러한 새로운 방법들은 우리가 선수를 평가하고 평가를 위한 기준을 세우는데 큰 도움을 줄 수 있다.


이번 경우 우리는 오직 골과 슈팅 숫자만 더해 통계량을 만들어냈다. 의미있는 통찰력, 수많은 선수들 가운데 주요 선수들의 능력을 판별하기 위해서 우리는 꽤 간단하게 데이터를 합침으로써 성과를 낼 수 있었다.


다시 우리가 처음 논의를 시작했던 래시포드-루니 사례로 돌아가보자. 지금 우리가 전환율을 추정한 방법을 사용했을 때, 래시포드의 전환율은 11.31%이고 루니의 전환율 추정은 13.24%이다. 비록 래시포드가 첫시즌 16번의 슈팅으로 5골을 기록했지만, (단순히 계산했을 경우 31.25%) 새로운 통계량은 래시포드가 루니보다 훨씬 적은 슈팅을 시도했다는 사실을 고려한 결과를 제시했다. 그 결과 래시포드가 루니보다 이미 더 뛰어난 피니셔라는 잘못된 결론이 도출되지 않게 만들었다.




출처 : http://www.optasportspro.com/about/optapro-blog/posts/2017/blog-re-examining-finishing-skill/



by Ted Knutson


루이 반 할 체제의 맨체스터 유나이티드는 슈퍼 클럽이 최악의 형태로 운영될 수 있는 하나의 사례로 손꼽힐만 했다. 엄청나게 비싼 스쿼드를 갖췄던 지난 2015/2016시즌 루이 반 할의 맨체스터 유나이티드는 17위로 시즌을 마감한 선더랜드보다 경기당 슈팅이 더 적은 팀이었다.


참고로 2015/2016시즌 맨체스터 유나이티드의 경기당 슈팅 수는 11.3개였다. 2014/2015시즌 프리미어 리그에서 강등을 당했던 번리, 헐 시티의 당시 경기당 평균 슈팅 수가 11.3개였다. 맨체스터 유나이티드란 구단이 강등권을 벗어나지 못한 구단과 비슷한 슈팅 수를 시도했다면 그건 정말 문제인 것이다.


물론 당시 맨체스터 유나이티드는 골득실 +14를 기록하면서 5위로 시즌을 마감했다. 이는 웨스트 햄의 골득실과 동일한 수치였고 4위 맨체스터 시티보다 상당히 낮은 수치였다. 맨체스터 유나이티드는 맨체스터 시티와 승점 동률(승점 66점)을 기록했지만 골득실 +30을 기록한 맨체스터 시티를 앞지를 수가 없었다. 슈팅이 적었던 것은 분명한 반 할의 전술적 지시였고 고로 비판의 화살은 반 할에게 돌아가야 한다.


충격적인 부분은 다음과 같다 : 슈팅을 적게 시도하는 대신 슈팅의 퀄리티가 올라갔을 것이라 짐작했지만, 슈팅 퀄리티는 그다지 상승하지 않았다. 지난 2015/2016시즌 맨체스터 유나이티드의 슈팅 성공률은 10.5% 리그 평균을 살짝 뛰어넘는 수준에 불과했다.


그간 반 할이 써내려온 업적, 그의 이름값을 고려해도 너무나 지루한 경기의 연속이었다. 조세 무리뉴는 다소 엉망진창인 팀을 물려받은 셈이다.




2015/2016 루이 반 할

2016/2017 조세 무리뉴

경기당 득점 xG

1.18

1.56

경기당 실점 xG 

0.94

0.68

경기당 골득실 기대값

0.24

0.88

경기당 슈팅 시도

11.3

17.1

슈팅 1회에 기대할 수 있는 득점

0.105골

0.091골

경기당 슈팅 허용 

10.8

8.9

상대팀 슈팅 1회에 기대할 수 있는 실점

0.088골

0.077골



설령 현재 순위가 루이 반 할 때와 달라진 것이 없다고 하더라도 우리는 조세 무리뉴의 맨체스터 유나이티드가 이전보다 발전했음을 위에 나열한 수치들을 통해 확인할 수 있다. 반 할의 쇠퇴하는 맨체스터 유나이티드가 운좋게 5위를 차지한 반면, 무리뉴의 맨체스터 유나이티드는 탑4에 견줄 수 있는 여러 수치들을 기록하고 있다.


맨체스터 유나이티드는 공수 양면에서 발전했다. 득점과 실점에 대한 xG 기록이 향상된 것을 쉽게 확인할 수 있다. 맨체스터 유나이티드는 지난시즌보다 슈팅을 거의 경기당 6개씩 더 시도하고 있다. 한편 상대팀의 슈팅은 약 2개씩 덜 내주고 있다. 이러한 급진적 변화의 이유를 우리는 향상된 코칭 방법에서 찾을 수 있을 것이다.


아래 그림은 90분 경기 과정 속에서 맨체스터 유나이티드의 득점 및 실점 xG 값의 변동에 대해 표현한다. 우리는 루이 반 할의 팀과 조세 무리뉴의 팀이 찬스를 만드는 것에 상당한 차이를 보이고 있음을 확인할 수 있다. 붉은 영역이 득점 xG 값에 대한 90분 변화이고 하늘색 영역이 실점 xG 값에 대한 90분 변화이다.




(무리뉴 아래서 득점 xG 값이 상승했고 실점 xG 값은 하락했다)



맨체스터 유나이티드의 수비는 우승을 경쟁할만큼 좋아졌다. 하지만 공격의 수준은 아직 우승에 도전할만큼 올라오지 못했다. 하지만 여러 수치적인 부분에서 반 할의 팀과는 확실히 달라졌고 맨체스터 유나이티드 팬들은 이에 상당히 기뻐하고 있다.


그렇다면 리그 최정상 자리를 되찾기 위해서 유나이티드는 더 좋은 슈팅을 시도할 필요가 있겠다.







왼쪽은 올시즌 맨체스터 유나이티드가 시도한 전체 슈팅에 대한 기록이며 오른쪽은 그 중 득점으로 연결된 슈팅에 대한 기록이다. 반대발 포워드를 활용하여 왼쪽 지역에서 많은 재미를 본 것을 슈팅 기록을 통해 확인할 수 있다. 한편 오른쪽에서는 그러한 움직임이 활발하지 못했다. 맨체스터 유나이티드의 슈팅 비중은 전체적으로 왼쪽에 치우쳐 있고 상대팀 분석관들은 이에 대해서 알 필요가 있다.


2015/2016시즌의 바르셀로나의 기록과 비교해보자. 공격적인 부분에서 슈퍼 클럽이 되고자한다면 어떻게 그들처럼 찬스를 만들어낼 수 있을지 열심히 생각해봐야 할 것이다.







맨체스터 유나이티드는 세트피스 득점력을 올릴 필요가 있다. 반 할 체제에서는 경기당 세트피스 xG 가 0.18골에 불과했는데 무리뉴 아래서 경기당 세트피스 xG가 0.22로 소폭 상승했다. 상대팀 박스에서 더 많은 파울을 유도하고 세트피스 코칭에서 향상이 이루어진다면 경기당 0.3~0.4골 수준까지도 올릴 수 있을 것이다. 그것만으로도 맨체스터 유나이티드는 타이틀 레이스에 더욱 가까워질 수 있을 것이다.


시즌 도중에 4위를 차지한 시간이 길지 않았으나 맨체스터 유나이티드는 다음시즌 UEFA 챔피언스 리그에 진출할 상당한 확률을 기록하고 있다. ESPN에서 보도한 바에 의하면, 맨체스터 유나이티드가 유로파 리그를 우승할 확률이 58%, 프리미어 리그에서 4위로 시즌을 마감할 확률이 35%라고 한다.


지금까지 살펴보았듯이 무리뉴의 맨체스터 유나이티드는 상당히 발전했다. 물론 반 할이 남기고 떠난 팀이 엉망진창이었기 때문일 수도 있지만 (상승하는 것이 당연한 것일 수도 있지만), 스페셜 원(The Special One)과 올드 트래포드에서 뛰는 슈퍼스타들에게 찬사가돌아가야할 것이다. 맨체스터 유나이티드는 지난해보다 훨씬 발전했으며 훨씬 더 볼만한 가치가 있는 경기를 펼치고 있다.


올해 맨체스터 유나이티드가 기록하고 있는 여러 수치들을 살펴볼 때, 앞으로도 매년 챔피언스 리그 진출권에 대한 경쟁을 펼칠 수 있을 것으로 보인다. 지금보다 약간 더 발전한다면, 무리뉴는 맨체스터 유나이티드를 타이틀 경쟁이 가능한 팀으로 바꿔놓을 수 있을 것이다. 



출처 : http://statsbomb.com/2017/04/the-table-is-the-same-has-mourinho-improved-manchester-united/


 






by Xan Rice


브렌트포드 FC 훈련장의 작은 사무실에선 풋볼 디렉터(Director of Football) 라스무스 안케르센(Rasmus Ankersen)이 전화를 기다리고 있다. 이적시장 마감까지는 약 11시간이 남았는데 아직까지 처리해야할 거래가 남아있다.


덴마크 출신이며 말끔한 턱수염과 짧은 포니테일 머리를 한 33세 안케르센은 (중요한 날임에도 불구하고) 굉장히 차분해보였다. 어쩌면 그는 공격수 스콧 호건에 대한 £12m 규모의 아스톤 빌라행이 마무리 단계에 접어들었음을 알고 있었을 수도 있다. 혹은 올시즌 브렌트포드가 보여주는 퍼포먼스에 만족하고 있기 때문일 수도 있다. 서런던에 위치한 소규모 구단 브렌트포드는 올시즌 경영팀이 자체적으로 제작하는 챔피언십 리그테이블에서 상위권에 위치해있다. 취재를 위해 만났던 1월 31일, 브렌트포드의 공식적인 순위는 24개 구단 중 15위였다.


"축구계에는 '순위는 결코 거짓말을 하지 않는다'라는 관념이 있습니다. 하지만 그건 축구계의 가장 큰 거짓말 중 하나입니다. 리그 순위는 성공을 측정할 수 있는 최선의 측정법이 아닙니다." 라고 안케르센이 주장한다.


브렌트포드는 잉글랜드 축구계의 아웃라이어다. 2012년 도박사 매튜 벤험(Matthew Benham)이 구단의 대다수 주식을 구입한 이후, 브렌트포드는 통계의 과학적 활용을 바탕으로 구단을 운영하고 있다. 브렌트포드는 야구에서 먼저 사용된 '머니볼(moneyball)' 테크닉을 바탕으로 퍼포먼스를 평가한다.


초기 결과는 매우 긍정적이었다. 2014년 브렌트포드는 리그1에서 챔피언십으로 승격했고 그 다음시즌에는 5위로 시즌을 마감했다. 같은 해, 벤험이 소유하고 있는 다른 구단 : FC미트윌란이 브렌트포드와 똑같은 원칙으로 구단을 운영하여 최초로 덴마크 수페르리가 우승을 차지했다.


하지만 2016년에 브렌트포드는 9위로 내려앉았고 올시즌은 현재까지 그보다 실망스런 성적을 내고있다. 하지만 안케르센은 브렌트포드의 전략이 '소규모 예산으로 팀을 꾸려야하는 소규모 구단'에 적합한 운영방식이라 주장한다.


축구에서 운이 상당히 큰 영향력을 행사한다는걸 이해하는 것이 브렌트포드의 접근법을 뒷받침한다. 안케르센은 이렇게 말했다. "득점이 적게 나오는 축구에선 임의적인 사건(random events)이 상당히 큰 영향력을 행사하게 됩니다. 공이 선수를 맞고 굴절될 수 있고 심판이 실수할 수도 있습니다. 축구는 다른 스포츠보다 강팀이 이기는 경우가 적습니다."


행운이란 요소 때문에 1경기 내에, 혹은 1시즌 동안, 퍼포먼스 퀄리티에 비해 득점을 적게 혹은 많이 기록할 수 있다. 안케르센은 2012년 뉴캐슬 유나이티드를 예시로 들었다. 당시 뉴캐슬은 5위로 시즌을 마감했고 구단은 앨런 파듀에게 8년 계약 연장을 제시했다. 하지만 안케르센 주장에 따르면, 보다 면밀하게 데이터를 살펴볼 경우 뉴캐슬은 5위를 할만큼 잘하지 못했다. 당시 뉴캐슬의 골득실은 고작 +5에 불과했고 4위, 6위팀의 골득실은 +25와 +19였다. 통계적으로 +5수준의 골득실을 기록할 경우, 뉴캐슬이 기록했던 승점보다 보통 10점 정도 낮은 승점을 벌게 된다.


더욱이 슈팅 격차(다른 구단과 비교했을 때, 얼마나 많은 슈팅을 시도했는가)를 따져보았을 때, 뉴캐슬은 하위 6개 구단에 속했다. 즉 뉴캐슬 선수들이 1시즌간 경이적인 수준의 골 전환률을 기록했고 이는 다음시즌까지 지속 불가능한 수치였다.


그 다음시즌, 뉴캐슬은 프리미어 리그에서 16위를 기록했다. 뉴캐슬의 퍼포먼스는 그저 평균으로 회귀한 것이었다. "성공은 그저 운이 따랐던 것을 '천재적' 이라 포장해줍니다. 성공하더라도 실패할 때와 같은 수준의 회의적인 태도를 유지할 수 있어야 합니다." 안케르센이 말했다.


브렌트포드는 '득점 기대값(expected goals, 이후 xG)'을 핵심 퍼포먼스 통계량으로 활용한다. xG는 경기 중에 발생하는 득점 기회의 양과 질을 모두 고려한 값이다. 물론 xG가 실제 경기 결과와 다른 결론을 내릴 수 있다. 하지만 브렌트포드는 이 통계량을 바탕으로 순위표 대안을 만들어냈다. 그리고 경영진은 이것이 결과를 예측하는데 있어 훨씬 신뢰할만한 수단이라 말한다.


데이터 뿐만 아니라 브렌트포드는 구단운영에 대한 일반적인 모델에 대해 재고하고 있다. 대다수 구단이 지역에서 우수한 9~16세 선수를 발굴하기 위해 아카데미를 운영하는데 안케르센은 이러한 시스템이 부자 클럽을 도와준다고 생각한다. 즉 소규모 구단이 최고의 선수를 가르쳐 놓으면 부자 구단이 그를 데려간다는 것이다.


지난 여름, 브렌트포드는 아카데미를 닫고 17~20세 선수로 운영되는 브렌트포드 B팀을 만들었다. 브렌트포드의 목표는 다른 구단에서 퇴짜를 맞은 선수들, 즉 '선수로 뛸 수 있는 2번째 기회에 굶주린 자'를 모으는 것이다. 혹은 챔피언십을 통해 프리미어 리그 진출을 꿈꾸는 유럽 연합 선수들을 모으길 원했다.


브렌트포드가 프리미어 리그 승격이라는 목표를 가까운 미래에 성취할 수 있을지 알 수는 없다. 하지만 브렌트포드가 분명히 매력적인 실험을 하고 있다고 평가할 수 있다.



출처 : http://www.newstatesman.com/politics/sport/2017/02/so-much-table-never-lies-data-unravels-footballs-biggest-lie-all





페널티킥을 낮고 중앙으로 차는 횟수가 늘어나고 있지만, 여전히 골키퍼들은 가만히 서있지 않는다. (원문은 2017년 1월 29일에 작성되었습니다)


아스날과 번리의 맞대결에서 후반 추가시간에 2차례 페널티킥이 선언되었다. 흥미진진한 결과를 만들어냈던 이 2차례 페널티킥은 최근 프리미어 리그 선수들의 페널티킥 경향을 아주 잘 요약해준다. 번리의 안드레 그레이, 아스날의 알렉시스 산체스 모두 골문 정중앙으로 페널티킥을 시도해 골을 기록했다.


옵타(Opta)의 연구에 따르면, 최근 선수들이 중앙을 향해 페널티킥을 시도하는 빈도가 늘어나고 있다. 골키퍼는 페널티킥 상황에서 골문 한가운데 가만히 서있는 것을 선호하지 않기 때문에 키커가 중앙을 노리는 전략이 효과를 보고있다.





지난 2015/2016시즌 전체 85차례 페널티킥 중 약 25%에 해당하는 21차례 페널티킥이 골문 중앙을 향했다. 이전까지 중앙을 향해 시도하는 페널티킥은 한 시즌을 통틀어 15회를 넘은 적이 없었다. 그런데 2016/2017시즌 22라운드가 끝난 상황에서 벌써 17번의 페널티킥이 골문 중앙을 향했다. 또한 흥미로운 것은 낮게 차는 것이 더 낮은 성공률을 보장함에도 키커들이 공을 낮게 차고 있다는 것이다.


키커들은 점차 페널티킥을 중앙으로 시도하고 있는 반면 여전히 골키퍼들은 가만히 있는 것보다 방향을 선택해 몸을 던지는 결정을 내리고 있다. 옵타(Opta)는 2010/2011시즌부터 골키퍼가 페널티킥 상황에서 중앙을 선택한 횟수가 한시즌 3회를 뛰어넘지 않고 있음을 발견했다. 





2016/2017시즌 22라운드까지 총 72차례 페널티킥이 선언되었는데 골키퍼가 어느 한 방향을 선택하지 않은 경우는 단 2차례에 불과했다. 따라서 중앙을 향해 낮게 페널티킥을 시도하는 것이 좌우를 선택하는 것과 엇비슷한 좋은 성공률을 가져다주고 있다. 연구 결과 중앙 낮은 지역을 향해 차는 것은 확률적인 측면에서 전혀 선택의 장애가 되지 않는다.





스토크 시티의 골키퍼인 셰이 기븐은 상대의 슈팅을 눈으로 확인하고 반응할 충분한 시간이 없기 때문에 골키퍼가 마음 속으로 한 방향을 정하는 것이라 이야기 한다. "가만히 서있는 상태에서 키커의 킥을 보고 움직이면, 반응하는 그 순간 이미 공은 네트에 꽂혀 있습니다. 그래서 10에 9은 골키퍼들이 미리 방향을 정합니다."


통계를 보면 중앙을 향해 낮게 차는 것은 꽤나 합리적인 선택이지만 마이클 오언은 그 선택지는 가장 최후의 수단이라 말한다. "저는 확신이 서지 않았을 때 그 지점(낮은 중앙)을 향해 찼습니다. 자신감이 넘치는 상황에서는 모서리를 향해 찼습니다. 하지만 중압감이 심하거나 컨디션이 완벽하지 않다고 느낄 때는 슈팅 테크닉에 최대한 집중한 채 중앙을 향해 낮고 강하게 차는 것이 더 쉬운 판단이었습니다."



출처 : https://www.premierleague.com/news/317996

어떻게 압박을 측정할 수 있는가?

Football Stats 2016. 11. 12. 00:37 Posted by Seolskjaer



전방 압박은 애널리스트의 많은 관심을 받고 있는 분석대상 중 하나지만, 그것을 수치화하기 상당히 어렵다는 점에서 간극이 크다. 전방 압박에 대해 측정하는 방법은 과거에도 존재했다. 피치를 구분지어 지역별로 패스 성공률을 측정하는 것도 하나의 방법이었다. 압박에 대한 흥미로운 측정법으로 PPDA를 소개할 수 있다. 어쨋든 PPDA를 계산하는 방식은 이러하다 : 우리팀이 1번의 수비 행위를 시행하는 동안 상대팀에게 허용한 패스 횟수, 상대팀 입장에서 봤을 때 피치 3/5지점 까지만 고려해 값을 적용시킨다.


PPDA는 상대의 공 점유를 방해하는 행위, 압박에 대한 효율적인 측정법이라 할 수 있다. 하지만 단순히 PPDA만 바라보는 것은 1차원적인 방식이다. 압박은 1~2선이 재빠르게 시도하거나 팀 전체가 하나되어 시행하는 움직임으로써 그런 압박을 단 하나의 통계량으로 압축하는 것은 상당히 어려운 일이다. 상대를 압박하는 방법은 다양하며 마찬가지로 모든 팀들이 서로 각기 다른 목적을 가지고 압박을 시행한다. (대표적으로 2가지 케이스를 언급할 수 있는데 하나는 공을 소유한 선수를 괴롭히는 방법, 다른 하나는 공간을 막아 패스 옵션에 제한을 두는 것을 이야기할 수 있다)


따라서 이번 글에서는 보다 전체적인 맥락을 보고자 한다. 팀의 압박에 대한 여러 수치들을 확인해볼 것이며 우리가 미처 간파하지 못했던 사항들에 대해 이야기하고자 한다. 아래 표는 2015/2016시즌 유럽 탑5리그와 에레디비지에를 포함해 PPDA 통계에서 뛰어난 상위 10개 구단을 보여준다. 우리는 PPDA만 보더라도 다각도에서 통계를 바라보아야함을 알 수 있다.




이해가 되는 구단도 있고 이해가 되지 않는 구단도 있다. 마우리시오 포체티노는 토트넘 핫스퍼에 강한 전방 압박을 심어놓았고 펩 과르디올라의 영향을 받은 바르셀로나와 바이에른 뮌헨도 상위권에 랭크되어 있다. 그런데 우리를 멈칫하게 만드는 구단 이름도 몇몇 보인다. :PSG는 공격적인 전방 압박으로 유명하지 않음에도 PPDA 랭킹 2위를 달리고 있다.


PSG의 PPDA값이 낮을 수 밖에 없는 이유는 다음과 같다. PSG는 리그를 철저하게 지배하는 팀이며 상대팀은 공을 가지고 자신의 진영에 오래 머무르게 된다. 따라서 PSG는 자연스럽게 수비 행위를 상대 진영에서 시행할 수 밖에 없다. PSG가 수비를 위해 강한 전방 압박을 시도하지 않더라도 PSG의 PPDA값은 낮을 수 밖에 없는 것이다.


한가지 개념을 도입하자 : Field Tilt (우리 팀의 파이널 서드 패스 횟수 / 우리팀 및 상대팀 파이널 서드 패스 횟수) 


PPDA와 Fileld Tilt를 한 그래프에 나타내보면, 경기를 지배하는 것이 PPDA값에 영향을 미친다는걸 확인하게 된다. 상대 진영에서 경기하는 시간이 길기 때문에 수비도 상대 진영에서 하게 되고 PPDA 수치가 낮아지는 것은 당연한 인과 관계라 볼 수 있다.






PPDA가 나쁜 통계량, 쓸모없는 통계량이라 말하려는 것은 아니다. 우리가 다른 측정값을 동시에 활용하면, 압박에 대해 더 넓은 시야를 확보할 수 있다는 것이 전하고자하는 바이다. 


지금부터는 몇가지 추가적인 측정값을 활용해 압박에 대해 다양하게 살펴볼 것이다. 지금부터 정의할 사항들은 PPDA 값을 측정하는 지역과 동일한 곳에서 함께 계산되는 수치라 받아들이면 된다.


Opponent Pass Completion Rate : 상대팀 기준으로 피치 3/5까지 시행하는 패스의 성공률


On-ball Action Width : 수비 상황 아닐 때, 볼터치가 피치 중앙에서부터 거리가 얼마나 떨어져 있는가


Directness : 엔드라인에서 엔드라인을 좌표공간의 x축으로 설정했을 때, 상대팀 패스가 좌표 공간에서 x만큼 얼마나 전진하는가. 이것은 패스가 어느 정도의 비중으로 전방을 향해 나아가는지 측정하게 해준다.


PPDA처럼 지금 우리가 정의한 개념도 전방 압박에 대해 다양한 의견을 제시한다. 이들은 PPDA 통계값과 상관성이 높지 않기 때문에 기존 PPDA가 제시하지 못했던 새로운 관점을 제공해준다고도 표현할 수 있다. 


이번에는 PPDA와 On-ball Action Width를 하나의 그래프에 나타내 보았다. 다른 색깔을 사용해 하이라이트 처리해놓은 구단은 새로운 관점에서 전방 압박을 바라볼 필요가 있는 팀이다. 토트넘은 상대팀이 넓게 퍼지도록 유도하며 전방에서부터 강하게 압박을 시행한다. 전방압박으로 유명세를 타고있는 또 다른 팀 바이어 레버쿠젠은 토트넘과 전략이 다르다. 이들은 상대팀을 측면으로 몰아가지 않는다. 아마 레버쿠젠은 분데스리가 클럽 중에서 가장 중앙에 밀집한 팀일지도 모른다. 






프리미어 리그 구단 중에서 주목할 구단은 본머스와 레스터 시티다. 두 팀 모두 PPDA 수치가 우수하지 않으나 상대를 측면으로 유도하는 것을 기준으로 봤을 때 유럽에서 Top10에 속한다. PPDA로 보면 리옹과 PSG가 유럽 Top10이지만, 상대를 측면으로 몰아가는 움직임에서는 결코 그렇지 못하다.


아래 그래프는 Width와 Directness를 나타낸 것이다. 본머스의 수비 시스템은 매우 흥미롭다. PPDA가 뛰어난 것도 아니고 상대팀의 패스 성공률을 낮추는 것에서도 결코 우수하지 않다. 그런데 본머스는 유럽에서 바이에른 뮌헨 다음으로 상대팀 패스가 앞으로 나아가는 거리가 짧게 유도한다. 본머스가 상대를 측면으로 유도한다는 것을 동시에 고려하면, 본머스의 압박은 보수적인 색채를 보인다고 결론지을 수 있다. 위험한 지역으로 상대가 공을 투입하지 못하게 조직적으로 막는 것이 본머스의 방식이다. 본머스는 공격 기회를 만들기 위해 상대의 턴오버를 유도하지 않는다.





아래 그림을 통해 PPDA와 상대팀 3/5진영 패스 성공률의 관계를 확인할 수 있고 아주 강한 상관관계가 있음을 단번에 눈치챌 수 있다. 





그래프에 표시된 실선은 두가지 측정값에 대한 관계식을 만들 때, 가장 잘 적합시키는 선을 나타낸다. 여기서는 팀의 수비 행위 효율성을 체크해볼 수 있을 것이다. 하늘색 선은 PPDA값이 x로 주어졌을 때, 보통 y수준으로 상대팀의 패스 성공률을 제어할 수 있다는 것을 의미한다. 각 팀이 기대값에서 얼마나 떨어졌는지를 바탕으로 전방 압박의 효율성을 논의해볼 수 있을 것이다.


우리는 PSG가 아웃라이어임을 확인할 수 있다. PSG는 수비 행위에 비해서 상대의 패스 성공률을 효과적으로 제어하지 못하고 있다. 분데스리가의 FC 잉골슈타트는 PSG와 정반대 양상을 보이고 있다. 잉골슈타트는 상대팀이 패스하기 정말 어렵게 압박을 가하고 있다. 






측면으로 몰아가는 것은 장단점이 있다. 상대를 측면으로 몰아가면, 위험 지역으로 공이 투입될 가능성을 낮출 수 있다. 하지만 공을 뺏어낸 후 공격 기회를 만드려는 입장에서는 피치 중앙에서 공을 뺏는 것이 전략적으로 훨씬 좋다. 레버쿠젠은 상대를 중앙으로 접근하게 유도하고 거기서 공을 뺏어내 보다 위협적인 위치에서 득점 기회를 만들고자 한다. 레알 마드리드와 샬케04는 압박 수준에 비해서 패스 성공률을 높게 허용하고 있으며 동시에 이들은 비교적 중앙에서 상대가 경기를 펼칠 수 있게 허용하고 있다.

PPDA만 고려하는 것이 아니라 다른 통계값을 활용해 색다른 시선으로 압박을 살펴보았다. 이렇게 함으로써 경기에 대한 맥락까지 포함해볼 수 있었다. 하나의 개념을 다방면에서 살펴봄으로써 우리는 -조직적이면서, 공이 없는 상황에 시행되는- 더불어 수치화하기 어려운 압박에 대해 상당히 값진 논의를 할 수 있었다. 


출처 : http://www.optasportspro.com/about/optapro-blog/posts/2016/blog-how-we-measure-pressure/