데이터로 살펴보는 알렉스 텔레스

Football Stats 2020. 10. 6. 22:49 Posted by Seolskjaer

 

수준급 선수가 부족한 포지션이 있는데 레프트백 포지션이 바로 그런 포지션이다. 레프트백 자리에 원하는 수준의 선수를 찾기란 결코 쉽지 않다. FC포르투의 알렉스 텔레스는 수준급 레프트백으로 종종 거론되는 인물이다. 최근 몇년간 텔레스의 퍼포먼스가 꾸준했고 그 수준 역시 높았던 것은 사실이다. 그는 정말 유럽대륙의 최고 클럽과 꾸준히 링크될만큼 우수한 선수일까? 

 

이 질문에 답을 하기 위해 데이터를 살펴보았다. 우리의 답은 텔레스가 최고 수준의 클럽과 링크가 날만한 선수라는건 의심의 여지가 없는 것이다. 텔레스는 다방면에서 평균 이상의 선수이며 지난 4시즌간 기대 어시스트(expected assists, 이하 xA) 지표에서 아주 높은값을 기록했다. 텔레스는 xA 지표에서 유럽 최상위 풀백이다. 

 

 

 

 

이 그래프에서 우리는 2019/2020시즌 최소 900분 이상의 리그 경기를 소화한 풀백들의 지표를 비교해볼 것이다. (상위 5대리그 한정)

 

텔레스는 높이뛰기 능력이 뛰어나며 공의 위치에 대한 직감이 있는 선수다. 그래서 그를 상대로 공중볼 경쟁에서 승리하는 것은 결코 쉽지 않다. 올시즌(19/20) 공중볼 경합에서 텔레스는 61.9%의 승률을 기록하고 있다. 평균보다 조금 더 좋은 수준의 가로채기(interception) 능력을 가졌으며 집계기간을 포르투에서 활동한 전체 기간으로 늘렸을 때 이 수치는 경기당 3.5회까지 상승한다.

 

텔레스는 꽤 자신있게 공을 다루는 선수다. 공을 상대에게 뺏기는 횟수는 경기당 0.36회 정도이며, 파이널 서드에서 자주 활동하지만 패스 미스 횟수도 적다.

 

텔레스는 공격적인 면에서 다른 선수들과 차이를 만들어낸다. 텔레스는 항상 위협적인 선수라고 할 수 있으며 특히 세트피스 상황에서 더욱 위협적이다. 텔레스는 지난 4년간 포르투에서 수많은 크로스를 시도했는데 크로스 성공률이 30% 이다. 

 

올시즌 텔레스는 90분당 2.4회의 크로스를 성공시키며 경기당 크로스 성공 횟수로는 압도적이다. 크로스의 퀄리티 역시 뛰어나다. 텔레스의 xA 지표는 0.26인데 이보다 더 높은 수치를 기록했던 선수는 트렌트 알렉산더-아놀드와 다니엘 브로진스키 뿐이다. 아래 그림을 통해 지난 2시즌간 텔레스의 xA맵을 확인해보자. 앞서 말했듯이 그의 공격 생산성은 엄청나다. 

 

 

 

 

 

코로나 바이러스로 인해 축구계가 심각한 타격을 입었으나 텔레스를 영입하기 위해서는 많은 돈이 필요할 것이다. 분명한 사실은 유럽에 텔레스만큼 경쟁력있는 수준의 풀백은 결코 많지 않다는 것이다. 데이터는 그렇게 말하고 있다.

 

 

출처 :  www.driblab.com/driblab-en/una-batalla-justificada-alex-telles/

 

지난 10일간 구글에서는 '펠리스트리' 라는 이름의 검색량이 급증했다. 5년 전, CA페냐롤에서 페데리코 발베르데를 영입한 레알 마드리드가 이번에는 우루과이 출신의 파쿤도 펠리스트리에 대한 관심이 있다는 보도가 있었기 때문이다. 이 보도는 수많은 팬들의 관심을 증폭시켰다. 이 글에서는 파쿤도 펠리스트리의 장점과 향후 개선점에 대해서 알아보고자 한다.

 

갓 자신의 커리어를 시작한 펠리스트리는 파이널 서드 지역에서 뛰는 선수이며 윙어로 활약하고 있다. 지난 2019년 우루과이 리그 기록을 살펴보면, 펠리스트리는 1:1 상황과 마무리에 강점이 있다. 남아메리카 대륙에서 뛰는 선수들 중, 90분당 평균 2.62회의 드리블을 성공하는 펠리스트리의 수치에 근접하는 어린선수는 많지 않다. 아래 그림에서 우리는 그의 재능이 뛰어나다는 것을 확인할 수 있다. 펠리스트리의 드리블은 좌우 중앙 가리지 않고 생산적이지만 특히 오른쪽에서 좋은 결과를 만들어냈다.

 

 

앞서 말했듯이, 펠리스트리의 또다른 장점은 마무리를 정교하게 잘한다는 것이다. 물론 그가 오픈 플레이 상황에서 찬스를 만들어내는 횟수는 포지션 평균보다 적으나 (0.69회) 만들어내는 찬스가 상대에게 위협적이라고 할 수 있다. 상대에게 위협적인 정도는 기대 어시스트(expected assist, 이하 xA) 값을 통해 확인할 수 있다. xA 메트릭은 키패스가 득점으로 연결될 확률을 의미한다. 2019년 펠리스트리는 키패스 당 0.23xA 를 기록했고 이는 그가 18세임을 고려했을 때 좋은 기록이다.

 

또한 펠리스트리는 슈팅의 47%를 유효 슈팅으로 연결시킨다. 그리고 나이대를 고려했을 때, 평균적으로 1.05회의 크로스를 성공시킨다는 것 역시 고무적이다. 또한 박스 안에서 평균 3.67회(90분당) 볼터치를 기록하는데 그가 박스에서 멀리 떨어진 지점에서 경기를 펼친다는 것을 고려했을 때, 이 지표는 아주 좋다고 할 수 있다. 아래 그래프는 2019년 남미 리그에서 500분 이상을 소화한 다른 U-20 스트라이커들과의 비교를 한 자료이다.

 

검정색 큰 원이 파쿤도 펠리스트리이며, 펠리스트리는 드리블 성공, 박스안 터치횟수, 크로스 성공횟수에서는 동나이대 상위권에 위치한다. 그러나 기회창출 관점에서는 부족한 모습을 보인다.  

 

어쨌든, 펠리스트리는 여러 지표에서 발전할 필요가 있다. 미래에 그가 유럽에 도착한다면, 그는 패스 능력을 향상시켜야할 것이고, 꾸준히 기회를 만들 수 있도록 노력해야한다. 그러나 그가 꽤 퀄리티 있는 선수라는 지표가 있기 때문에 여전히 발전할 가능성이 있다.

 

 

출처 : www.driblab.com/new-talents/what-the-data-say-about-facundo-pellistri/

 




by Derrick Yam


Shot Stopping


단순히 클린시트 횟수와 선방률 만으로 골키퍼 순위를 매기는건 옳지 않다. 우리는 보다 고급진 통계량을 제시하고자 한다. 


1. 첫번째 통계량은 보정된 선방률(adjusted Save Percentage, adjSV%) 이다. 이 수치를 통해 우리는 각 골키퍼가 리그 평균수준 골키퍼 대비 어느 정도로 잘했는지, 못했는지를 평가할 수 있다. adjSV%는 다음과 같은 과정을 통해 계산된다. 기대실점 수와 실제실점 수의 차이를 구한 후, 전체 유효슈팅 횟수로 나눈다.


2. 두번째 통계량은 평균대비 막아낸 골수(Goals Saved Above Average, GSAA) 다. 이는 리그 평균 수준의 골키퍼와 비교하여 얼마나 많은 골을 막아냈는지, 혹은 못막아냈는지를 보여주는 수치라고 할 수 있다. GSAA는 기대 실점수와 실제 실점수의 차이로 계산한다.


*주의 : 이 분석에서 모든 페널티킥은 제외하였다. 

 



지난시즌 케파는 126회의 유효슈팅에서 37골을 허용했고 기대실점 수는 31.35골이었다. adjSV% 기준으로 정렬했을 때, 케파는 지난시즌 라 리가에서 16번째로 우수한 골키퍼였다. (GSAA 관점으로 보았을 때) 또한 케파는 지난시즌 아슬레틱 빌바오가 허용한 실점 중 대략 5골에 책임이 있다. 기대실점 수 대비 5골을 더 허용하는 골키퍼에게 £71m은 적당한 가격이 아니다. 물론 첼시는 케파가 23세인 점을 감안하여 장기적 관점에서 그를 그 값에 구매했을 것이다. 과거 데이터를 구할 수만 있다면, 젊은 다비드 데 헤아, 젊은 티보 쿠르투아와 비교해보고 싶지만 현재로서는 라 리가 과거 데이터를 갖추고 있지 못하다.



Positioning


조금 더 깊은 내용으로 들어가보고자 한다. 우리는 케파의 위치선정, 보다 구체적으로 이야기하자면 케파가 얼마만큼 자주 최적의 위치를 잡고 있는지 알아보고자 했다. 페널티박스 안에서 슈팅의 유형 (슈팅을 시도하는 위치, 동료 수비수의 위치, 기타 상대 공격수의 위치 및 다른 요소 등...) 을 반영하여 상대의 득점 확률을 최소화할 수 있는 골키퍼의 위치를 계산해냈다. 




케파의 위치선정 능력은 라 리가 상위 10명 안에 들어가는 수준이었고 어쩌면 첼시는 이 부분에 주목했을 수도 있다. 위의 그래프에서 확인할 수 있듯이, 케파의 위치선정은 얀 오블락과 거의 비슷했다. 오블락과 케파는 대개 슈팅의 성공확률을 최소화시키는 최적의 위치에 자리잡고 있다. 이 그래프는 두 선수가 쿠르투아의 대체자를 노리는 첼시의 레이더망에 왜 들어왔는지를 보여준다.



Cross


그러나 크로스 처리에서 케파는 평균수준의 퍼포먼스를 보이고 있다. 우리는 전체 크로스 횟수와 골키퍼가 직접 나서서 크로스를 처리한 횟수를 종합하였고 골키퍼가 직접 나와서 처리할 것으로 기대되는 횟수를 계산해냈다. 이 수치를 바탕으로 우리는 각 골키퍼가 얼마나 적극적으로 크로스를 처리하는지를 확인할 수 있다.


아래는 실제 크로스 처리 횟수와 기대 크로스 처리 횟수의 차이를 바탕으로 프리미어 리그 골키퍼와 라 리가 골키퍼의 순위를 매긴 자료이다.




라 리가 골키퍼와 프리미어 리그 골키퍼를 종합하였을 때, 케파의 순위는 25위였다. 물론 모든 골키퍼가 크로스 처리에 적극적일 필요는 없다. 사실 수많은 수비 시스템은 골키퍼가 골문을 지키고 센터백들이 골키퍼 앞에서 혼돈의 상황을 처리해주는 방향으로 운영된다. 다비드 데 헤아는 가능한 자리를 지키려는 골키퍼이고 우리는 그의 실력을 결코 의심하지 않는다. 크로스 처리에 대한 적극성은 골키퍼의 스타일을 반영하는 것이라 볼 수 있다. 팀의 경기 스타일에 따라 상당한 가치를 지니는 행위라고 볼 수 있다.





첼시의 첫번째 타깃이 얀 오블락이었다는 점을 고려해보면, 케파는 페널티박스 안 컨트롤에 있어서 오블락보다 좋은 선택지라 할 수 있다. 하지만 케파는 여전히 평균을 밑도는 크로스 처리 적극성을 보이고 있다. 쿠르투아가 보여준 적극성에도 미치지 못하고 있으며 지난시즌 리그 상위권에 이름을 올렸던 구단의 소속인 에데르송과 닉 포프와는 한참 떨어져 있다. 우리는 케파의 이적료가 에데르송보다 £36.3m이 많다는 점을 잊지 않아야 한다.



Distribution


축구가 발전해감에 따라 골키퍼의 볼배급 능력이 중요해지고 있다. 아직 사리의 시스템이 첼시에 완벽히 녹아들지는 못하였으나 우리는 첼시가 지난시즌의 맨체스터 시티처럼 경기할 것이라 기대하고 있다. 첼시는 점유율을 기반으로 가능한 모든 기회에서 빠르게 전진하고 높은 위치에서부터 압박을 시도할 것으로 예상된다. 그 말은 즉슨, 첼시의 골키퍼는 공격에 기여할 수 있어야 한다는 말과 같다. 상대의 압박에도 공을 자신있게 다루는 골키퍼, 공격 기회를 알아보는 골키퍼가 되어야 한다.





사리의 지도 아래서 첼시가 1사분면으로 이동할 것이라 예상한다. 1사분면에 위치한 구단은 전체적으로 상대보다 더 많은 슈팅과 코너킥을 시도하고 더 많은 직접 프리킥을 시도한다. 이들은 상대에게 기회를 내주는 리스크를 감수하면서 상대진영에서 기회를 얻어내 우위를 점하려는 팀이다. 


앞으로 첼시는 빠른 공격을 하는 팀으로 변할 것이다. 그래서 우리는 골키퍼의 패스가 시작된 이후 15초 이내 +결과가 나온 비율을 조사해보았다. +결과라함은 골키퍼에서 시작된 연결이 슈팅으로 마무리되는 경우, 상대 진영에서 프리킥이나 코너킥으로 이어진 경우를 말한다. 


지난시즌 프리미어 리그와 라 리가 자료를 바탕으로 계산을 했다. 골키퍼에서 시작된 패스연결이 15초 이내 +결과로 이어진 비율은 4.2%였다. 가장 높은 비율을 기록한 골키퍼는 번리의 닉 포프로 10%의 수치를 기록했다. 쿠르투아는 5%의 값을 기록했다. 지난시즌 케파의 값은 4.8%였다.


사리는 일반적인 플레이 상황에서도 케파가 기여하길 바랄 것이다. 그는 상대가 높은 지역에서 압박을 시작하는 경우, 발끝을 더 날카롭게 가다듬을 필요가 있다. 우리는 상대의 압박이 가해질 경우, 골키퍼의 패스 정확도가 얼만큼 떨어지는지를 조사했다. 이러한 관점에서 바라보았을 때, 에데르송은 아주 우수한 볼배급 능력을 가졌다. 상대가 압박하는 상황에서 에데르송의 패스 성공률은 단 5% 감소했다. 반면 케파는 압박이 들어오는 상황에서 패스 성공률이 18.7% 가량 감소한다. 평균적으로 상대의 압박이 들어올 때, 골키퍼의 패스 성공률 감소 수치는 10.5% 이다.



쿠르투아의 자리에서 얼마나 해줄 수 있을까?


선방 관점에서 우리는 케파가 쿠르투아보다 만족스럽지 못한 활약을 펼칠 것이라 예상한다. 지난시즌 쿠르투아는 adjSV% 순으로 나열했을 때, -0.02값으로 프리미어 리그 10위에 이름을 올렸다. 케파가 쿠르투아의 수치를 절대 뛰어넘지 못하라는 법은 없다. 하지만 케파가 쿠르투아가 보여준 기록을 꾸준히 유지하기는 어렵지 않을까 싶다.


크로스 대처에서도 더욱 소극적인 모습을 보이지 않을까 한다. 하지만 케파가 경합에서 공을 따낸다면, 그는 쿠르투아처럼 빠르게 공을 연결시켜줄 수 있다. 케파는 빠른 역습 기회를 노릴 것이며, 적극적으로 앞으로 공을 전진시킬 것이다. 


케파의 발기술이 형편없는 것은 아니지만, 그는 아슬레틱 빌바오에서 상대의 압박이 가해질 때 고전했다. 사리는 그에게 많은 사항을 요구할 것이다. 케파가 쿠르투아의 자리에 꽤나 잘 녹아들 것으로 예상하지만, 그가 쿠르투아의 업그레이드라고는 생각하지 않는다. 가격표를 생각하면 업그레이드가 되어야겠지만 말이다. 사리도 아직은 케파가 쿠르투아의 수준에 미치지 못하는걸 인정했다.



첼시의 의도는?


케파는 아직 23세에 불과하다. 그는 어린 나이임에도 아슬레틱 빌바오에서 많은 경험을 쌓았으며 아슬레틱은 그를 신뢰했다. 첼시는 그를 얻기위해 골키퍼 최고 이적료를 지불했지만, 여전히 데이터를 살피고 또 살펴보아도 케파는 아직까지는 평균적인 수준의 골키퍼로 보인다.


우리는 데이터를 통해 케파가 평균적인 수준의 골키퍼라는 결론을 내렸다. 이 분석에는 적은 표본 수, 시간적 동향을 충분히 고려하지 못했다는 점, 큰 규모의 준거집단을 확보하지 못했다는 점의 단점이 있다. 첼시는 우리가 데이터를 통해서만 얻은 지식보다 케파의 성장을 더 잘 지켜보았을 수도 있다.


그러나 케파는 세계에서 가장 비싼 골키퍼가 되었고 우리는 그러한 지출이 납득이 될만한 무언가를 확인하길 기대한다. 케파의 이적료 £71m을 정당화시킬 수 있는 번뜩이는 활약을 기대하고 있다. 



출처 : https://statsbomb.com/2018/08/chelseas-rebound-date-kepa-arrizabalaga/





월드컵 결승전 통계는 아주 명백한 그림을 그리고 있다 : 상당한 수준의 점유율(61%), 더 많은 패스 성공 횟수(456 vs 202), 더 높은 패스 정확도 (83% vs 75%), 더 많은 유효슈팅(15개 vs 8개). 이는 크로아티아의 통계이며 크로아티아는 경기에서 졌다. 


전통적인 통계를 바탕으로 그린 그림은 피치 위에서 나타난 결과와는 동떨어져 있다. 


과거 독일 국가대표였던 스테판 라이나르츠가 만든 새로운 축구 분석 방법 패킹(Packing) 을 알아보자. 분데스리가에서 선수 경력을 쌓은 라이나르츠는 피치 위에서 자신이 보여준 영향력과 통계가 대응하지 않는다는걸 빈번하게 느꼈다. 2016년 부상으로 인한 은퇴 후, 라이나르츠는 과거 팀동료였던 옌스 헤겔러(현재 브리스톨 시티 소속)와 함께 <Impect> 라 불리는 회사를 설립했다. 축구 분석에 영구적 변화를 주는 것이 라이나르츠의 목표였다.


<Impect>의 CEO인 루카스 케플러는 패킹(Packing)이란 용어를 사용한 계기를 설명한다. 한 선수가 상대 선수와의 대결에서 패배한다면, 그 선수는 더 이상 플레이에 관여하지 못하는 상태가 된다고 간주할 수 있다.


패스, 드리블의 성공 여부만 관찰하는 것에서 벗어나 그 행위가 얼만큼의 순수한 이득을 가져왔는지를 따진다. <Impect>는 경기 상황에서 배제된 선수들이 '제압' 당한 것으로 간주하고 제압된 선수를 수치화 한다. 이 아이디어는 다음과 같은 예시로 표현될 수 있다 : 만약 스트라이커를 향한 미드필더의 패스가 4명의 수비수를 통과했다면, 이 4명의 수비수들은 이 공격을 막을 수 없다. 패스를 시도한 선수, 그리고 패스를 받은 선수 (그리고 팀 전체적으로) 제압된 상대 숫자 4점을 얻게 된다.


파이널 서드 지역에서 제압한 상대 수비수 숫자는 아주 결정적이다. 수비수 혹은 수비형 미드필더를 경기 상황에서 배제시킨다면, 아주 좋은 득점 기회가 만들어지기 때문이다. 


월드컵 패킹 데이터를 살펴보면, 프랑스의 우승은 결코 놀랍지 않다. 프랑스는 경기당 평균 수비수를 33회 제압했는데 이는 엄청 대단한 수치까지는 아니다. 하지만 프랑스는 상대팀 공격수가 프랑스 수비진을 지나치는걸 허용하지 않았다. 상대팀이 프랑스 수비를 제압하는 횟수는 경기당 평균 20회였고 이는 이번 대회 참가국 중에서 가장 낮은 수치다.





글의 맨 앞에서 만났던 통계들이 크로아티아에게 무익한 지배 상황을 가져왔다는걸 알 수 있다. 


사실 패킹은 독일 축구팬들에게 익숙한 자료이다. 스테판 라이나르츠와 <Impect>는 프랑스에서 개최한 유로 2016에서부터 독일의 ARD 방송사를 통해 패킹을 알리기 시작했다. 케플러는 당시 상황에 대해 이렇게 이야기한다.


"유로 2016 당시 패킹에 대하여 부정적 의견, 긍정적인 의견이 모두 있었다. 패킹을 설명하는데 TV는 적절한 매체가 아니었다. TV는 시간이 매우 제한적이기 때문에 우리는 패킹의 개념을 충분히 설명하지 못했다. 그래서 일부 사람들은 롱볼, 킥-앤-러시가 성공을 위한 완벽한 공식이라고 말하기도 한다."


패킹이 기존의 통계로 설명하지 못했던 부분을 채워준다고 생각하는 사람들도 있다. "패킹은 새로운 축구 분석 방법일 뿐, 축구에 대한 모든 의문을 해결해주진 못한다." 라고 케플러가 말한다. 그는 '피치 위 리더십' 같은 개념은 객관적으로 평가될 수 없고 여전히 통계적으로 발전할 부분이 많이 남아있다는 점을 인정했다.


라이나르츠와 헤겔러가 몸담았던 바이어 레버쿠젠은 2015년 <Impect>의 첫번째 고객이 되었다. 현재 분데스리가 18개 구단 중 절반 정도의 구단에서 <Impect>의 통계를 사용하고 있다. 독일에서 <Impect>의 분석 효과를 경험한 지도자는 해외로 나가더라도 이를 사용할 것이다. 보루시아 도르트문트를 지도했던 토마스 투헬은 이제 PSG에서 PSG 선수들의 패킹 데이터를 분석할 것이다.


케플러는 <Impect>의 미래에 대해 긍정적이다. 케플러는 "패킹 데이터는 새로운 재능을 발견하는 과정, 감독이 전술적 결정을 내리는 과정에서 도움을 줄 것이라 확신한다." 라고 말했다.


언젠가는 전세계 모든 리그의 모든 구단이 패킹 데이터를 사용할지도 모르지만, 아직까지는 데이터를 제공하는 속도가 받쳐주지 못할 것 같다. <Impect>의 분석가들은 정밀한 데이터를 수집하기 위해 3~4시간동안 모든 경기 장면을 면밀히 관찰한다. 그러나 <Impect>는 유럽 상위리그로 사업을 확장하는 야망을 갖고있다. 회사 대표진은 2018/2019시즌이 개막하기 전에 프리미어 리그, 챔피언십 구단들과 만날 계획이다.


독일에서 수입된 스카우터와 감독의 수가 많다는 것을 고려해 본다면, 우리는 곧 패킹이라는 단어가 결코 낯설지 않게 느껴질 것이다.



출처 : https://www.planetfootball.com/in-depth/the-german-analytics-company-out-to-revolutionise-stats-in-england/












페널티킥에 대해 신뢰성 있는 데이터를 발견하기가 어렵다. 우리가 할 수 있는 최대치는 굉장히 제한된 리스트(보통 리그 상위 10명, 월드컵 페널티킥 기록)를 갖는 수준에 머무른다. 페널티킥 골은 문서로 남기는 과정에서 아주 명백하게 표시되며 쉽게 기록할 수 있는 득점임에도 불구하고 완벽한 페널티킥 데이터를 완성하는건 쉬운 일이 아니다. 페널티킥 실축 데이터가 굉장히 부족하기 때문이다. 나는 트랜스퍼마르크트(Transfermarkt) 데이터를 사용하려 했으나 이곳의 데이터가 정확하지 않다는걸 알게 되었다.


나는 영어로만 자료검색하는 것에서 벗어나 "역대 최고의 페널티 키커"를 이탈리아어로 검색해보았고 결과는 성공적이었다. 나는 아주 인상적인 페널티킥 데이터베이스를 갖춘 <Sdoppiamo Cupido>라는 블로그를 발견했다. 이 블로그는 선수들의 페널티킥 시행 횟수 뿐만 아니라 득점을 성공한 경우, 실축한 경우까지 모두 기록을 남겨놓았다. 


나는 이들이 정리해놓은 데이터와 요근래 선수들의 데이터를 합쳐 새로운 데이터셋을 만들었고 이후 이야기는 내가 새로 만들어낸 데이터셋을 바탕으로 이어가고자 한다. 새롭게 만들어진 리스트는 자주 페널티킥을 차는 페널티 키커를 대다수 포함하고 있다. 하지만 모든 선수를 빠짐없이 포함했다고 볼 수는 없다. 이 데이터는 유럽과 남미에서 활약한 선수들, 즉 우리에게 굉장히 잘 알려진 선수들을 조사한 데이터이기 때문이다. 우리에게 잘 알려지지 않은 리그에서 페널티킥을 굉장히 잘 차는 선수가 있을 수 있다. 


또한 몇몇 선수들의 실축 데이터를 찾기가 불가능했다. 호마리우, 지쿠, 엔초 프란세스콜리, 소크라테스, 푸스카스 등이 실축 데이터를 찾는 것이 불가능해 불행하게도 이들을 분석에서 제외하기로 했다.


우리가 가진 데이터 그 자체를 살펴보기로 하자. 전체 12,649회의 페널티킥을 484명의 선수가 처리했다. 각 선수의 페널티킥 시행 횟수와 득점은 첫번째 그림 Fig-1.을 통해서 확인할 수 있다.


<Fig-1>



가장 기본적인 분석은 전환율(conversion rate)을 살펴보는 것이다. 페널티킥 득점 수를 페널티킥 시행횟수로 나누어 각 선수의 전환율을 확인할 수 있다. 이는 가장 기본적인 모수로 0과 1사이의 값을 갖는다. 일반적으로 전환율 값이 높을수록 더 뛰어난 페널티 키커라고 말할 수 있다. 조사 대상이 되는 12,649회 페널티킥 중 10,402회의 페널티킥이 득점으로 이어졌고 전체 전환율은 82.2%라 할 수 있다. 각 선수의 페널티킥 시행 횟수와 선수 각각의 전환율은 두번째 그림 Fig-2.를 통해 확인할 수 있다. 


<Fig-2>



전환율은 선수의 페널티킥 능력을 비교할 수 있는 타당한 지표지만, 전적으로 전환율만 가지고서 선수의 페널티킥 능력을 평가하기는 어렵다. 세번째 그림, Fig-3을 통해서 확인할 수 있듯이, 선수들은 비교적 적은 횟수의 페널티킥을 시행한다. 따라서 단순 평균값으로 대표성을 지니기는 어렵다고 생각한다.



<Fig-3>



선수의 페널티킥 처리능력을 비교하는 과정에서 발생하는 곤란한 문제는 다음과 같다 : '10번 시도해서 9번 성공하는 선수, 40번 시도해서 36번 성공하는 선수 중에 누가 더 뛰어난가?' 혹은 '10번 시도해서 10번 성공한 선수와 100번 시도해서 98번 성공한 선수의 우열은 어떻게 가릴 것인가?' 물론 우리는 전환율을 이용해 비교해 두 선수의 우위를 가릴 수도 있겠지만, 무언가 잘못 되었다는 생각이 들 것이다. 우리는 이 수치들을 변환해야만 한다.


선수들의 페널티킥 처리능력을 더욱 잘 반영할 수 있는 지표를 만들기 위해서 우리는 페널티킥 전환율을 변형해야 하고 이 변형은 2가지 관점에서 진행된다.


1. Fig-3에서 확인할 수 있듯이, 페널티킥 시행횟수가 (다른 선수들과 비교하여) 상당히 적은 선수가 있다는걸 고려한다. 여기서 우리는 경험적 베이즈 추정법(Empirical Bayes estimation)을 사용하여 각 선수의 평균적인 페널티킥 전환율이 향상되도록 변환할 것이다. 우선 우리가 가진 페널티킥 데이터 전환율의 사전 분포(prior distribution)로 베타 분포를 사용할 것이다. (Fig-4) 사전 분포에 각 선수의 데이터를 합쳐 전환율의 추정값을 업데이트한다.


2. 페널티킥을 잘 차는 선수가 더 많은 페널티킥을 처리할 것이라는 사실을 고려한다. 우리는 이러한 사실을 Fig-2에서 확인한 바 있다. 페널티킥 시행횟수가 많아질수록 전환율이 높아지는 경향이 있다는걸 확인했다. 우리는 페널티킥을 적게 차는 선수의 성공률을 과대평가하고 많이 차는 선수의 전환율을 과소평가하는 문제를 마주하는데, 이 문제를 해결하고자 우리는 Beta-binomial 회귀를 사용할 것이다. 이 때 사전 분포를 만드는 과정에서 페널티킥 시행 횟수를 고려하게 된다. 



<Fig-4>



2가지 관점에서 변환하여 우리는 다섯번째 그림, Fig-5를 얻을 수 있다.



<Fig-5>



첫번째 그래프 : 페널티킥 전환율에 대한 초기 추정


두번째 그래프 : 사전 분포와 각 선수의 페널티킥 데이터를 합친 이후의 전환율


세번째 그래프 : 각 선수의 페널티킥 시행횟수까지 고려한 전환율


Fig-5에서 우리는 오른쪽으로 갈수록 각 데이터가 추세선에 가까워짐을 확인할 수 있다. 그래프를 통해 확인할 수 있듯이, 모든 선수가 변환 절차를 동등한 수준으로 적용받는건 아니다. 페널티킥을 더 많이 시도하는 선수는 적게 영향을 받으며, 이는 페널티킥을 많이 시행하는 선수들의 초기 전환율 값이 상당히 대표성을 지닌 값이라는걸 의미하기에 타당한 결과라고 볼 수 있다.


물론 몇가지 가정이 들어간다. 모든 페널티킥 상황이 동등하다는 가정이 첫번째다. 모두 동일한 조건에서 킥을 실시하며 페널티킥이 골로 연결될 확률이 모두 동일하다는 가정이 있다. 하지만 이는 결코 사실이 아니다. 하지만 충분히 용납할 수 있는 가정이라 생각한다. 몇가지 요인들은 페널티킥 상황을 더욱 어렵게 만든다 : 골키퍼의 수준, 경기 상황, 심리적 요인, 경기장 날씨... 하지만 이러한 요인들을 무시하고 진행하도록 하자.


앞서 언급한 접근법을 통해 우리는 각 선수의 페널티킥 전환율에 대한 확률 분포를 만들어낼 수 있다. 사전 분포와 각 선수의 데이터를 합쳐서 만든 사후 분포(posterior distribution)이라 할 수 있다. 


Fig-6는 로베르토 바죠와 리오넬 메시의 전환율을 모든 선수들의 사전 분포와 비교한다. Fig-6에서 우리는 바죠가 메시보다 더 뛰어난 페널티 키커라는걸 확인할 수 있다. (바죠의 그래프가 더 오른쪽에 있다) 그리고 메시가 평균적인 페널티 키커보다 페널티킥 처리 능력이 부족하다는걸 확인할 수 있다. 바죠의 그래프가 메시의 그래프보다 높이가 높고 폭이 좁은 것은 바죠가 메시보다 더 많은 페널티킥을 시도했다는 의미를 갖는다. (바죠 133회, 메시 107회) 사실 데이터 전체에서 바죠는 가장 많은 페널티킥을 시도한 선수고 그 뒤를 크리스티아누 호날두(128), 토티(113)가 잇는다.



<Fig-6>



Fig-7은 전환율 분포를 비교하는 또 다른 예시다. 여기서는 맷 르 티시에, 디에고 마라도나, 마렉 함식을 비교한다.



<Fig-7>



이 그래프를 바탕으로 각 선수들의 페널티킥 능력을 비교할 수 있지만, 3명 이상의 선수를 동시에 비교할 경우 시각적인 부분에서 비교하기 어려운 상황이 발생할 수 있다. 이러한 상황이 발생할 경우 신뢰구간을 만들어 해결할 수 있다. Fig-8은 각 선수들의 페널티킥 성공 사후 분포에 대한 95% 신뢰구간이며, 중위수 위치를 표시해놓았다. Fig-8은 전체 484명 중 상위 10명, 하위 10명에 대한 그림이다.



<Fig-8>



데이터 분석 결과, 콰우테모크 블랑코가 가장 뛰어난 페널티 키커라는 결과가 나왔다. (71골/73회 페널티킥) 그 뒤를 그라함 알렉산더(77/83)와 맷 르 티시에(49/50)가 뒤따르고 있다. 최악의 페널티 키커 3인은 마렉 함식(7/15), 마리노 페라니(10/19), 에딘 제코(7/14)이다.


상위 100명에 대한 데이터는 Fig-9를 통해 확인할 수 있다. 우리에게 익숙한 선수 이름을 확인할 수 있을 것이다.



<Fig-9>



각 선수의 전환율 그래프를 이용하는 또 다른 방법은 한 선수가 다른 선수보다 더 뛰어날 확률을 계산하는 것이다. Fig-6에서 본 그래프를 바탕으로 바죠가 메시보다 뛰어난 페널티 키커일 확률이 87.1%라는걸 계산해낼 수 있다. 계산 결과를 바탕으로 우리는 블랑코가 세계에서 가장 뛰어난 페널티 키커라고 말할 수 있겠지만, 틀림없이 확실하다고는 말할 수 없다. 앞서 소개한 방법론을 적용했을 때, 블랑코는 다른 483명의 선수보다 더 뛰어난 페널티 키커일 확률이 높았고 맷 르 티시에보다 더 뛰어난 페널티 키커일 확률은 66%였다.




출처 : https://barcanumbers.wordpress.com/2018/03/27/the-best-penalty-takers-of-all-time/





 



by Archie Rhind-Tutt


점유율, 성공한 패스 횟수, 유효슈팅, 코너킥 횟수같은 통계량을 TV중계, 인터넷, 언론, 베팅 어플 혹은 축구와 관련된 글에서 본 적이 있을거다. 


독일 바이어 레버쿠젠의 미드필더였던 스테판 라이나르츠는 (우리가 자주 접하는) 이러한 통계량들이 경기 결과와 상관관계가 없다고 말한다.


유로2016 대회를 독일TV를 통해 시청했다면, 패킹(Packing) 이라는 통계량을 들어봤을 것이다. 패킹 통계량은 IMPECT에서 만들어낸 통계량이며 라이나르츠가 바로 이 IMPECT의 공동 설립자이자 상무 이사이다.


패킹의 기원은 그보다 2년 전, 즉 2014년으로 거슬러 올라가야 한다. 쾰른에 있는 스포츠 대학에서 라이나르츠는 교수에게 다음과 같은 질문을 던졌다. "패스 성공률이 정말로 승리에 유의미하다는 것이 이치에 맞는지요? 골키퍼에게 100번 패스 연결해서 패스 성공률 100%를 기록할 수도 있습니다."


라이나르츠는 이렇게 생각했다 : 패스 성공률은 근본적으로 공의 소유를 위함이다. 상대팀 선수가 있다는 것이 우리에게 주어진 문제고 그걸 해결해야만 한다. 우린 공을 가지고 상대 선수들을 통과하길 원한다.



영향


쾰른에 있는 라이나르츠와 IMPECT는 데이터를 구단에게 직접 전달하는 것에 포커스를 두고 있다. 지난시즌 샬케04를 분데스리가 2위로 이끈 도메니코 테데스코, 새로운 PSG의 감독 토마스 투헬은 전력 분석을 위해 패킹 데이터를 사용한다.


패킹 통계량은 공격팀 선수가 패스나 드리블 과정을 통해 결과적으로 상대 선수 몇명을 통과했는가를 측정한다. 




예를 들자면 이렇다. 스웨덴과의 경기에서 존 스톤스가 해리 케인을 발견해 전진 패스를 시도했다. 케인이 성공적으로 공을 컨트롤했다면, 스톤스는 패스로 8명의 필드 플레이어를 통과한 셈이며 케인은 8명을 제치는 패스를 받은(receive) 결과를 기록하게 된다. 이렇게 모든 선수들이 각 과정에서 몇명의 선수를 제쳤는지를 수치화 할 수 있다. 만약 이런 상황이 발생한다면, 잉글랜드팀은 이 과정에서 8명의 상대 선수를 통과했다고 기록된다.


IMPECT의 연구 결과, 상대팀보다 더 높은 패킹 점수를 기록한 팀은 30~40%의 승리 확률을 기대할 수 있다. 만약 수비수를 통과한 횟수만 고려할 때, 승리의 가능도(likelihood)는 60%까지 상승한다. 득점을 제외하고 이렇게 승리에 직접적인 영향을 주는 통계량은 지금껏 존재하지 않았다.


조별리그에서 상대 수비수를 통과한 순-횟수(net-bypassed defenders) 탑9에 들었던 국가들 중 8개 국가가 16강 진출에 성공했다. 더욱 주목할 사실은 이 8개 국가 모두가 8강까지 진출했다는 것이다.



패킹 통계량에서 가장 앞서는 벨기에


러시아, 크로아티아, 잉글랜드는 승부차기 승리를 통해 8강 진출에 성공했지만, IMPECT의 루카스 케플러(Lukas Keppler)는 승부차기에서 승리한 쪽이 상대팀보다 통과한 수비수 숫자가 적어도 2회 이상 많았다고 말한다.




"우리는 각 선수의 가로채기 혹은 '턴오버' 에 대해서도 가치를 평가하고 있고 패스를 받는 선수의 능력도 평가하고자 합니다. 우리는 경기 퍼포먼스를 분석하는 가장 정확한 방법을 제공하고자 합니다. 물론 모든 것을 측정하진 못합니다. 선수의 정신력을 측정하는 방법은 없죠. 이러한 부분은 객관적으로 평가하기 어렵습니다."


'상대 수비수를 통과한 숫자' 라는 통계량은 러시아에서 최후의 승자가 될 국가를 결정짓는데 아주 좋은 지표가 될 것으로 보인다. 지금까지 56경기가 진행되었고 12경기가 무승부로 종료되었다. 승부가 났던 44경기 중에서 패킹 숫자가 낮음에도 승리한 경우는 단 4차례에 불과했다. 즉 수비수를 통과한 횟수가 더 많으면, 91%의 확률로 승리했다는 것이다.


'수비수를 통과한 횟수' 와 '(공격수와 미드필더를 포함한) 상대팀 선수를 통과한 횟수' 는 분명한 차이가 있다. '상대팀 선수를 통과한 횟수' 부분에서 1,2위를 달리는 선수는 바로 독일의 제롬 보아텡과 토니 크로스다. 하지만 두 선수는 수비수를 통과한 횟수에서는 탑5에 들지 못하며, 이 부분 1,2위를 달리는 선수는 벨기에의 드리스 메르텐스와 토마스 뫼니에다. 


마찬가지로 '상대팀 선수를 통과한 패스를 받는(receive) 횟수' 로 나열했을 때는 네이마르가 1등이지만, '수비수를 통과한 패스를 받은 횟수' 로 나열하면 미키 바추아이가 1등이다. 


그렇다면 이것이 무얼 의미하는가? : 경기를 펼치는 위치, 공을 받는 위치가 중요하다는 것이다. 


잉글랜드 팬들은 스웨덴이 가장 적게 상대팀 선수를 통과시킨 팀이라는 점을 우려해야한다. 하지만 마찬가지로 잉글랜드 역시 토너먼트에 진출한 국가 중 이 부분에서 나름 괜찮은 편에 속한다는 점을 인지해야한다. 







출처 : https://inews.co.uk/sport/football/world-cup/packing-football-statistic-world-cup-england-v-sweden/





일대일 능력을 평가하는 새로운 방법

Football Stats 2018. 5. 12. 00:59 Posted by Seolskjaer



by Garry Gelade


리버풀 출신의 전설적인 수비수 토미 스미스는 이렇게 말했다 : "공을 놓칠 수 있고 선수를 놓칠 수도 있다. 하지만 절대로 둘 다 놓쳐서는 안 된다." 토미 스미스는 1978년을 끝으로 선수 생활을 마무리했는데 그 이후로 축구는 그 당시보다 격렬함이 덜한 스포츠로 바뀌었다. 그러나 여전히 일대일 싸움(1v1 contest)은 경기의 중요한 요소로 자리매김하고 있다.


우리가 총괄적으로 '경합 상황(duels)'이라 알고 있는 여러 유형의 일대일 대결을 Opta가 분류했다. 공중볼 경합은 2명의 선수가 공중에서 공의 소유권을 따내기 위해 경쟁을 펼치는 것이다. 양 선수 모두가 공의 소유권을 갖고있지 않기 때문에 이는 아주 균형이 잡힌 상황이라 볼 수 있다. 그러나 지상 위에서의 경합은 균형 잡히지 않았다. 지상 위에서 펼쳐지는 경합은 한 선수가 공을 소유하고 있고 다른 선수가 그 소유권을 뺏기 위한 행동을 펼치면서 발생한다. 흔히 공격수들이 공의 소유권을 갖고 있으며 수비수들은 그 반대의 상황에 놓이나 이번 글에서는 공격수와 수비수를 같은 척도로 비교해보고자 한다. 따라서 경합 상황에서의 입장을 고려하지 않고 단순히 누가 경합에서 이겼는지만 따지겠다. Opta는 반칙을 경합 카테고리에 포함해 계산하므로 이 역시 반영하도록 하겠다.


이번 포스트에서 나는 이러한 프레임을 가지고 선수들의 일대일 능력을 평가해보고자 한다. 공중에서의 경합 능력과 지상에서의 경합 능력은 통계적으로 서로 다른 유형의 기술이고 공중에서의 경합 능력과 지상에서의 경합 능력의 상관성이 크지 않기 때문에 2가지를 분리하여 따져보고자 한다.


전통적으로 일대일 능력은 백분율 형태로 표현되었다. 선수의 경합 성공률은 '승리한 경합 횟수/전체 경합 횟수' 로 계산되었다.


합리적인 방식의 계산이나 이 방법은 경합을 펼치는 상대 선수의 능력을 전혀 고려하지 않은 방식이다. 임의적으로(randomly) 상대 선수와 매칭이 된다면, 경합 횟수가 많아질 때 경합을 펼치는 상대 선수의 수준은 결국 평균을 향해 갈 것이다. 그러나 상대 선수와 매칭되는 방식이 결코 임의성을 갖는다고 볼 수 없다. 감독은 가장 위협적인 공격수를 막기위해 팀에서 가장 뛰어난 수비수에게 마크를 지시한다. 따라서 가장 위협적인 공격수는 상대팀의 다른 선수들보다 가장 강력한 상대를 만나게 된다. 따라서 위협적인 공격수의 경합 성공률은 과소평가 되며 위협적이지 않은 선수의 능력은 고평가 된다. 반대로 수비수의 경우도 마찬가지 상황이 발생한다.


따라서 경합을 펼치는 상대의 능력을 분명하게 반영하기 위해 브래들리-테리 모델(Bradley-Terry Model)을 사용하고자 한다. 핵심적인 의문은 브래들리-테리 모형의 결과가 기존의 경합 성공률과 어떤 면에서 비교될 수 있는가?일 것이다. 지금부터 선수 평가에 있어서 브래들리-테리 모형이 만들어내는 놀라운 차이를 보자.



경합 우위의 중요성


경합에서 우위를 가져가는 것은 성공과 연관성이 있다. 경합에서 더 많이 승리하는 팀이 경기를 이길 가능성이 크다.


첫번째 그림은 공중 경합에서 우세한 팀이 경기에서 승리할 가능성이 39.2%라고 말하고 있다. 공중 경합에서 열세를 보인 팀이 승리할 확률은 32.6%이다. 이와 유사하게 지상에서 펼쳐지는 경합 상황에서 우세를 가져간 팀이 승리할 확률은 40.7%며 열세를 보인 팀은 승리할 확률은 32.1% 였다. 




물론 대다수 경합 상황이 경기 스코어에 직접적인 영향을 미치는 것은 아니다. 그러나 최근 프리미어 리그 득점의 29%는 50:50 경합 상황에서 공을 쟁취한 이후, 10초 이내에 발생했다. 만약 파울 상황까지 고려한다면, (즉 경합에서 승리한 후 10초 이내 얻은 프리킥이나 페널티킥으로 인한 득점까지 모두 고려한다면 ) 이 수치는 29%에서 39%까지 상승한다.



피치 위치의 영향


두번째 그림은 골대에서의 거리에 따른 경합 승리 확률을 그래프로 보여준다.



이 그래프를 통해서 우리는 다음과 같은 사실을 확인할 수 있다. 자신의 진영에 가까워질수록 경합에서 승리할 가능성이 높아진다. 즉 수비하는 입장이 유리하다. 이러한 해석이 이치에 맞는 것이, 골문 근처에서의 경합은 주로 공격수와 수비수 사이의 경합이다. 이 위치에서 수비수의 임무는 단 하나다. 공격수의 소유권을 뺏어 상대의 공격을 끊어내는 것이다. 그리고 수비수는 그러한 임무에 특화되어 있다. 그러나 공격수는 슈팅에 특화되어 있다. 일대일 능력이 뛰어난 선수일 수도 있지만, 어쨌든 상대 수비수를 무력화시키기 위해서는 창의적인 모습을 보여줘야 한다. 



일대일 능력의 평가


2015/2016시즌, 2016/2017시즌과 2017/2018시즌 현재까지 총 114,063회의 경합상황 데이터를 사용했다. 50%는 지상에서의 정당한 경합, 31%는 공중에서의 경합, 19.9%가 일대일 상황에서 파울이 발생한 경우였다. 이러한 충돌을 분석하기 위해 브래들리-테리 대응쌍 모형을 사용했다. 두 선수(i,j)의 일대일 대결 모델은 다음과 같이 표현될 수 있다.



 

각 선수의 λ값을 추정하는 과정에서 분석적인 문제가 발생하며 이를 베이지안 모델을 활용하여 해결했다. 지상에서의 경합(정당한 경합과 파울 모두 고려)과 공중에서의 경합을 분리하여 계산했다. 공중 경합에 대해서 100회 이상의 경합을 펼친 234명의 결과를 얻어냈다. 지상에서의 경합은 200회 이상 경합을 펼친 선수 286명을 대상으로 결과를 얻어냈다. 



경합 성공률에 대한 비교


공중에서의 경합 성공률과 지상에서의 경합 성공률은 (전체) 경합 성공률과 상당히 강한 상관관계를 지닌다. 공중 경합 성공률은 상관계수가 0.94였고 지상 경합 성공률은 상관계수가 0.86이었다. 만약 우리가 지금 사용하고 있는 방식을 (경합 승리 횟수/총 경합 횟수) 사용한다면, 이러한 사실을 모르고 지나가게 된다.


강한 상관관계에도 불구하고, 동일한 경합 성공률을 가진 선수들 사이에서도 브래들리-테리(BT) 랭킹이 구분지어졌다.





아래 2가지 표를 통해 확인할 수 있듯이, BT 랭킹 순으로 나열한 공중 경합 상위 20명과 지상 경합 상위 20명을 살펴보자.





공중에서 강한 탑3는 콤파니, 주마, 반 다이크였다. 더불어 3명의 선수는 (공중 경합을 위해 모은 234명의 표본 내) 경합 성공률에서도 1~3위를 차지했다. 그러나 크라우치의 경우 BT 랭킹은 4위이나 전체 경합 성공률로 따졌을 때는 15위를 차지했다. 앤디 캐롤도 마찬가지다. 공중 경합에 대한 BT 랭킹은 11위지만, 전체 경합 성공률에서는 44위를 차지했다.


반대로 필 존스는 경합 성공률에서 6위를 기록했으나 공중전에 대한 BT 랭킹에서는 20위를 기록했다. 두가지 추정방법에 따른 순위차이가 심한 선수는 올리비에 지루(경합 성공률 96위, BT랭킹 42위), 즐라탄 이브라히모비치(경합 성공률 107위, BT랭킹 54위) 였다.






지상 경합에서 에당 아자르의 BT 랭킹이 가장 높게 나왔고 아다마 트라오레가 3위를 차지했다. 두 선수 모두 기존의 경합 성공률 순위보다 새로운 측정에서 더 높은 순위를 기록했다. 윌셔, 로프터스-치크, 뎀벨레, 카일 워커도 기존의 방식으로 측정한 순위보다 BT 순위가 더 잘 나왔다. 유명한 선수들 중에서 경합 성공률이 저평가된 선수는 사디오 마네 (경합 성공률 순위 155위, 지상 경합 BT 랭킹 63위) 와 윌프리드 자하 (경합 성공률 순위 147위, 지상 경합 BT 랭킹 59위).



적용



브래들리-테리 모델의 장점은 상대 선수의 능력도 고려한다는 것이며 이러한 모델의 특성은 선수의 일대일 상황 능력을 평가하는데 상당한 영향을 미친다. 기존의 경합 성공률 방식은 선수의 일대일 능력을 과소평가 혹은 과대평가한다. 따라서 브래들리-테리 모델을 적용한 새로운 방식은 선수 영입에 있어 도움을 줄 수 있다.


브래들리-테리 모델의 또 다른 장점은 특정한 두 선수의 맞대결 결과를 예측할 때, BT 스코어를 그대로 사용하면 된다는 것이다. 두 선수가 실제로 맞대결을 펼쳤는지 관계없이 말이다. 만약 특정 공격수가 특정 수비수를 무력화시키는 빈도를 예측할 수 있다면, 이 정보는 선발 라인업을 구성하는데 사용될 수 있다. BT 모델로 얻은 결과는 경기를 준비하는 세세한 분야에 활용될 수 있다. 이 결과를 토대로 상대 공격수 마크맨을 결정할 수 있고 상대 수비수들 중에서 누구를 상대로 일대일 대결을 펼쳐야할지도 결정할 수 있다. 



출처 : http://www.optasportspro.com/about/optapro-blog/posts/2018/guest-blog-a-new-metric-for-evaluating-1v1-ability/



최근 풀백의 역할이 급격하게 바뀌었다. 이제 풀백을 공격에 어떻게 가담시키는지에 포커스를 두고 있고 풀백의 공격을 수비보다 더 비중있게 생각하기도 한다. 윙백을 활용하는 전술이 다시 유행하기도 했다. 지난시즌 프리미어 리그에서 안토니오 콘테가 3-5-2 시스템으로 성공을 거둔 사실을 주목해볼 필요가 있다. 풀백의 스타일을 주관적으로 해석하는 것을 넘어 (객관적인) 수량화를 할 수 있을까?


우리는 최근 풀백의 역할이 굉장히 다양해졌다는 사실에 집중했다. 우리는 서로 다른 특성을 지닌 풀백을 구체적이면서 객관적으로 구별해내고자 했다. 그래서 우리는 선수 개인의 스탯보다 광범위한 차원에서 접근했다. 우리는 Opta의 데이터를 활용했고 데이터의 차원을 줄이기 위해 주성분 분석(PCA, Principal Components Analysis) 중에서도 베리맥스 회전(varimax rotation) 방식을 적용했다. 이제 다음 단계는 정보를 활용하여 비슷한 성향의 풀백끼리 묶어 그 특징을 수치화하는 것이다.



수치화


우리는 2015/2016시즌과 2016/2017시즌 데이터를 활용, 유럽 상위 5개리그에 소속된 417명의 풀백을 분석했다. 2시즌 데이터로 주성분 분석을 한 결과는 굉장히 안정적인 값을 도출해냈고 우리는 2016/2017시즌 데이터를 바탕으로 군집 분석(cluster analysis)을 시행했다. 유사한 성향을 지닌 선수들, 서로 연관된 특성을 지닌 선수들이 하나의 묶음을 형성하며 성향이 다르거나 유사점을 찾기 어려운 선수는 분리된다. 우리는 분석 과정에서 최선을 다했으나 다른 리그에 소속된 선수들을 비교하는 것이 결코 쉬운 일이 아니라는 점을 감안하길 바란다.


우리의 분석 결과는 아주 흥미롭다. 선수의 퍼포먼스 통계를 바탕으로 우리는 11개의 군집이 형성됨을 확인했다. 세간의 이목을 끄는 선수들이 서로 같은 군집을 형성한 결과가 나왔다는 것도 중요하다. (마르셀루, 알렉스 산드로, 다비데 자파코스타가 같은 군집에 속했다.) 아래 그림을 통해 분석의 신뢰도를 각자의 눈으로 확인해보길 바란다. 


우리는 계층적 군집화(agglomerative method) 방법을 사용했고 모든 선수들은 각자의 '스타일 파트너' 를 갖고 이것이 둘을 묶는 선으로 표현된다. 거기서 확장하여 하나의 그룹을 형성되며 이와 비교되는 다른 쌍으로 형성된 그룹이 반복적으로 생성된다. 우리는 선의 길이를 바탕으로 선수들 사이의 유사도를 파악할 수 있다. (두 선수가 이어진 선의 길이가 길수록 서로 다른 유형) 여기서 같은 색깔로 지정된 나무가지에 속한 선수들이 하나의 군집으로 형성되었다고 볼 수 있다. 





지금부터 각 군집에 속한 몇몇 선수들을 나열할 것이다. 앞서 언급했듯이, 이 선수들이 하나의 집단으로 묶인 것에 동의할 것이라 생각한다. 군집화 알고리즘에는 축구에 대한 지식이 전혀 반영되어있지 않기 때문에 우리는 이 결과가 분석이 안정성 측면에서 굉장히 타당하다는걸 느낄 수 있다.





어떻게 활용하는가?


선수에 대한 어떠한 사전 정보없이도 우리는 군집 분석을 통해 유사한 선수들을 객관적 기준으로 묶을 수 있다. 어쩌면 이 방법은 구단의 이적시장에 큰 도움을 줄 수 있을 것이며 특히 제한된 금액을 사용하는 구단에게 더욱 유용할 것이다. 


예를 들면, 구단의 스타일에 맞춰 이적 리스트를 생성할 수 있다. 선수 영입을 담당하는 스태프는 이상적인 영입 (예를 들면 마르셀루) 을 생각한다. 그리고 이 모델을 활용하여 그 대안이 될 수 있는 선수, 감당할 수 있는 가격의 선수 (예를 들면 크리스티안 안살디) 를 탐색할 수 있다. 과정은 간단하다. 같은 집단으로 묶인 선수들 속에서 대안을 찾는 것이다. 나무의 높은 지점으로 갈수록 선수 유사도는 떨어진다. 하지만 원하는 스타일과 이적 예산 사이에서 타협을 해야하는 상황은 분명 발생한다.


구단 차원에서 선수의 특성을 시각화하는 더욱 현실적인 방법은 방사형 차트(rader chart)를 활용하는 것이다. 방사형 차트를 통해 선수의 장점과 약점을 비교할 수 있다. 이 방법은 같은 포지션을 맡는 2명의 영입 대상에게 적용될 수 있으며 잠재적 영입 대상과 기존에 보유하고 있는 선수를 대상으로도 시행할 수 있다.


아래 예시를 통해 우리는 라이언 버틀란드가 수비적인 부분과 공격의 효율성 부분에서 우위에 있음을 알 수 있다. 대니 로즈의 경우 수비적인 부분은 강하지 않으나 공을 소유하는 플레이에 우위를 갖고 있으며 버틀란드보다 공격 찬스를 만드는 횟수가 더 많다. 군집 분석 알고리즘을 통해 비슷한 유형의 선수를 선별한 이후, 지금처럼 방사형 차트를 통해 둘을 비교하는 과정을 거쳐 구단이 결정을 내린다고 볼 수 있다. 





요약


유럽의 데이터 뿐만 아니라 모든 리그의 데이터를 활용할 경우 이 모델링은 더욱 강력해지며 구단의 이적 정책을 수립에 있어 경쟁력을 불어넣을 것이다. 지금 소개한 방법은 빠르고 비용적인 면에서도 효율적이다. 시즌 중에도 계속해서 쉽게 업데이트 할 수도 있다. 모든 통계가 그렇듯이, 이 방법은 기존의 스카우팅 시스템을 완전히 대체하는 것이 아닌 보조적인 수단이다. 객관적인 수치화를 통해 우리는 편향없이 선수를 바라볼 수 있고 영입 대상에 대한 주관적인 판단과 통계적인 판단이 일치하는지 확인하여 더 좋은 의사결정을 할 수도 있다.


유럽에서 선수 가격이 급격하게 상승하고 있는 가운데 지금 소개한 방법이 구단의 패닉 바이를 막는 필터링 매커니즘이 되어 많은 돈이 지출되는 것을 막을 수도 있다.





출처 : http://www.optasportspro.com/about/optapro-blog/posts/2018/blog-clustering-playing-styles-in-the-modern-day-full-back/





맨체스터 유나이티드는 프리미어 리그 20개 구단 중에서 코너킥 상황 기대실점(xG)이 가장 높은 구단이다. 반면 첼시는 코너킥 상황 기대실점이 가장 낮은 구단이다.


현실적인 용어로 표현하자면 이렇다. 맨체스터 유나이티드는 3경기에 한번 꼴로 코너킥 상황에서 실점할 것으로 예상된다. 반면 첼시는 6경기에 한번 꼴로 코너킥 상황에서 실점할 것으로 예상된다. 두팀의 코너킥 허용 횟수가 비슷하기 때문에 이는 큰 차이가 될 수 있다. 


<맨체스터 유나이티드>


<첼시>



우리는 맨체스터 유나이티드가 코너킥 상황에서 허용한 실점이 모두 6-yard box 지점에 집중되어 있다는 것을 확인할 수 있다. 반면 첼시는 코너킥 상황 발생 시, 6-yard box에서 단 1실점만을 허용했다.  


이러한 자료를 보고서 처음 떠오른 생각은 바로, 티보 쿠르투아의 존재였다.


골키퍼가 코너킥 상황에서 뛰쳐나와 직접 공을 처리하는 상황은 프리미어 리그에서 평균적으로 8% 비율로 발생한다. 하지만 올시즌 쿠르투아가 코너킥 상황에서 공을 직접 처리하는 확률은 11%이며, 데 헤아의 경우는 5%이다. 하지만 이는 코너킥이 130회 시행된다고 했을 때, 단 7회 차이에 불과하다. 


나는 에버튼을 상대로 맨체스터 유나이티드와 첼시가 코너킥 방어를 어떻게 취하는지 간단히 살펴보았다. (원문 작성자는 에버튼 서포터) 에버튼은 3~4명의 선수를 페널티 스팟(penalty spot) 옆에 수직으로 배치하는 아주 기본적인 코너킥 공격 패턴을 갖고 있다.


맨체스터 유나이티드와 첼시의 수비 공통점이 있다. 두팀은 니어포스트 공간에 3명의 선수를 지역 방어 형태로 배치시킨다. 하지만 수비 포지션이 시작되는 위치, 6-yard box와 페널티 스팟 지점에서의 형태 유지에서 차이가 보였다. 


유나이티드는 첼시보다 타이트하게 맨마킹을 시도하여 처음부터 뒤죽박죽으로 서있는 경우가 있다. 그리고 적어도 절반의 선수는 공보다 선수를 눈에 두고 있다. 따라서 공이 연결되는 순간, 맨체스터 유나이티드 수비수들의 수비 자세가 좋지 못할 수 있어 그들의 저지선이 비효율적이 될 수 있다. 혼란스러운 상황이 자주 발생하고 결국 공을 처리하기 어려운 상황이 만들어진다. 








반면, 첼시는 라인을 잘 세워놓고 공을 처리할 수 있는 여지를 남겨놓는다. 첼시는 처음부터 대인방어를 하지 않으며 곳곳에서 에버튼 선수들을 쫓아간다. 




 



출처 : https://differentgame.wordpress.com/2018/03/10/cornering-the-xg-market/

드리블 통계 더 자세하게 알아보기

Football Stats 2018. 3. 3. 00:22 Posted by Seolskjaer



Euan Dewar


드리블 혹은 Take-On. 어떤 표기법을 사용하든 간에 이는 독특한 통계량이다. 우리는 드리블을 많이 성공하는 선수들을 하나의 스타일로 간주한다. 하지만 우리는 단순히 드리블 횟수라는 날 것(raw)의 데이터만으로 드리블이 발생한 위치, 드리블 방향, 드리블 이후 선수가 어떤 행동을 취했는지 알 수 없다.


논점을 분명하게 하기위해 2명의 선수를 비교해보고자 한다. 맨체스터 시티의 르로이 사네, 허더스필드의 라이브 반 라 파라 둘을 비교하고자 한다. 두 선수 모두 주로 왼쪽에서 경기를 소화하며 90분당 3회 이상의 드리블 돌파를 성공한다. 성공률은 사네가 63.5%이며 반 라 파라가 53.5%를 기록 중이다. 기본적인 통계는 아주 흡사하다. 하지만 드리블 시작점과 끝점 & 드리블 이후 어떤 행동이 이어졌는지를 나타내는 아래 그림을 확인하면 두 선수의 차이를 확실히 알 수 있다.





반 라 파라는 낮은 지점에서 드리블을 시작한다. 반 라 파라는 5대 리그 선수들 중에서 자기 진영에서 드리블을 가장 많이 시작하는 선수들 중 하나다. 그리고 반 라 파라의 드리블은 중앙 지향적이다. 보통 스트라이커가 그의 드리블을 이후 패스를 받아준다. 정통 윙어의 관점에서 봤을 때, 반 라 파라의 드리블 후 결과물(post-dribble work)은 뛰어나다고 볼 수 없다. 


한편 사네는 파이널 서드 지역에서 드리블을 시도하는 경우가 많고 드리블 이후 컷백(cutback)을 시도하는 횟수가 굉장히 많다. 사네는 이미 상대에게 위협적인 지점에서 드리블을 시작한다. 따라서 상대 선수를 제치는 것만으로도 상대가 처리하기 곤란한 상황을 만든다. 드리블 이후의 결과물까지 좋은 것은 금상첨화다.


우리는 이를 복합적으로 해석해야 한다. 허더스필드 타운은 맨체스터 시티와는 아주 다른 팀이다. 특히 윙어의 스쿼드 퀄리티 면에서 아주 다르다. 맨체스터 시티와 허더스필드 타운이 마주하는 상황이 다르기 때문에 (상황에 맞는) 다른 퀄리티를 갖고 올 다른 선수가 필요한 셈이다. 반 라 파라는 드리블을 통해 팀의 전체적인 전진에 도움을 준다. 반면 사네는 이미 파이널 서드에서 공을 받기 때문에 깊숙히 내려간 상대의 블록을 깨기 위한 드리블이 필요하다. 


아래 표는 상위권 선수들의 드리블 및 드리블 이후 상대 페널티 박스 내에서 결과물에 대한 통계를 보여준다. 모든 스탯은 2017/2018시즌 경기를 대상으로 90분 기준이다. 일부 리그 앙 경기의 데이터 손실이 있다. 


메시의 기록이 눈에 띈다. 올시즌 메시의 드리블 이후 페널티 박스 안에서 패스 & 슈팅 통계는 지난 2016/2017시즌의 기록을 뛰어 넘었다. 프리미어 리그에서 유명세를 타고 있는 선수들의 이름을 확인할 수 있고 멋진 시즌을 보내고 있는 레온 베일리 역시 확인할 수 있다.



 

Dribbles Ending In

Opposition Box

Post-Dribble Passes

Ending In

Opposition Box 

Post-Dribble

Shots in

Opposition Box 

Post-Dribble

Box Passes+Shots 

리오넬 메시

1.88 

0.76 

0.58 

1.34 

에당 아자르 

1.00 

0.39 

0.50 

0.89 

레온 베일리 

0.61 

0.54 

0.34 

0.87 

킹슬리 코망 

1.20

0.56 

0.24 

0.80 

킬리안 음바페 

1.21 

0.41 

0.24 

0.67 

라힘 스털링 

0.75 

0.37 

0.28 

0.66 

크리스티안 퓰리시치 

0.51 

0.45 

0.17 

0.62 

필리페 쿠티뉴 

0.61 

0.27 

0.34 

0.61 

윌프리드 자하 

1.16 

0.30 

0.30 

0.60 

리야드 마레즈 

0.86 

0.14 

0.46 

0.59 

곤살로 게데스

1.15 

0.22 

0.36 

0.58 

앙헬 코레아 

0.86 

0.19 

0.37 

0.56 

이아고 아스파스 

0.68 

0.32 

0.23 

0.55 

요한 모이카 

0.34 

0.54 

0.00 

0.54 

르로이 사네 

1.16 

0.29 

0.23 

0.52 

플로리랑 토방 

0.98 

0.13 

0.38 

0.51 

네이마르 

0.83 

0.33 

0.17 

0.50 

모하메드 살라 

0.97 

0.09 

0.40 

0.49 

루벤 로프터스-치크 

0.75 

0.27 

0.20 

0.47 

데니스 프래엣

0.11

0.33 

0.11 

0.44 



이번에는 상대 골문에서 18야드 떨어진 지점까지 도달하는 점유 과정에서 관여도를 살펴보기로 했다. (드리블을 통해서 혹은 드리블 이후 패스를 통해서 관여하는 것 모두를 포함) 선수 혼자서 상대 골문에서 18야드 떨어진 지점까지 도달하는 경우도 당연히 포함한다. 여기서 우리는 에당 아자르와 소피앙 부팔 같은 선수들의 부가적인 가치를 확인할 수 있다. 상대의 골문을 위협하는 마지막 볼처리가 모두의 시선을 이끌지만, (드리블을 통해) 팀을 전진시키는 행위 역시 마찬가지로 중요하다.



 

Unique Possesions

Ending in

Opposition Final 18

Yards Involved in

(Via a Dribble That

Starts Outside Final

18 Yards)

Individual Entires to

Final 18 Yards

(Via Dribble or Post-

Dribble Pass) 

Individual Entires to

Final Third 

(Via Dribble or Post-

Dribble Pass) 

Average 

Vertical

Dribble

Distance On

Those

Possessions

(Metres)

에당 아자르

2.39 

1.11 

0.78 

7.71 

네이마르 

2.17 

0.89 

0.72 

6.73 

킹슬리 코망 

2.16 

1.12 

0.48 

10.48 

리오넬 메시 

1.97 

0.98 

0.67 

6.82 

디에고 페로티 

1.90 

0.59 

1.03 

5.86 

소피앙 부팔 

1.78 

0.77 

0.39 

8.40 

이스코 

1.59 

0.30 

0.53 

8.50 

더글라스 코스타 

1.45 

1.16 

0.29 

11.06 

루카 모드리치 

1.42 

0.37 

0.31 

5.47 

조나단 비에라

1.39 

0.22 

0.61 

5.86 

페데 카르타비아

1.38

0.58 

0.51 

6.51 

잭 윌셔 

1.38 

0.20 

0.69 

7.73 

레미 카벨라 

1.38 

0.72 

0.22 

6.59 

탕기 은돔벨레 

1.31 

0.36 

0.36 

6.10 

루벤 로프터스-치크 

1.28 

0.95 

0.20 

8.11 

말콤 

1.28 

0.09 

0.46 

7.62 

안드로스 타운센드 

1.25 

0.83 

0.29 

8.10 

크리스티안 퓰리시치 

1.25

0.91 

0.45 

14.47 

옥슬레이드-체임벌린 

1.23 

1.23 

0.48 

15.96 

플로리앙 토방 

1.23

0.68 

0.30 

6.63 

마리오 르미나 

1.20 

0.28 

0.28 

8.84 

발렌틴 로시어 

1.18 

0.45 

0.11 

9.73 

곤살로 게데스 

1.15 

0.86 

0.58 

19.56 

나비 케이타 

1.14 

0.43 

0.43 

7.34 

마누엘 란지니 

1.11 

0.37 

0.50 

10.25 

폴 포그바 

1.11 

0.13 

0.39 

5.34 



공격 자원에게만 포커스를 두는 것은 옳지 않다. 아래는 상대 골문에서 18야드 떨어진 지점까지 전진하는 과정에서 관여도를 서열화한 것인데 평균적인 드리블 위치가 상대 파이널 서드 지역이 아닌 선수들만을 대상으로 하며 또한 드리블을 중앙 지역에서 시도하는 선수들로 한정한다. 이러한 필터링 과정을 통해 우리는 무사 뎀벨레의 이름을 찾아볼 수 있었다. 뎀벨레의 드리블이 항상 파이널 서드 지역까지 진입하지는 않지만 뎀벨레는 드리블을 통해 토트넘이 끝내 파이널 서드에 진입할 수 있도록 돕는다.


 

Unique Possessions

Ending in Final Third

Involved in (via a Dribble)

% of Dribbles That 

Occur Centrally 

지아넬리 임불라

1.78 

87.2% 

탕기 은돔벨레 

2.32 

77.6% 

무사 뎀벨레 

2.34

76.1% 

나비 케이타 

2.36 

74.4% 

마리오 르미나 

2.41 

72.7% 

조나단 비에라 

2.41 

66.3% 

나빌 페키르 

2.14 

58.0% 

후셈 아우아르

1.82

56.3% 

마누엘 란지니 

2.35 

55.6% 

에베르 바네가 

2.19 

55.4% 

라자 나잉골란 

1.61 

54.5% 





뎀벨레를 대체하는 것은 쉽지 않다. 과거 공격형 미드필더였던 뎀벨레가 후방 미드필더로 재탄생한 것처럼 어린 선수를 개조할 수 있을까? 샬케04의 20세 미드필더 아민 하리트는 아주 딱 맞는 인물이다. 하리트는 뎀벨레와 유사하게 드리블을 치는 습성이 있다. 아니면 중앙 미드필더 포지션에서 드리블 실력이 좋은 다른 선수를 구매하는 방법도 있다. 사우스햄튼의 마리오 르미나는 점차 스퍼스 팬들의 뎀벨레 대체자 후보군에 이름을 올리고 있다. 프리미어 리그 외부에서는 리옹의 탕기 은돔벨레를 주목하고 싶다. 그는 렌과의 경기에서 무려 10번의 드리블을 성공했다.


   



    

출처 : https://statsbomb.com/2018/02/taking-em-on-digging-deeper-with-dribbles/