골득실을 활용한 EPL 4위권 예측

Football Stats 2016. 6. 6. 20:34 Posted by Seolskjaer







득점? 실점? 골득실?


우선적으로 중요한 과정은 가장 유의미한 데이터를 선택하는 것입니다. 리그 테이블에서 우리가 선택할 수 있는 변수는 3종류 있습니다. 각 클럽의 득점 수, 실점 수, 앞선 2가지로 인해 발생하는 골득실. 이 3가지 중에서 어떤 변수가 가장 최종적인 성적을 잘 설명하는지에 대해 체크해야 하고 대수의 법칙으로 인해 자료의 개수가 많을수록 좋기 때문에 2005/2006시즌부터 2014/2015시즌까지 총 10시즌, 200가지 경우의 득점과 승점의 매치 (실점과 승점의 매치, 골득실과 승점의 매치)를 살펴보았습니다. 








R을 활용하여 각 경우에 대한 선형회귀분석을 시도했고 여기서 골득실이 가장 승점 예측을 정확하게 할 수 있는 변수로 선정하는 것이 합리적일 것이라는 결론을 내릴 수 있게 되었습니다. (득점의 R^2 : 0.774 / 실점의 R^2 : 0.7081 / 골득실의 R^2 : 0.9294)



피타고리안 승점 예측


피타고리안 승점 예측에 대해서는 번역 글을 통해 몇차례 소개한 바 있습니다. 하워드 해밀턴의 피타고리안 예측은 일반적으로 사용하기 어려워 마틴 이스트우드가 야구에서 활용되는 피타고리안 승률법을 약간 변형한 MPE 방정식을 활용하려고 합니다. MPE 방정식 역시도 이미 번역을 통해 소개했었습니다. 마틴 이스트우드는 2003~2012년 사이의 프리미어 리그 데이터를 바탕으로 MPE 방정식으로 예측한 순위와 실제 순위에 대한 회귀분석을 시도했고 결정계수(R^2)값이 0.938이라는 사실을 알아냈습니다. 2005/2006시즌부터 2014/2015시즌까지의 데이터를 바탕으로 똑같이 선형회귀분석을 시도해도 결과는 굉장히 비슷하게 나오고 있습니다. 







피타고리안 승점으로 바라본 리그 4위의 흐름은?


4위 자리를 놓고 치열한 싸움을 펼치고 있는 맨체스터 시티, 웨스트 햄 유나이티드, 맨체스터 유나이티드의 예측 승점은 과연 어떻게 될 것인가? 맨체스터 시티가 조금 유리한 편이지만, 현재까지의 흐름대로 앞으로 흘러간다고할 경우 누가 4위를 차지할지에 대해서는 확신을 가지고 말하기 어려운 결과를 내놓고 있습니다. 아래 그래프에서 노란색은 예측승점의 변화를 나타내며 나머지 2개의 선은 각 라운드별 골득실을 활용한 예측 승점의 변화와 실제 승점의 변화를 나타내고 있습니다. 











세 클럽 모두 MPE 방정식을 활용한 최종적인 예측 승점에 가까워지고 있으며 모두 65점 전후에서 이동할 것이라 말을 하고 있습니다. 30라운드까지의 결과과 반영된 세 팀의 최종적인 예측 성적을 표현한 가장 마지막 그래프를 본다면, 하늘색으로 표시된 맨체스터 시티가 65점을 넘어 67점의 예측값을 지니고 있습니다. 그렇다면 맨체스터 시티의 4위가 확실하다고 할 수 있는가? 그건 또 아니라고 할 수 있는게 이것은 어디까지나 예측이고 예측은 항상 오차를 수반하기 때문에 오차의 발생을 반드시 고려해야만 합니다. 








다음은 지난 10시즌간 각 클럽의 예측 승점과 실제 승점의 차이에 대한 평균값으로 3.45점의 오차가 발생한다는 것을 유의해야만 합니다. 따라서 어느 클럽이 확실하게 4위를 달성할 것이라 말을 할 수가 없는 상황입니다. 30라운드 현재 맨체스터 시티는 30라운드까지의 예측 승점보다 2점을 못따냈고 (실제 승점 51점, 예측 승점 53점) 맨체스터 유나이티드와 웨스트 햄 유나이티드는 각각 예측 승점보다 실제 승점이 1점, 2점이 높습니다. (*부가적으로 레스터 시티는 현재 예측 승점보다 승점 9점을 높게 달성하면서 1위를 달리고 있습니다. 레스터 시티가 전체 19승 중에서 1점차 승리를 총 13번 기록했다는 것은 이들이 굉장히 효율적으로 승리해왔다는 것을 의미하기도 합니다.)








예측 승점의 흐름을 본다면, 맨체스터 시티의 경우 승점 70점 이상을 기록할 것이라 예측되었는데 이것이 60점대로 떨어졌다는 것이 가장 큰 불안 요소일 것입니다. 맨체스터 유나이티드는 예측 승점이 17라운드 정도부터 반등하려는 기미를 거의 보이지 못했다는 점이 불안 요소입니다. 맨체스터 유나이티드는 예측 승점을 시즌 초반에 70점대까지 끌어올렸으나 18라운드에서 61점으로 추락한 이후 61~64점 범위에서 계속해서 벗어나질 못하고 있습니다. 실제로 루이 반 할 부임 이후 팀이 중요 경기에서 승리한 이후 승점 사냥을 하는 분위기를 타지 못한다는 것이 이렇게도 표현되었다고 할 수 있겠습니다. 웨스트 햄 유나이티드는 시즌 중반에 연달아 0:0 무승부를 기록하면서 예측 승점이 50점대로 떨어졌으나 이를 다시 60점대 초반으로 끌어 올렸습니다. 


경쟁 클럽보다 훨씬 높은 예측 승점을 가지고 있었으나 떨어지려는 맨체스터 시티, 우위를 차지하기 위해선 치고 올라가야하는 상황이나 그저 그 자리를 지키고만 있는 맨체스터 유나이티드, 예측 승점이 50점대까지 떨어졌다가 올라온, 세팀 중에서 그나마 가장 상승 흐름이라고 할 수 있는 웨스트 햄 유나이티드의 대결이라 볼 수 있을 것입니다. 


물론 이 방법은 앞으로도 현재까지의 흐름이 비슷하게 흘러간다고 가정했을 때 의미가 있을 것입니다. A매치 기간이 각 팀의 현재 흐름을 끊어내는 결과를 불러일으킬 수 있으며 세 팀이 굉장히 미세한 차이를 보이고 있는만큼 여기서 가장 뚜렷한 변화를 만들어내는 팀은 경쟁에서 승리할 가능성이 높을 것으로 보입니다.