각팀이 경기에서 기록하는 득점 수는 포아송 분포를 따르게 된다. 아래 그래프를 통해서 확인할 수 있는데 포아송 분포는 무득점 가능성을 다소 과소평가하고 있으며 1~3골이 기록될 가능성을 조금 더 높게 예상하고 있다. 그러나 4골 이상부터는 다시 포아송 분포의 예상값이 실제 값보다 작다. 그러나 그 차이는 우리가 무시하고 넘어갈 수 있을정도로 작다고 생각된다.





우선 홈과 원정에서 프리미어 리그 클럽들의 득점과 실점 기록 평균을 구해 공격 계수, 수비 계수 수치를 만들었고 특정 매치에 2개의 팀의 각각의 계수를 대입하여 예측할 수 있는 스코어를 계산해 보았다. 이를 토대로 아래에 있는 포아송 분포를 따르는 확률 매트릭스를 만들어낼 수 있었다. 



Goals012345678
01.964.084.242.941.530.640.220.070.02
13.637.567.865.452.831.180.410.120.03
23.367.007.275.042.621.090.380.110.03
32.084.324.493.111.620.670.230.070.02
40.962.002.081.440.750.310.110.030.01
50.360.740.770.530.280.120.040.010.00
60.110.230.240.160.090.040.010.000.00
70.030.060.060.040.020.010.000.000.00
80.010.010.010.010.010.000.000.000.00


과거의 기록을 토대로 만들어야 하기 때문에 리그 시작 후 5주가 지난 후에서야 이 모델을 활용할 수가 있었다. 또 아래의 표는 포아송 분포를 이용한 홈팀의 승리 가능성을 예상한 것인데 이를 통해 계산한 값과 베팅업체 Betfair의 값을 비교해보시라.


omeAwayPredictionProbability (%)OddsBetfairResult
SwanseaEvertonHOME56.31.783.35AWAY
ChelseaStoke CityHOME63.41.581.39HOME
SouthamptonAston VillaAWAY49.22.033.1HOME
West BromReadingHOME41.12.431.82HOME
West HamSunderlandHOME35.72.802.24DRAW
WiganFulhamAWAY40.12.493.25AWAY
LiverpoolMan UtdAWAY75.61.322.82AWAY
NewcastleNorwichHOME82.91.211.84HOME
Man CityArsenalAWAY37.12.701.78DRAW
TottenhamQPRHOME41.12.431.51HOME


포아송 분포를 통한 경기 예측은 매주 30~60% 가량의 경기 결과를 정확하게 예측해내고 있다. 평균적으로 46%의 정확성을 기록 중인데 우리가 임의로 찍어서 얻어내는 확률 33%보다는 높은 값이다.





시즌이 더 진행되면서 자료가 쌓일 경우 더욱 정확한 예측이 가능할 것이라 생각한다. 또한 계산 모델에서 더 발전이 있을 수 있다. 현재 사용하고 있는 방식은 각팀의 득점을 독립적인 사건으로 생각하고 있지만 한 팀이 계속 득점할수록 상대팀의 득점 확률은 줄어드는 상호작용이 포함되는 모델이 개발될 경우, 더욱 정확한 결과를 예측해낼 수 있을 것이다. 아직까지 포아송 분포를 활용한 경기 예측은 신뢰할 수 있는 수준이 아니다.



출처 : http://pena.lt/y/2012/10/29/using-poisson-to-predict-football-matches/