Search

'군집 분석'에 해당되는 글 1건

  1. 2018.04.07 풀백의 플레이 스타일을 고려한 군집 분석



최근 풀백의 역할이 급격하게 바뀌었다. 이제 풀백을 공격에 어떻게 가담시키는지에 포커스를 두고 있고 풀백의 공격을 수비보다 더 비중있게 생각하기도 한다. 윙백을 활용하는 전술이 다시 유행하기도 했다. 지난시즌 프리미어 리그에서 안토니오 콘테가 3-5-2 시스템으로 성공을 거둔 사실을 주목해볼 필요가 있다. 풀백의 스타일을 주관적으로 해석하는 것을 넘어 (객관적인) 수량화를 할 수 있을까?


우리는 최근 풀백의 역할이 굉장히 다양해졌다는 사실에 집중했다. 우리는 서로 다른 특성을 지닌 풀백을 구체적이면서 객관적으로 구별해내고자 했다. 그래서 우리는 선수 개인의 스탯보다 광범위한 차원에서 접근했다. 우리는 Opta의 데이터를 활용했고 데이터의 차원을 줄이기 위해 주성분 분석(PCA, Principal Components Analysis) 중에서도 베리맥스 회전(varimax rotation) 방식을 적용했다. 이제 다음 단계는 정보를 활용하여 비슷한 성향의 풀백끼리 묶어 그 특징을 수치화하는 것이다.



수치화


우리는 2015/2016시즌과 2016/2017시즌 데이터를 활용, 유럽 상위 5개리그에 소속된 417명의 풀백을 분석했다. 2시즌 데이터로 주성분 분석을 한 결과는 굉장히 안정적인 값을 도출해냈고 우리는 2016/2017시즌 데이터를 바탕으로 군집 분석(cluster analysis)을 시행했다. 유사한 성향을 지닌 선수들, 서로 연관된 특성을 지닌 선수들이 하나의 묶음을 형성하며 성향이 다르거나 유사점을 찾기 어려운 선수는 분리된다. 우리는 분석 과정에서 최선을 다했으나 다른 리그에 소속된 선수들을 비교하는 것이 결코 쉬운 일이 아니라는 점을 감안하길 바란다.


우리의 분석 결과는 아주 흥미롭다. 선수의 퍼포먼스 통계를 바탕으로 우리는 11개의 군집이 형성됨을 확인했다. 세간의 이목을 끄는 선수들이 서로 같은 군집을 형성한 결과가 나왔다는 것도 중요하다. (마르셀루, 알렉스 산드로, 다비데 자파코스타가 같은 군집에 속했다.) 아래 그림을 통해 분석의 신뢰도를 각자의 눈으로 확인해보길 바란다. 


우리는 계층적 군집화(agglomerative method) 방법을 사용했고 모든 선수들은 각자의 '스타일 파트너' 를 갖고 이것이 둘을 묶는 선으로 표현된다. 거기서 확장하여 하나의 그룹을 형성되며 이와 비교되는 다른 쌍으로 형성된 그룹이 반복적으로 생성된다. 우리는 선의 길이를 바탕으로 선수들 사이의 유사도를 파악할 수 있다. (두 선수가 이어진 선의 길이가 길수록 서로 다른 유형) 여기서 같은 색깔로 지정된 나무가지에 속한 선수들이 하나의 군집으로 형성되었다고 볼 수 있다. 





지금부터 각 군집에 속한 몇몇 선수들을 나열할 것이다. 앞서 언급했듯이, 이 선수들이 하나의 집단으로 묶인 것에 동의할 것이라 생각한다. 군집화 알고리즘에는 축구에 대한 지식이 전혀 반영되어있지 않기 때문에 우리는 이 결과가 분석이 안정성 측면에서 굉장히 타당하다는걸 느낄 수 있다.





어떻게 활용하는가?


선수에 대한 어떠한 사전 정보없이도 우리는 군집 분석을 통해 유사한 선수들을 객관적 기준으로 묶을 수 있다. 어쩌면 이 방법은 구단의 이적시장에 큰 도움을 줄 수 있을 것이며 특히 제한된 금액을 사용하는 구단에게 더욱 유용할 것이다. 


예를 들면, 구단의 스타일에 맞춰 이적 리스트를 생성할 수 있다. 선수 영입을 담당하는 스태프는 이상적인 영입 (예를 들면 마르셀루) 을 생각한다. 그리고 이 모델을 활용하여 그 대안이 될 수 있는 선수, 감당할 수 있는 가격의 선수 (예를 들면 크리스티안 안살디) 를 탐색할 수 있다. 과정은 간단하다. 같은 집단으로 묶인 선수들 속에서 대안을 찾는 것이다. 나무의 높은 지점으로 갈수록 선수 유사도는 떨어진다. 하지만 원하는 스타일과 이적 예산 사이에서 타협을 해야하는 상황은 분명 발생한다.


구단 차원에서 선수의 특성을 시각화하는 더욱 현실적인 방법은 방사형 차트(rader chart)를 활용하는 것이다. 방사형 차트를 통해 선수의 장점과 약점을 비교할 수 있다. 이 방법은 같은 포지션을 맡는 2명의 영입 대상에게 적용될 수 있으며 잠재적 영입 대상과 기존에 보유하고 있는 선수를 대상으로도 시행할 수 있다.


아래 예시를 통해 우리는 라이언 버틀란드가 수비적인 부분과 공격의 효율성 부분에서 우위에 있음을 알 수 있다. 대니 로즈의 경우 수비적인 부분은 강하지 않으나 공을 소유하는 플레이에 우위를 갖고 있으며 버틀란드보다 공격 찬스를 만드는 횟수가 더 많다. 군집 분석 알고리즘을 통해 비슷한 유형의 선수를 선별한 이후, 지금처럼 방사형 차트를 통해 둘을 비교하는 과정을 거쳐 구단이 결정을 내린다고 볼 수 있다. 





요약


유럽의 데이터 뿐만 아니라 모든 리그의 데이터를 활용할 경우 이 모델링은 더욱 강력해지며 구단의 이적 정책을 수립에 있어 경쟁력을 불어넣을 것이다. 지금 소개한 방법은 빠르고 비용적인 면에서도 효율적이다. 시즌 중에도 계속해서 쉽게 업데이트 할 수도 있다. 모든 통계가 그렇듯이, 이 방법은 기존의 스카우팅 시스템을 완전히 대체하는 것이 아닌 보조적인 수단이다. 객관적인 수치화를 통해 우리는 편향없이 선수를 바라볼 수 있고 영입 대상에 대한 주관적인 판단과 통계적인 판단이 일치하는지 확인하여 더 좋은 의사결정을 할 수도 있다.


유럽에서 선수 가격이 급격하게 상승하고 있는 가운데 지금 소개한 방법이 구단의 패닉 바이를 막는 필터링 매커니즘이 되어 많은 돈이 지출되는 것을 막을 수도 있다.





출처 : http://www.optasportspro.com/about/optapro-blog/posts/2018/blog-clustering-playing-styles-in-the-modern-day-full-back/