[개데이터] 어디까지 가는가? 축구의 수치화 (2)

by 잠잘까 posted Jan 10, 2015
?

단축키

Prev이전 문서

Next다음 문서

ESC닫기

크게 작게 위로 아래로 댓글로 가기 인쇄


http://www.kfootball.org/board/3446983

 

1편에 이어

 

 

 

 

 

 

 

 

----------------

 

2.3 가중치

 

우린 전 글을 통해 전북 최철순이 레알 호날두를 무려 7가지 방법을 통해 막을 수 있는(...)걸 알아냈다. 하지만 최철순과 윌킨슨이 호날두를 마크한다면? 각자 필요한 능력치가 다를 것이다.

 

윌킨슨의 뛰어난 능력은 대인방어와 공중볼 경합을 들 수 있는데 그건 넘어가고 윌킨슨의 포지션은 센터백이란 걸 염두해 둬야 한다. 센터백에게 과도한 태클 기술이 필요할까? 주로 페널티 에어리어안에 위치한 윌킨슨은 1:1시에 필요한 태클이 해당 진로를 방해하는 태클이지, 공을 노리고 뺏어야하는 태클 능력은 아주 크게 필요하진 않다. 또 패스능력도 아주 필요하다고는 볼 수 없다. 기본적으로 센터백의 능력은 수비에 있으며 현대축구가 점점 토탈화를 추구하는 방향에 맞춰 패스와 드리블이 필요할 뿐이다. 없어도 충분히 먹고 살 수 있다.

 

그럼 해당 전술에 기초해 최철순과 윌킨슨이 필요한 세부 기록에 대해 가중치를 부여 할 수 있다. 윌킨슨이 10개의 공중볼에서 8개의 공을 얻어낸 부분에 80을 주고, 최철순이 10개의 크로스 중에 3개를 성공했다면 60점을 주고, 반대로 윌킨슨이 필드에서 우연히 어시스트를 기록한다면 다른 필드플레이어에게 줄 100점에서 그 반인 50점을 준다.

 

이런식의 계산법은 선수간의 비교를 간략하게나마 가능하게 하면서 '울 선수가 짱' 이라는 유치한 이야기를 술자리에서 이야기 할 수 있다. 그리고 이걸 재미나게 구현한게 EPL EA 스포츠 PPI 와  EPL 판타지 리그다.

 

 

 

 3.png

 

http://www.premierleague.com/en-gb/players/ea-sports-player-performance-index/what-is-the-ea-sports-ppi.html

 

PPI, Player Perfermance index는 해당 선수의 출전시간, 골, 어시스트 등의 1차적 항목 등을 수치화해 랭킹표로 만들어 놓은 시스템이다. 1위에 에당하자르가 올라간걸 볼 수 있으며 같은 팀인 디에고 코스타가 2위. 언급하기도 싫은 선수 랭킹의 변화가 있다면 가끔 국내 기사에 등장하기도 하기도 한다. (http://sports.mk.co.kr/view.php?sc=71000003&year=2014&no=1561608)

 

과거 몇년전에는 EPL 자체 혹은 다른 회사를 통해 이러한 랭킹을 이용했는데(박지성 시절), 몇해전부터는 EA SPORTS와 연동했다. 이는 당근 게임에서도(FIFA 시리즈) 다룰 수 있는 부분이다. 해당 링크에서는 EA가 해당 데이터를 어떻게 선별하고 조합하는지를 간략하게 적은 부분이 있는데, 중요하게 볼게 2번 부분이다.

 

 

2. Player's Performance per match

Players receive points for positive influences on a winning performance (shots on target, tackles, clearances, saves etc). Players have points taken away from their score for negative actions such as shots off target and receiving yellow and/or red cards.

 

 

Clearances나 Saves 등 우리가 개리그에선 좀 처럼 볼 수 없는 항목들도 여기에 포함되어 있고, 이를 포지션마다 가중치를 두어 선수들을 분류했다. (e.g. a pass by a midfielder will not gain more points than a tackle made by a defender).

 

그동안 개리그는 슛과 어시스트 항목에 치중되어서 미드필더나 수비수들의 경우 어떤 선수가 잘하는지 알기 어려웠다. 그러나 만약에 이런 데이터가 구현 된다면, 개리그에선 끼지도 못할  '센터백' 존테리가 20위권안에 드는 모습도 구경할 수 있다. 고로 내가 짱 좋아하는 전북 윌킨슨이 좀 더 높은 평가를 받을 수 있는 것도 가능할테고 ^^v

 

또 이걸 더 이용하면 선수들 팀별 총합 평균을 구해 어떤 팀이 얼마나 뛰어난 퍼포먼스를 가진 선수를 많이 보유하고 있는가도 나타낼 수 있고, 연차별로 팀별 통계를 구해 자기가 좋아하는 팀의 퍼포먼스가 어느해에 가장 뛰어난지를 판단할 수 있는 근거도 된다.

 

(EPL EA SPORTS PPI 말고도 많은 데이터 사이트에선 각자 만든 공식을 통해 선수들과 팀의 랭킹을 매기곤 한다.)

 

여담으로 이 데이터를 활용한게 

 

 2.png

 

http://fantasy.premierleague.com/

 

EPL 판타지 리그이다. 해당 선수의 1경기 혹은 시즌 폼 등을 고려해 선수를 스카웃 하는 게임, 무료이며 굉장히 간단한 fm이라고 보면 된다. 사실 게임은 안해봤다.

 

 

 

2.3 경기장 세부화

 

축구도 야구의 외야, 내야 혹은 1,2,3루 및 홈인 처럼 장소를 나눌 수 있다.

 

 

 4.png

 

http://www.americansocceranalysis.com/explanation/

 

 

최종공격수를 예를 들어볼때 4,5번 위치에서 골을 잘넣는 공격수와 2,3번에서 골을 잘 넣는 공격수가 있다고 해보자. 물론 어떤 선수가 더 좋다고 판단할 수 없을 것이다. 그 예로 전자에선 미친듯이 골과 도움을 기록했던 작년 전반기 포항 이명주가 있고, 후자는 전통적으로 2,3번에서 골을 차곡히 쌓은 전북 이동국과 GS 데얀이 있다. 그리고 이 세 선수가 미친듯이 활약할 때 해당 팀은 독주를 했다.

 

이러한 선수들의 성향을 위 그림에 대입해서 통계를 낸다면, 해당선수의 능력을 좀 더 확실히 판단 and 팀의 전술을 좀 더 명확히 바라볼 수 있는 근거가 된다. 그리고 이러한 시스템은 정말 괴랄한 공식을 하나 만들게 된다.

 

 

 

 

 

3. 구현화

 

지금까지 우린 여러가지 방법을 통해 해당 스텟을 뻥튀기 하거나 비교해서 평가했는데 여기서 좀 더 나아가면 이러한 형태를 복합적으로 이용할 수 있다. 그게 Location을 활용한 ExpG(기대 골)이다. 즉, 올해 전북이 몇골을 넣을 수 있을 것인가를 작년 시즌을 통해 구할 수 있다는 이야기!!!!!!!!! 그리고 그걸 좀 더 활용하면 실점도 가능하고 더 활용하면 승점, 나아가 누가 우승하는지도 판단할 수 있다.

 

 

 7.png

 

http://cartilagefreecaptain.sbnation.com/2014/2/12/5404348/english-premier-league-shot-statistics

 

복잡해 보이지만 하나로 귀결되는데 앞서 이야기한 필드를 구역별로 나눈 후에 리그 전체적으로 구역별 슈팅의 성공 or 실패, 해당 구역 내 어시스트 여부 등을 종합적으로 분류한다. 이 과정을 통해 리그 표준 공식을 만들게 되는데 (가령 y=팀별 수치*x+상수), 거기에 전북이란 팀의 수치를 입력하면 그 팀의 올해 기대되는 골을 대략적이게 나마 구할 수 있다. 더 자세하게 소개하고 싶은데 나도 잘 모르겠다. (이게 아니고 다른 사이트에서 정말 잘 정리해준(엑셀포함)게 있는데 아 못찾겠다.ㅠㅠ)

 

거기에 포지션 별로 해당 선수의 퍼포먼스를 수치화 해서 고려한다면 더더욱 신뢰성이 높은 기대골도 구할 수 있을 것이다.

 

 

 

 

 8.png

 

 

http://www.americansocceranalysis.com/home/2014/05/08/calculating-expected-goals-2-0

 

앞서 이야기한 ASA란 사이트에서는 이런 식으로 계산을 해서 엑셀로 구할 수 있게 만들기도 한다.

 

 

여기에 이용되는 공식이 굉장히 많고 이를 다루기 위한 프로그램도 필요할 뿐더러 우리가 아는 슈팅의 성공여부 못지 않게, 어시스트가 필드 아래로 깔리는지, 로빙볼인지도 구분해야하기 때문에 일반인들은 아예 시도도 못하는 공식이라 할 수 있다. 하지만 전에 설명한 피타고리안 예측(http://www.kfootball.org/best/2708665) 것처럼 단순하게 나타낸게 아니라 변수가 굉장히 많기 때문에 아직도 방법이 무공무진 하다. 실제로 검색해보면 zone의 위치가 다른 경우도 많고, 리그마다 사정이 다르니 수치가 다르게 입력될 경우도 많다.

 

 

 

 

 

 

4. 결론

 

개리그 이야긴 안하고 다른 이야긴 했지만 결국 현재 수많은 나라에서 데이터와 축구를 연결시키는 과정은 계속 진행되고 있으며 그 내용은 아직 걸음마 수준이긴 하나 과거에 비해서는 놀랄 만큼의 성장을 이루었다. 본문의 ExpG라는 공식은 별 언급되진 않으나 그외 Whos scored 나 Opta 에서 다루는 몇가지 항목 부분은 유럽 스포츠에서 주요컨텐츠로 자리잡았으며 종종 기사내 언급되기도 한다. 우리도 가끔 해축 뉴스 볼때 이게 뭔가? 싶은 분석프로그램이 있는데 이게 어느덧 기사로까지 나오는 실정이니까.(그리고 '옵타스포츠 제공'이란 말도 이젠 자주 볼 수 있다.)

 

우리도 뭘 꼭 해야할까? 이러한 입장은 아니다. 그냥 언젠가 따라붙기 위해서라도 연맹 공홈이나 좀 잘 만졌으면 할 뿐이다.

 

 

 

P.s http://statsbomb.com/

 

영문이긴 하지만, 해축 좋아하는 횽들은 가끔 번역해서 읽어볼만 해. 전문적으로 분석해줌.