본문 바로가기
diegobaseball
세이버메트릭스 도서관

WPA, 승리확율, 승리가치, 레버리지인덱스(LI) - 클러치에 관한 세이버메트릭스 WPA

by 토아일당 2015. 2. 14.


클러치(clutch) 또는 결정적 순간에 관한 세이버메트릭스
- 기대승리 Win Expectancy, 승리확율Win Probability, 레버리지인덱스 Leverage Index

혹시 기대득점RunExpectancy 개념에 익숙하지 않으시면 앞의 글을 먼저 봐주십시요. 
톰탱고의 기대득점RE과 기대승리WE 분석모델  
2편 - 승리확율과 WPA, 레버리지인덱스 

승리확율기여 WPA: Win Probability Added

톰탱고가 대표적인 세이버메트릭스 스탯 wOBA와 FIP 를 디자인한 것으로 유명하긴 하지만 그의 24 BA states에 기반한 기대득점모델의 진짜 혁명적인 의미는 다른데 있습니다.  wOBA는 물론 가장 많이 사용되는 세이버메트릭스 타격스탯 중 하나입니다.  그리고 이를 기반으로 계산하는 wRAA wRC 는 대체선수대비 승리기여도 WAR 의 원천 스탯이기도 합니다.  

하지만 wOBA 이전에도 그와 같은 목적으로 거의 유사한 정확도로 그와 같은 측정을 할 수 있는 지표는 있었습니다.  FIP의 경우도 그것이 가장 유명해지긴 했지만 2006년 톰탱고가 FIP 를 발표하기 몇해전 이미 그와 거의 유사한 DICE 라는 또다른 수비무관 ERA 같은 것이 사용되고 있었습니다.
해서 wOBA와 FIP 는 톰탱고가 가장 영향력있는 세이버메트리션 (그는 스스로를 세이버리스트라고 불러달라 하긴 합니다)인 이유일 뿐 가장 위대한 세이버메트리션이라 할 만한 이유는 못됩니다.

기대득점RE 모델의 진짜 혁명적인 가치는 그것이 기대승리Win Expectancy 또는 Win Probability 라고 불리는 전혀 새로운 방법론을 만드는 근거가 되었기 때문입니다. 

그때까지 세이버메트릭스가 집중한 것은 상황의존적인 야구의 복잡성을 제거하는 일이었습니다.  그를 위해 상황중립적인 득점생산성 RC XR, 수비를 배제한 투수스탯 DIPS 같은 것을 만들었습니다.  그런데 기대승리WE 모델은 상황의존적인 복잡성을 제거하는게 아니라 그것을 계산하고 측정할 수 있게 해줍니다.

승리확율WE 를 계산하는 방법은 기대득점RE 를 계산하는 것과 비슷합니다.  
2점 뒤진 6회말 공격 1사 주자1루 상황에서 홈팀의 승리확율은 0.158 입니다.  분석기간 중 이와 같은 상황은 2596번 있었고 그중 최종적으로 홈팀이 승리한 경우가 410번이었기 때문입니다.  

그런데 타자가 2루타를 쳐서 1루 주자가 홈에 들어와서 1점차로 추격했고 BA states는 1사 주자2루로 바뀌었습니다.  이 경우의 홈팀 승리확율은 0.305 입니다.  그렇다면 이 2루타는 팀의 기대승리 즉 승리확율을 0.147 높인 것입니다.   이런 방법으로 경기의 모든 상황을 승리확율의 플러스와 마이너스로 측정할 수 있게 됩니다.   각각의 플레이가 변화시킨 승리확율을 WPA:Win Probability Added 라고 합니다. 

경기가 시작되면 기대승리는 0.500 에서 시작하여 공격상황에 따라 오르거나 내려갑니다.  그리고 마지막 순간 승리팀의 WE 1.000 으로 경기는 끝납니다.  다음은 2013년 8월20일 트윈스-넥센 간의 경기에서 WPA 의 흐름을 그래프로 표시한 것입니다.

  승리확율 WPA로 본 게임의 재구성: 8월20일 넥센전 8회말 봉중근의 병살유도의 가치



WE모델은 그래서 “플레이의 영양가”에 대한 통계적이고 객관적인 측정을 가능하게 합니다.  예를들어 6회초 스코어 3-3 에서선두타자가 솔로홈런을 쳐서 원정팀의 1점 리드 상황이 되면 홈팀의 승리확율은 0.336 이 됩니다.  이때 타자는 +0.164 WPA를 받습니다.  (투수는 반대로 -0.164WPA를 받게 됩니다)

같은 솔로홈런이라고 해서 그것이 9회에 나오면 승리확율의 변화는 달라집니다.  9회초 동점 상황에서 무사 주자없음 조건에 원정팀이 홈런으로 1득점을 할 경우 홈팀의 승리확율은 0.500 에서 0.162 로 0.338 만큼 떨어집니다.  똑같은 무사 주자없음 상황의 1점 홈런이지만 경기상황에 따라 WPA가 크게 차이가 나는 것입니다.

톰탱고의 WE테이블 중 위에서 예시한 6회에 대한 부분은 theBook 홈페이지에서 볼 수 있습니다.  (http://www.insidethebook.com/c01.shtml)

타격이벤트의 득점 당 승리가치 WinValues

톰탱고는 theBook에서 흥미있는 통계 하나를 소개하고 있습니다.  각각의 타격이벤트의 득점가치RunValues와 승리가치WinValues 를 구해서 나눈 것입니다.  이 값은 득점의 승리가중치가 되는데 대략 10점당 1승에 해당되기 때문에 10에 가까운 11 근처가 나옵니다.  (아마 분석기간이 리그평균득점이 꽤 높았던 시기이기 때문에 10보다 큰 11 정도가 되는것 같습니다.)


그런데 유독 예외적으로 값이 큰거나 작은 항목이 있습니다.  고의사구는 Runs/Win 이 17.8 입니다. 즉 보통은 득점 1점당 0.9승 정도의 효과가 있는데 고의사구IBB는 거의 절반밖에 되지 않습니다.  고의사구는 득점가치에서 이미 다른 볼넷보다 휠씬 작은 득점가치(0.179)로 계산되었음에도 승리가치는 그보다도 더 낮다는 뜻입니다.  
이것이 의미하는 바는 고의사구는 득점이 될 가능성도 낮지만 설사 득점이 된다 하더라도 승리에 미치는 영향은 더욱 더 작다는 뜻이며 통계적으로 벤치의 고의사구선택은 승리를 위한 효과적인 전략이었다는 것이 됩니다. 

가장 극적인 Runs/Win 격차를 보이는 것은 무관심도루입니다.  44.5 로 1점당 승리효과가 다른 타격이벤트의  1/4 밖에 되지 않습니다.     

반면 도루와 희생번트는 Runs/Win의 크기가 평균보다 약간 작습니다.  득점효과에 비해 승리효과가 좀더 크다는 뜻입니다.  아마도 박빙의 상황에서 더 자주 시도되기 때문에 다득점에 불리하다 해도 승리에는 유리한 면이 있기 때문일 것입니다.

레버리지 인덱스 Leverage Index - phLI, gmLI, inLI, exLI, boLI

[1이닝부터 9이닝까지 by 득점차 by 3가지 아웃카운트 by 8가지 베이스상황] 을 조합하면 야구에서 생겨나는 모든 타석상황에 해당하는 기대승리조건을 만들 수 있습니다.  즉 어떤 상황이 다른 상황에 비해 얼마나 더 승리확율의 플러스와 마이너스를 만들게 되는지 계산할 수 있다는 것입니다.

그리고 그것이 [1이닝부터 9이닝까지 by 득점차 by 3가지 아웃카운트 by 8가지 베이스상황] 에 해당하는 [중요도] 인데 레버리지인덱스 Leverage Index 라고 부릅니다. (톰 탱고의 레버리지인덱스 LI, http://baseball-in-play.com/34)

통계적으로 MLB99_12 기간 중 한 타석의 평균적인 WE 변화값 즉 WPA는 0.0346 이라고 합니다.  따라서 각 상황에서 확율적으로 가능한 WPA 변화 가능성이 그때의 Leverage 이고 이를 평균적인 Leverage 0.0346 으로 나누면 Leverage Index 가 됩니다.  그래서 평균적인 중요도 0.0346 의 WPA 가능성을 가진 타석의 LI 는 1.0 입니다.

야구경기의 모든 상황을 타석의 24states 로 구분하는 기대득점RE 모델의 발상에서 시작한 일련의 진전은 대략 득점가치Run Values, 기대승리 Win Expectancy,  승리가치 Win Values를 거쳐 중요도기준 Leverage Index 까지 독창적이고 혁신적인 새로운 세이버메트릭스 분석 체계를 갖추게 됩니다.

이것은 두가지 의미에서 특별한 가치를 가지고 있습니다.  하나는 상황의존적인 야구이 복잡성을 24 BA states 로 구분할 수 있다는 발견입니다.  그리고 다른 하나는 스탯을 중립적인(Neutral) 것으로 다루는 다른 메트릭스와 반대편에서 스탯을 상황적으로(situational)하게 다루는 접근을 시작했다는 것입니다.

레버리지인덱스LI 는 예를들어 타자의 대타투입상황의 중요도를 측정하는데 사용됩니다.  이것을 phLI 라고 합니다.  또 구원투수가 등판한 시점의 중요도를 측정할 수 있습니다.  이것을 gmLI 라고 합니다.   구원투수에게 지워진 부담이 크기가 될 수도 있고 벤치가 그를 얼마나 신뢰하는지 알 수 있는 지표가 됩니다.  
마찬가지로 투수가 강판된 시점의 LI를 볼 수도 있는데 exLI 입니다.  

흔히 승계주자실점IRS 같은 지표가 종종 사용되는데 그것은 무사3루 상황을 넘겨받아 실점한 구원투수와 2사1루 상황을 넘여받아 실점한 구원투수에게 동등한 패널티를 주고 있다는 점에서 객관적이지 못합니다.  또 구원투수 스스로 주자를 남겨놓고 내려가는 상황을 고려하지 않는 것도 문제가 있습니다.  그보다는 등판시점과 강판시점의 LI 와 RE 를 사용하는 쪽이 휠씬 더 합리적입니다.


inLI 는 투수가 이닝을 시작할 때의 중요도인데 이때는 24 BAstates가 항상 무사주자없음 이기 때문에 영향을 주는 것은 점수차와 이닝횟수 밖에 없습니다.  즉 점수차가 적은 상황에서는 LI가 높고 반대의 상황에서는 LI가 낮습니다.  따라서 선발투수 같은 경우 득점지원환경에 대한 평가를 하는데 도움이 될 수 있습니다.
물론 타자의 타석상황에 대한 phLI 나 24states 각각에 해당하는 boLI 로 사용될 수도 있습니다.

덜 유명하기는 하지만 매우 가치있는 WPA 계열의 스탯도 있습니다.  그중 RE24 는 타자 및 투수의 누적 REA 입니다.  매 타석상황에서 RE가 커지거나 작아질 때 이를 누적시켜 구합니다.  WPA/LI는 WAR와 같은 스케일의 지표입니다.  대신 WAR가 중립(neutral) 상태로 조정된 스탯을 기반으로 계산한다면 WPA/LI 는 상황적인(situational) 스탯인 WPA:Win Probabiliy Above 를 LI 로 나누어서 중립화시킨다는 점에서 다릅니다.

객나적인 마무리 - 세이버메트릭스 on KBO

기대득점RunExpectancy 계열이나 기대승리WinExpectancy 계열의 스탯들은 play by play game log 가 있어야 사용할 수 있다는 한계가 있습니다.  박스스코어 스탯 이외에는 구하기 힘든 KBO에 대해서는 아쉬운 점입니다.  하지만 최근 몇개이 야구통계 사이트들이 생겼고 아마도 독자적으로 플레이바이플레이 로그를 축적하고 있는걸로 압니다.  그것들이 공개되면 뭔가 달리질 수 있겠죠.

다만 지금은 야구통계의 천국처럼 보이는 미국의 환경도 한때는 한국과 다를 바 없었습니다.  그것을 바꾼 것은 MLB사무국이나 ESPN 같은 메이저 미디어가 아니었습니다.  그저 소도시의 창고경비원에 불과했던 빌제임스라는 중년 사내가 그 모든 변화를 시발점이었습니다.    

빌제임스는 RC, 윈셰어 같은 세이버메트릭스 지표를 디자인하고 많은 탁월한 연구성과를 냈던 것 뿐 아니라 기록지프로젝트 Project Scoresheet 의 주창자이고 조직가이기도 했습니다.  전국의 자발적인 참여자들이 스스로 모든 MLB 경기를 나누어서 기록하기 시작했고 그것이 축적되고 전문적인 기술과 재능을 가진 사람들이 그것을 분석하고 다시 공유했습니다.  

Project Scoresheet 기록지프로젝트 by 빌제임스 http://baseball-in-play.com/33

우리가 알고 있는 2000년대 이전의 거의 모든 세이베트릭스의 성과는 대부분 Project Scoresheet 또는 그것을 이어받은 RetroSheet Project 의 바탕 위에서 태어났습니다.   한국의 야구팬들이 늘 부러워하는 UZR 같은 수비스탯도 그중 하나입니다.

세이버메트릭스는 공식을 외우고 익혀 계산하는 고등학교 수능공부와 같을 리는 없습니다. 또 어딘가에서 제공하는 (종종 정체와 정확도가 상당히 의심스럽기도 한) 스탯 순위를 기준으로 선수를 품평하며 즐기는 게 전부는 아닐 거입니다.    

그것은 야구를 좀더 알고 싶은 욕망이며 그 과정에서 선물받는 지적인 즐거움입니다.  바다 건너의 세이버메트리션들은 이미 20년 전부터 박스스코어 스탯에 관심을 두고 있지 않았고 그에 기반한 새로운 분석도 연구도 없습니다.   이미 play-by-play 게임로그를 가졌고 grid system 기반의 수비스탯도 가진 그들에게는 불필요한 일이니까요.  하지만 우리에게는 좀 다를 수 있다고 생각합니다.  

예를들어 박스코어 스탯으로 계산할 수 있는 팀 수비지표 DER 같은 것이 예가 될 수 있습니다.  레인지팩터RF는 물론 UZR와 비교도 할 수 없을만큼 부족합니다.  하지만 팀 전체의 수비수준과 팀 투수의 삼진비율을 반영하는 RRF 또는 Adjusted RF 같은 스탯은 충분히 유용합니다.

"세이버메트릭스 on KBO"가 요즘 제 슬로건인 이유입니다.