본문 바로가기
diegobaseball
KBOstats 실험

수비범위 추정지표 실험 - 정근우, 최정, 오지환은 정말 수비범위가 넓은가?

by 토아일당 2015. 7. 20.


Beck Diefenbach - Associated Press



수비지표 중에서, 레인지팩터(RF)라는게 있습니다.  빌제임스가 만들었습니다.   

9이닝 기준, 몇개의 아웃카운트를 만들어냈는지 측정합니다.  2루수가 9이닝 동안 땅볼을 4개 잡아서 1루 송구 아웃시켰고, 플라이아웃을 2개 잡아서 아웃시키면 이 선수의 레인지팩터는 6 입니다.


레인지 팩터는 다음과 같이 계산됩니다. 


RF = (PO + AO - E) / 수비이닝 * 9 

야수가 9이닝 기준 27개의 아웃카운트 중 자살(PO)와 보살(AO)을 통해 몇개의 아웃카운트를 잡아냈는지를 측정합니다.  


더 많은 타구를 처리한 야수가 더 넓은 수비범위를 가졌을 가능성이 크다는 개연성에도 불구하고, 레인지팩터는 (많은 분들이 알고 계신것처럼) 수비범위를 측정하는 지표라기보다는 결과적인 수비관여도를 측정하는 지표입니다. 


다음과 같은 제약과 한계로 인해 왜곡이 생기기 때문입니다. 


1. RF 계산기준이 되는 아웃카운트 관여기회가 모든 야수에게 동등하지 못할 수 있습니다.


2. 팀 투수의 탈삼진 능력에 영향을 받습니다.  즉 삼진으로 아웃카운트를 많이 잡는 투수가 던지면, 야수들의 RF는 낮아집니다.


3. 플라이아웃 비율이 높은 팀의 경우 야수들의 RF가 전반적으로 낮아집니다.  땅볼아웃의 경우, 송구에 관여한 야수와 포스아웃에 관여한 야수(보통 1루수)가 각각 1개씩의 합이 2개의 아웃카운트 관여 기회를 갖기 때문입니다.


4. 수비가 강한 팀의 야수들이 상대적으로 손해를 봅니다.  RF는 계산방법 상 수비가 강한 팀이나 약한 팀이나 9이닝 기준 27개의 아웃카운트에 관여기회를 갖기 때문입니다. 즉 수비대상 타구 중, 아웃시킨 타구만으로 고려하기 때문에 아웃시키지 못한 타구의 갯수가 반영되지 않습니다. 


그런데, 레인지팩터는 한때는 수비범위지표로 사용되었습니다.  그 이름에서 알 수 있듯이 애당초 수비범위를 측정하기 위해 만들어진 지표이기도 합니다. 


위와 같은 제약와 한계에도 불구하고 RF 가 수비범위측정 지표로 사용되었던 것은 그보다 나은 다른 지표가 없었기 때문입니다.  하지만 타구위치측정 기반의 UZR 등이 90년대 이후 나오면서 RF는 더이상 수비범위지표로 사용될 필요가 없어졌습니다.  그보다 나은 것이 이젠 있기 때문입니다.


그렇게 본다면 한국에서의 야구통계는 역설적으로, 여전히 레인지팩터를 참고할 필요가 있다고 생각합니다. 물론 제약과 한계가 많으며 부정확하지만, 다른 대안이 없는 동안에는 말입니다.  


“레인지팩터는 수비범위에 대해 부정확해. 그렇기 때문에 믿을수 없어.” 라고 말하는 것은 틀리지 않습니다.  하지만 그러고 난 후 그저 “한국은 문제야. UZR 같은게 나와야 하는데, KBO 나빠” 라고 불평만 해야한다면 썩 유쾌한 일이 아닙니다. 


UZR을 만든 건 STATs, Inc. 라는 회사인데, 이들의 전신이 빌제임스가 주도하여 팬들이 직접 MLB경기의 플레이바이플레이 데이터를 기록하고 공유하던 [프로젝트 스코어시트] 입니다.  그 시절 미국도 같았고 (아니 지금의 한국보다도 오히려 휠씬 열악했죠)  대신 몇몇 세이버메트리션들과 일부 팬들의 자발적인 조직화를 통해 거의 대부분을 만들어냈습니다.


물론, 지금 한국에서 그런 일을 해낼 것이라 기대하긴 어렵지만, 그래도 할 수 있는 범위에서 야구와 야구통계 안으로 좀더 들어가려로는 시도는 가치있는 일이라고 생각합니다.


가칭 수비범위추정지표 RRF (Revised RF)는 그런 생각을 하며 해보는 작업입니다.


다음 몇 가지 방법을 통해 레인지팩터의 제약과 한계를 완화시키려 합니다.  (물론 이건 저의 독창적인 생각이라기 보다는 미국에서도 UZR 이전에 RF를 사용하면서 그들이 했던 것과 비슷합니다)


1. 투수의 탈삼진 능력 등으로 애당초 야수의 수비기회가 불균등한 부분을 조정합니다.  


수비기회가 많았던 팀의 야수는 낮아지고 수비기회가 적었던 팀의 야수는 높아집니다.  조정계수 Adj.FT  =  리그평균 이닝당  PO+AO / 팀 이닝당 PO+AO 로 구합니다.  이렇게 하면 팀 투수들의 탈삼진 성향으로 인한 왜곡은 보완할 수 있습니다. 


2. 팀 수비력 요인을 포함시킵니다.  


팀수비효율성 DER에 기반해서, 인플레이타구 중 아웃을 더 많이 잡은 팀의 야수는 높아지고 반대는 낮아집니다.  Adj.DER = 팀DER / 리그평균DER   이렇게 할 경우, 잡아낸 타구만 고려하고 놓친 타구는 고려하지 않는 레인지팩터의 단점은 어느정도 보완될 수 있습니다.


3. 내야수의 경우, 보완적으로 RRF_G라는 지표를 참고합니다.  


이것은 보살플레이에 대한 것만으로 구한 레인지팩터입니다.  말하자면 “땅볼수비범위추정” 지표 쯤 되겠습니다. 


4. 실책에 의한 효과를 반영한 RRF_E 를 함께 참고합니다.  


수비범위라는 면에서는 실책을 제외하는게 맞을 수도 있지만 수비기여도라는 측면에서는 포함시키는게 맞습니다.  실책은 그것의 그것의 런밸류가 아웃밸류의 1.7배이기 때문에 1.7 가중치를 적용해서 PO+AO 값에서 빼주는 방식입니다. 


위 방법을 통해 완전하지는 않지만, 레인지팩터의 중요한 문제점을 많이 완화시킬 수 있습니다.  논리적으로, 아웃카운트 관여도가 수비범위와 일치할수는 없지만, 꾸준히 높은 아웃카운트 관여도를 보이는 야수가 있다면 수비범위가 넓을 개연성을 가지고 있을 수 있습니다. 


결과적으로 수비범위추정지표 다음과 같이 계산됩니다.

RRF = RF * Adj.DER * Adj.FT


다음은 그 결과입니다.  

결과를 미리 스포일링하자면, 2루수는 정근우 정근우 정근우이고 3루수는 최정 최정 최정이며 유격수는 오지환 오지환 오지환입니다.  


아웃카운트 관여횟수와 수비범위 사이의 개연적인 연관성 뿐 아니라, 같은 선수의 year-by-year co-relation이 매우 높다는 점 역시 이런 저런 교란요인에도 불구하고 RRF가 꽤 믿을만한 지표일 가능성을 말해줍니다.  게다가 정근우의 경우 13시즌부터 팀을 옮기며 전혀 다른 투수, 전혀 다른 구장, 전혀 다른 팀동료와 함께 플레이했음에도 불구하고 RRF는 거이 일정하게 유지되고 있습니다. 


동시에, RRF의 어떤 부분을 개선해야 하는지에 대한 힌트도 포함되어 있습니다.   


대상은 팀수비이닝 50% 이상을 소화한 야수 대상입니다. 






주요 3개 포지션의 내야수 RRF 및 RRF_G RRF_E를 검토할 경우 몇가지 특이사항이 있습니다.


삼성의 내야수들이 RRF 에 비해 RRF_G 가 상대적으로 높습니다.  이 부분이 아주 중요한데, RF를 보완한 RRF라고 하더라도 팀 투수가 허용하는 타구의 종류(땅볼, 내플, 외플)가 RRF에 비치는 영향을 완전히 제거하기는 힘들기 때문입니다.  


RF에 비해 RRF는 휠씬 더 나은 정확도를 가졌다고 볼 수 있지만 팀 특성에 따라 외야수와 내야수 사이의 불균형이 그래도 남아있는 사각지대일 가능성이 큽니다.  실제로 삼성 야수들의 경우, 내야수는 상대적으로 RRF가 낮고 외야수는 RRF가 공통적으로 높습니다.   


차이는 투수의 성향도 있겠지만, 팀 수비포메이션의 차이 때문일 수 있습니다.  짧은 외야플라이가 떴을 때 내야수가 잡느냐 외야수의 잡느냐에 따라 포스아웃 갯수가 어느 한쪽에 기록되기 때문입니다.  상대적으로 작은 구장의 경우 외야수 수비위치가 얕고 내외야 중간 플라이볼을 외야수가 처리하는 비중이 커질 수 있습니다.  


몇 가지 보완방법을 궁리중입니다.  raw-data 정리가 아직 좀 덜되어 있긴 하지만, 완료된 후에라면 리그 전체의 외야수, 내야수 아웃카운트 관여횟수 등을 통해 한번 더 조정을 해준다면 어느정도 해결되지 않을까 기대하고 있습니다.


100% 정확하지 않더라도 개연적인 연관성, 통계적인 연관성이 있다면 설명지표로 참조할만큼은 된다고 생각합니다.  맹신하고 고집하지만 않으면 말이죠.   완전하지 않은 지표를 맹신하는 것이 잘못된 것만큼, 100%가 아니라는 이유로 완전히 무시하는 것도 썩 현명한 생각은 아니지 않을까요?  가진 것만큼을 활용해서 알수 있는 것만큼 알아내자 정도라 생각하고 있습니다.  


다만, 중간에 말했듯이, 외야수와 내야수 사이의 쏠림은 아직 왜곡이 있어보입니다.  대신 RRF_G를 함께 참고하는 것으로 어느정도보완할 수는 있을겁니다.  일반적으로 수비를 잘한다는 선수 중 RRF에서 낮은 경우 RRF_G는 높게 나타납니다.  이게 수비성향의 차이일 수도 있겠구요.  주로 뜬공에 대해서. 


저는 숫자로 선수들을 줄세우는것만이 세이버메트릭스라고 생각하지 않습니다.  그건, 야구에 대해 더 알고 싶은 사람들이 뭔가를 해보는 시도와 도전입니다.  그게 굉장한 것이 아니라도 궁금한 것을 직접 찾아내려는 것은 가치있는 일이라고 생각합니다.  (그리고 나름 재미도 있습니다.)   여러가지 의견 부탁드립니다. 




혹시 모를 오해를 피하기위해 나중에 붙입니다.  표의 rrf는 반드시 rrf_G와 함께 참고될 필요가 있습니다. 

rrf는 특정 팀의 수비구성에 따라 그 팀의 내야수와 외야수 어느 한쪽이 과소평가, 괴대평가되는 난점을 아직 제거하지 못한 수준입니다. 


rrf_G는 (대체로) 땅볼타구에 대한 처리를 중심으로 한 지표입니다.   따라서 외야수 내야수 사이의 쏠림은 거의 없을 것이고 있다면 타구방향에 따라 오른쪽 방향과 왼쪽 방향 사이의 쏠림 여지가 남을겁니다. 


RF에 대해 많이 논란된 부분 역시, 팀 투수의 오른쪽 왼쪽 쏠림에 의해 타구방향이 한쪽으로 쏠리는 부분입니다. 투수 타잎에 따른 등판이닝으로 이를 조정하는 것도 과제 중 하나입니다. 




UZR은 현재까지도 MLB 야구통계에서 야수의 수비능력을 평가하는데 가장 많이 사용됩니다.  그런데 UZR을 만든 STATs, Inc. 라는 회사는 [프로젝트 스코어시트]를 그 뿌리고 가지고 있습니다.  지금은 야구통계의 천국처럼 보이는 미국도, 예전에는 지금의 한국과도 비교가 안될 만큼 열악했습니다.


MLB 경기기록의 공개를 거부한 MLB사무국와 기록관리업체 앨리어스 스포츠의 정책에 반발한 빌제임스는 스스로 팬들을 조직해서 스코어시트 프로젝트를 발족시킵니다.  이는 팬들이 스스로 MLB의 모든 경기를 기록하고 정리해서 공유하는 운동이고 조직이었습니다.  


빌제임스는 1983년 프로젝트 스코어시트를 제안한 글에서 이렇게 썼습니다. (이에 대해 전에 한번 소개한 적 있습니다.   Introducing Project ScoreSheet by Bill James  http://baseball-in-play.com/33)


혹시 야구기록을 해본적이 있습니까?  만약 그렇다면 친구여, 기록지 프로젝트는 당신이 필요합니다.  


저는 이렇게 보고 있습니다:  모든 메이저리그 경기에 대해 열댓명 정도의 사람들이 그것을 기록합니다.  메이저리그 팀이 있는 도시의 누군가는 매 경기를 다 기록할 수도 있습니다.  그런 사람들을 모으고 그 기록지들을 모으는 것은 그저 소소한 조직화의 문제, 단순한 네트워킹의 문제에 불과할 수도 있습니다.  


그러나 그런 문제들에 직면하고 그 문제를 해결하면서 우리는 백여명의 세이버매트리션과 분석가들이 해낸 어떤 것보다 더 위대한 진보를 만들어내게 될것입니다.   풀뿌리(quantum leaf) 그러니까 세이버매트릭스의 위대한 풀뿌리 말입니다.  


그리고 시간이 좀 흘렀을 때, 그 모든 것이 실제로 이루어졌습니다.  어쩌면 꿈꾸었던 것 이상을 이루었다 해도 좋겠습니다.   


[프로젝트 스코어시트]는 세이버메트릭스의 "위대한 풀뿌리"가 되었고 80년대와 90년대의 거의 모든 가치있는 성과는 바로 그 풀뿌리 위에서 자라났습니다.    


프로젝트 스코어시트가 해체된 후 그 역할은 RetroSheet 로 이어졌고, 주요 멤버들 중 일부가 STATs, Inc.를 설립해서 다른 방법으로 야구통계에 대한 열정을 이어갔는데 그들이 만들어낸 것 중 하나가 UZR입니다.  


STATs, Inc.는 프로젝트 스코어시트와 달리 영리기업이긴 하지만 어쨌든 이런 모든 진보를 주도했던 것이 엄청난 돈와 자원을 가진 메이저리그 구단과 리그 사무국이 아니라 자발적인 열정과 재능으로 무장한 그 바깥의 아웃사이더들이었다는 점은 의미심장합니다.






UZR에 대해서 몇가지 의견을 붙입니다.  팬그래프 등에 의해 강력하게 지지받고 있으며 WAR 계산의 기준이 되는 수비지표 UZR 경우도 몇가지 논란거리가 있는데, year by year corelation 이 너무 낮다는 것입니다.  


그에 대한 논쟁이 좀 있었던 2008-9년 즈음에, 이를 분석했던 케이스를 봤는데, RF가 0.9+ 의 correlation을 보이며 아주 강한 prediction value를 가진것에 비해 uzr은 기껏 0.3 이하의 correlation에 그쳤는데, 이는,  상황과 우연에 좌우되기 때문에 안정성이 많이 떨어진다고 하는 WPA보다도 낮은 수치입니다.   당연히 BABIP의 교란을 받는 타율보다도 낮은 수준이죠. 


다른 시즌의 데이터를 다 찾아볼 수는 없었지만 UZR의 낮은 yby correlation 이 자주 논란이 되는걸보면 대체로 낮았던 것 같습니다.  수비기회 200회 이상인 경우로 한정했을 때, r^2 가 0.3 정도까지 올라가는게 최대치라는 분석도 한번 본 적 있습니다.    


야구통계에서, 선수의 능력을 설명하는 지표의 테스트에서 yby corr.은 아주 중요한 문제입니다.  투수의 ERA에 비해 FIP가 더 정확하게 평가받는 중요한 근거 역시 yby 의 안정성문제입니다.


이런 맥락을 본면, uzr은 수비수의 능력을 설명하는 지표라기보다는, 결과적인 수비기여도에 가까운 지표라고 볼 수도 있습니다.  WAR와 WPA 를 비교했을 때, WAR가 능력에 좀더 가깝고, WPA가 결과적인 기여도에 가깝다고 보게 되는 비교와 완전히 일치하는 구도입니다.


반면 앞서도 말했지만 RF 의 yby corr.은 수비든 타격이든, 피칭이든 거의 모든 분야의 세이버메트릭스 지표와 비교해도 유별날 정도로 높습니다.  


물론 저는 rf가 uzr 보다 더 나은 지표라고 생각하지 않습니다.  관점이 애당초 다르고, rf 가 미루어 짐작하는 지표인 것에 비해 어쨌든 uzr 은 직접 측정하는 지표니까요.  투수의구속이 탈삼진과 상관관계가 있다해도, 스피드건으로 매번 측정하는 구속 데이터를 두고 결과적인 통게인 탈삼진율을 더 믿을 이유는 없으니까요. 


다만, 우리는 우리가 알고 있는것, 아니 좀더 정확하고 안다고 믿는 것들에 대해 늘 조심하는 것이 옳다 느낍니다.

MLB에서 쓰더라는 권위 말고 (저 조차도) uzr에 대해 알고 있는 것은 별로 없습니다.  게다가 우리에게는 uzr이 없습니다.  uzr이 없었을때는, 미국의 세이버메트리션들 역시 rf를 붙잡고 그걸 통해 야수들이 수비능력을 측정하려 노력했고 그로 인해 많은 성과가 있었습니다.


최근에 적용되고 있는 pitch fx 나 statcast 가 더 많이 발전한다면 지금 우리가 최선의 정확성과 객관성을 가졌다고 믿고 있는 wOBA나 FIP 같은 것들이 쓸모없어질 수도 있습니다.  그런데 그것들이 쓸모없어지는 이유는, 그것이 애당초 쓸모가 없었기 때문이 아니라 더 나은 것이 생겼기 때문일겁니다.  RF가 한때 그랬던 것처럼. 


십수년 정도가 지나고나서 누군가는 FIP는 믿을게 못되, wOBA는 쓸모가 없어. 라고 말할 수 있고 그들에게는 그 말이 옳을 겁니다.  그보다 더 나은 것을 그들이 가지고 있다면.  하지만 지금 시대를 사는 우리에게도 옳지는 않을겁니다.  우리에겐 더 나은 것이 없으니까요.   rf 에대한 우리의 과소평가는 좀 상대적인게 아닐까요?  


게다가 한 선수가 매시즌 꾸준한 수치를 찍고 있는 rf 가 그보다 휠씬 들쭉날쭉하기 때문에, "WAR와 같은 능력에 대한 지표"라기보다는 "WPA 같은 결과에 대한 지표"처럼 움직이는 uzr이 일방적으로 모든 면에서 rf 보다 낫다고 단정할 수는 없다고 생각합니다.


나름나름 쓸모가 있으며, 그 쓸모를 필요한 동안은 써먹을 만큼 써먹어보자는 접근은 충분히 가치가 있고, rf가 그정도의 [설명력] 은 그래도 가진 지표라고 생각하고 있습니다.