<colbgcolor=#ffd700> 야구의 기록 | ||
{{{#!wiki style="margin: 0 -10px -5px; min-height: 26px; word-break: keep-all" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin: -6px -1px -11px" | 투수의 기록 | 구종 가치 · 규정이닝 · 평균자책점 · 승리 투수 · 패전 투수 · 승률 · 탈삼진 · 완투 · 완봉 · 세이브 · 블론세이브 · 홀드 · WHIP · 퀄리티 스타트 · K/BB · DIPS(FIP) · pFIP · RA9 · ERA+ · kwERA · SIERA · 게임 스코어 |
타자의 기록 | 규정타석 · 타석 · 타수 · 타율 · 출루율 · 장타율 · OPS · OPS+ · 안타 · 장타(2루타 · 3루타 · 홈런) · 루타 · 타점 · 득점 · 도루 · 도루실패 · 사사구(볼넷 · 사구) · 삼진 · 병살타 · 삼중살 · 희생(희생번트 · 희생플라이) · BB/K · RC(RC27) · RE24 · IsoD(순출루율) · IsoP(순장타율) · XR · wOBA · wRAA · Offense · wRC+ · GPA · EqA · UEQR · DRS · UZR | |
투·타 공통 | 실책 · WAR · WPA · cWPA · BABIP · VORP · 컴투스 프로야구 포인트 · 웰컴톱랭킹 | |
관련 문서 | 세이버메트릭스 · 투승타타 · 윤석민상(김혁민상) | |
관련 사이트 | 스탯티즈 · KBReport · 베이스볼 레퍼런스 · 팬그래프 닷컴 |
1. 개요
세이버메트릭스(sabermetrics[1])는 야구에 사회과학의 게임 이론과 통계학적 방법론을 적극 도입하여 기존 야구 기록의 부실한 부분을 보완하고, 선수의 가치를 비롯한 '야구의 본질'에 대해 좀더 학문적이고 깊이있는 접근을 시도하는 것을 가리킨다. 기존의 관습적 선수 평가론을 부정하고, 야구선수에 대해 좀 더 과학적, 계량적인 평가를 하기 위해 창안된 이론이다.어원은 SABR(The Society for American Baseball Research. 미국야구연구협회) + metrics/metrician. 초기에 SABR(세이버라고 부른다.)라는 모임을 중심으로 형성되었기에 이런 이름으로 부른다. 이름에서 알 수 있듯이 세이버메트리션들은 여러 가지 수리적 방법론을 동원해 야구라는 스포츠를 '분자 단위로 분해'하는 것을 일삼는 사람들이다.[2]
2. 역사
2.1. 최초
일반적으로 빌 제임스의 Baseball Abstract 시리즈를 세이버메트릭스의 시초로 취급하지만, 실제 시초는 1916년 F.C 레인이 '5센트, 10센트, 25센트, 50센트를 같은 선상에 두고 비교하는 것이 과연 옳을까?'라는 의문을 시작으로 62경기의 실황 중계를 바탕으로 단타는 0.457점, 2루타는 0.786점, 3루타는 1.15점, 홈런은 1.55점의 가치를 가진다는 것을 밝혀냈다는 것을 야구 통계학 즉, 세이버메트릭스의 시초로 둔다. 라이브볼 시대도 아닌 데드볼 시대에 타율은 가치없는 지표이며 출루와 장타(=OPS)가 중요하다는 매우 앞선 생각을 가진 사람이었다.그래서 미국야구연구협회는 2012년 레인에게 '헨리 채드윅상(Henry Chadwick Award)'을 수여하기도 했다. 오늘날 통용되는 야구의 기록 계산법을 창안한 헨리 채드윅을 기념하여, 야구 연구에 기여한 인물을 대상으로 수여되는 상이다. 2009년에 제정되었다. 물론 F.C레인은 진작에 1984년 100세의 일기로 생을 마감했고 사후에 이뤄진 일종의 명예수상이다.
2.2. 1944년 브루클린 다저스에서 정식 시도
1944년 브루클린 다저스에서 그 당시 단장이였던 브랜치 리키는 야구 역사상 최초로 통계학자인 앨런 로스를 고용해 첫 흑인 선수인 재키 로빈슨을 중심타선에 세우도록 만들었다. 심지어 재키 로빈슨이 뛰는 것에 대해 극심한 반대를 한 그 당시 다저스 최고의 선수인 딕시 워커를 트레이드하기까지 했다.2.3. 1950년 야구분석학이 각광받다
세이버메트릭스의 기반이 되는 야구분석학이 1950년대 초부터 각광받기 시작했다. 1954년 <LIFE> 잡지에 위에서 말한 다저스 단장인 브랜치 리키는 로스의 이론에 따른 현대 세이버메트릭스의 기초가 되는 출루율과 장타율 개념을 10페이지가 넘는 장문의 글로 게시했다. 그리고 조지 린지가 F.C 레인의 이론을 약간 수정한 '득점 기대치' 이론이[3] 나오면서 본격적으로 세이버메트릭스가 시작되었다 볼 수 있다. 언쇼 쿡은 <확률야구>라는 논문에서 야구 작전과 선수 평가에 확률론을 처음으로 접목시켰으며 세이버메트릭스의 기본이 되는 플레이 인덱스를 만들었다. 그의 논문을 본 저명한 작가 프랭크 디포드가 스포츠 일러스트레이트에서 '지금까지의 야구는 틀렸다'라고 할 만큼 큰 파장을 불러일으켰다. 그리고 볼티모어 오리올스에 1969년 얼 위버가 감독으로 취임하면서 통계에 비중을 많이 두었는데 이 시기 오리올스가 통계를 바탕으로 AL 동부를 완전히 독식하면서 다른 팀들도 야구 통계학에 관심을 가지기 시작했다. 그러다 1970년대 들어 빌 제임스를 비롯한 일군 선구자들이 나타나 수학적, 통계학적 방법론을 도입한 새로운 기록 및 통계를 제시하게 되었고, 당시 금융업과 결합하여 급격히 성장하고 있던 미국 통계학계의 야구팬들이 이에 열광하면서 이러한 새로운 통계적 접근이 더욱 발전하게 된다.이들이 도입한 개념 중 비교적 직관적인 OPS, WHIP와 같은 초보적인 스탯 개념들[4]은 이제 KBO 리그 중계에서도 흔히 들을 수 있을 정도로 일반화되었다. 하지만 아직 해외에 비해 많이 뒤처져 있는데 해외 세이버메트릭스에서도 유명무실한 타율이나 평균자책점, WHIP나 가지고 판단하는 것을 보면, 더 많은 기록 일지를 보급하여야 하지만, 스탯티즈 사태 이후 사장됐다.
이들의 통계학적 접근방식은, 과거에는 매우 풍부한 경험을 지닌 현장 야구인 일부만이 어렴풋이 이해하고 있던 야구의 그윽한 경지를 수치화하여 일반인들도 쉽게 접해 이해할 수 있도록 만들었다는데 가장 큰 의의가 있다. 선수도, 코치도, 기자도 아닌, 그야말로 '단지 야구와 수학이 좋았을 뿐'인 일반인들의 연구가 실제 야구판에 영향을 미쳤다는 점도 높이 평가할만 하다.
2.4. 머니볼 유행으로 대중에게 널리 알려지다
머니볼의 유행으로 오클랜드 어슬레틱스와 빌리 빈 스타일을 전형적인 세이버메트리션으로 오해하는 경우가 있는데, 이들은 단지 '일정선 이하의 금액을 어떻게 효과적으로 투자할지'를 결정하기 위해 세이버메트릭스를 응용했을 뿐, 이들의 소위 머니볼 스타일이 세이버메트릭스의 전부는 아니다. 더불어 빌리 빈의 오른팔이자 전형적인 세이버메트리션인 폴 디포데스타[5]가 LA 다저스 단장 노릇을 하면서 구단을 말아먹은 뒤로는, 일선에서는 세이버메트릭스와 전통적인 스카우트 기법을 적절히 섞어 합리적인 운영을 하는 쪽으로 진화하고 있다. 물론 이 빌리 빈 스타일을 통해 스몰마켓의 운영 해법을 찾았다는 점은 의미가 있다.2.5. 2000년 이후의 흐름
지금의 세이버메트리션들은, 모든 플레이 하나하나의 상황을 최대한 객관적이고도 정확히 남겨 세밀한 분석이 가능하도록 하는 데 집중하고 있다. 이에 따라서 필연적으로 세이버메트릭스의 학문화와 전문화가 진행되었는데, 그 부작용으로 야구에 어지간히 관심이 많은 팬들도 이해하지 못하는 어려운 개념과 수학적/통계학적 모델링이 동원되고 있다. 어지간한 계량경제학이나 게임이론 수준까지 도달했다. 일부 수학자들은 이를 논문의 형태로 학계에 발표하기도 했다. 그러다 보니 세이버메트릭스를 접할 수 있는 기회가 늘어난 것에 비해, 일반 야구팬들이 마주하는 심리적인 장벽은 높아졌다고 할 수 있다.그러나 일반적으로 올드 스쿨, 즉 애매하고 중의적인 흐름을 중요시하는 야구 해설식 분석[6]보다는 세이버메트릭스의 과학적인 접근이 훨씬 더 야구 세계의 진리에 가까워진 경우가 많다. 흔히 통계의 허상을 들이대며 세이버메트릭스를 비판하는 사람들이 있는데, '세이버메트릭스=통계'도 아닐 뿐더러[7] 그런 식으로 통계를 까는 사람들이 가장 허술한 통계인 타율을 신뢰하는 경우가 많다는 점에서 적합하지 못하다. 그리고 사실 세이버메트릭스를 신뢰하지 않는 사람들 중에는 단지 귀찮아서 세이버메트릭스의 주장을 받아들이지 않는 경우가 상당히 있다. WHIP이나 OPS 등의 단순한 스탯이 성공한 것을 고려하면 더더욱 가능성은 높다.
그리고 빌 제임스와 보로스 매크래컨 등 세이버메트리션들을 대거 기용하고 테오 엡스타인이라는 젊은 단장을 기용한 보스턴 레드삭스가 2000년대 중후반 두 차례 우승을 거머쥐면서 세이버메트릭스의 위상은 추락하기는 커녕 오히려 점점 높아지고 있다. 세이버메트릭스의 성공이라고 하면 일반적으로 오클랜드만 떠올리는데, 오클랜드보다도 많은 영향을 받고 그 이상의 성공을 본 게 보스턴이다. 세이버메트릭스에 호의적이던 존 헨리[8] 구단주가 취임하면서 빌 제임스를 구단으로 끌어 들였고, 빌리 빈을 거액을 들여 단장직 영입을 시도했으며, 이를 실패하자 엡스타인을 단장으로 임명했다. 출루율의 가격이 오르자 수비를 강화하는 현재의 모습 등은 돈에 좀 더 여유가 있는 오클랜드의 그것과 유사한 상황. 헨리 구단주 이전 보스턴이 마초의 팀에 가까웠던 것을 고려하면 밤비노의 저주를 깬 것도 커트 실링과 데이비드 오티즈가 아니라 세이버메트릭스라고 봐도 좋을 정도였다.
다만 타격은 OPS, wOBA 같은 간단한 편에 속하면서도 신뢰성이 있는 데이터를 만들었지만, 피칭에 대해서는 DIPS, FIP 등이 많이 누적되었다고 해도 타격에 비하면 부족하며,[9] 특히나 수비에 관한 간단한 데이터는 만드는데 애를 먹고 있다. 기본적으로 수비에 대한 데이터 산출부터 문제인데다, 일반적으로 알려진 수비율도 공을 전혀 건드리지 않으면 그만이고,[10] 빌 제임스가 개발한 레인지 팩터같은 데이터들도 다 장단점이 극명해 변수가 잦은 수비를 비교해 주긴 무리가 따른다. 다만 팀 수비의 경우 DER(수비효율)을 통해 어느 정도 측정이 가능하다. 그런데 이 DER 역시 여러가지 계산법이 있어서 그 방법에 따라 결과가 제각각인 경우가 있다. 깊이 들어가면 ZR, UZR, +/-와 같은 지표가 있지만 이 쪽은 애호가가 아닌 일반 야구팬이 직관적으로 접근하기는 어려운 편이다. 게다가 일정 수준이 넘어가면 대개의 사이트들은 돈 내고 보라는 식으로 진입장벽을 만들어놓기 때문에 일반 팬들과의 단절감은 심화된다. 또한 10년대 세이버메트릭스와 머니볼의 신봉으로 젊고 어린 감독이 대거 진입했는데 문제는 훈련 등에 있어서 선수단을 휘어잡는 리더십과 카리스마가 부족해 올드스쿨 감독이 점차 늘어나기도 했다. 이는 단순히 선수들이 세이버매트릭스를 불신한다기보다, 야구의 감독은 타종목에 비해 head coach보다 manager에 가깝기 때문에 경기 중 직접적인 관여보다 선수단을 관리하는 부분이 더 크기 때문이다.
3. 영향
- 이들의 기여로 인해 바뀐 대표적인 관행이 바로 선수들의 연봉 협상. 이전에는 주먹구구식으로 구단이 책정한 고과가 협상의 기본 자료였다면, 지금의 연봉 협상은 서로가 객관적인 통계수치를 들이대는 법정 싸움 비슷한 것으로 바뀌었다. 연봉조정 등의 여러 절차나 MLB 사무국에 구단의 횡포를 제소하는 행동을 보면 정말로 법정 싸움과 같은 모습이 되고 있다. MLB에서 활동하는 에이전트들은 대개가 로스쿨을 나와서 변호사 자격증을 갖고 있다. 대표적으로 스캇 보라스.
- 선수 평가에 관한 팬문화 역시도 엄청나게 바꿔놓았고, 다른 단체구기종목과는 구분되는 야구팬 특유의 선수 평가 문화를 만들었다. 당장 나무위키 메호대전 문서만 들어가봐도, 두 레전드 선수를 비교하는 방법이라는 게 고작해야 수상 경력, 팀 우승 횟수, 전문가 어록 채굴이 전부인데, 세이버메트릭스 보급 전의 야구 팬 문화가 정확히 이러했다.[11][12] 사실 축구 전문가들끼리는 야구의 세이버매트릭스 정도는 아니어도 어록 비교보다는 훨씬 더 수준높은 분석을 할 수 있지만, 그것을 제대로 킥을 할 줄도 모르는 축알못이 대부분인 팬들에게 설득력 있게 전달하기가 어렵다.[13]
즉 "투수는 선동열, 타자는 이승엽, 야구는 이종범", "박경완은 팀 전력의 절반" 같은 어록들을 최대한 많이 채굴한 다음, "이 선수는 저 선수보다 더 많은 전문가 칭찬을 받았으니 이 선수가 더 위대하다"라고 말하는 게 고작이였던 것이다.[14] 그러나 세이버메트릭스의 보급 후 야구팬들은 개인들의 주관적 어록을 채굴하는 대신, wRC+, UZR, ERA+, FIP+, WAR 같은 입증 가능한 데이터들을 근거로 선수들을 평가하게 되었다.[15] 다른 스포츠는 우승 기록과 사람들에게 주는 인상의 영향이 선수의 평가에 큰 영향을 준다는 것을 생각하면 야구의 분석이 확실히 활성화된 것이 사실이다.[16]
4. 통계적 방법에 대한 비판과 반론
The system of keeping batting averages needs a complete overhauling. At present this system merely gives the comparative number of times a player makes a hit without paying any attention to the importance of that hit. Home runs and scratch singles are all bulged together on the same footing, when everybody knows that one is vastly more important than the other. The result is that the records are grossly misleading.
타율을 중요시하는 관점은 완전히 손 볼 필요가 있다. 현재의 시스템은 단지 타자가 안타를 만들어내는 상대적인 빈도만 제공해줄 뿐, 그 안타의 의미와 가치에는 전혀 관심을 기울이지 않는다. 홈런 하나와 행운의 안타 하나는 똑같이 값이 매겨져있지만, 누구나 홈런이 행운의 안타보다 훨씬 더 중요하다는 사실을 알고 있다. 결과적으로 그 스탯은 사람들을 매우 오해하게 만드는 셈이다.
ㅡ F.C. 레인(Ferdinand Cole Lane). 1915년. 원문, 번역본
타율을 중요시하는 관점은 완전히 손 볼 필요가 있다. 현재의 시스템은 단지 타자가 안타를 만들어내는 상대적인 빈도만 제공해줄 뿐, 그 안타의 의미와 가치에는 전혀 관심을 기울이지 않는다. 홈런 하나와 행운의 안타 하나는 똑같이 값이 매겨져있지만, 누구나 홈런이 행운의 안타보다 훨씬 더 중요하다는 사실을 알고 있다. 결과적으로 그 스탯은 사람들을 매우 오해하게 만드는 셈이다.
ㅡ F.C. 레인(Ferdinand Cole Lane). 1915년. 원문, 번역본
위에서 언급했듯 세이버메트릭스를 야구 경기보다 통계, 숫자에 집착한다며 비판하는 경우가 많다. 그러나 세이버메트릭스의 핵심은 어떠한 스탯이 선수의 실질적 가치에 가까운 스탯인가를 찾는 것이다. 다시 말해 상대적으로 부정확한 스탯인 타율/다승이 아닌 wOBA/WAR를 보는 게 더 좋다는 것이지, 야구를 보지 말고 스탯만 뒤지자는 것이 아니다. 또한 세이버메트릭션들이 통계를 이용한 숫자놀음을 많이 하는 것도 어디까지나 그 선수의 객관적인 평가를 위한 것일 뿐이다.
물론 선수의 플레이 그 자체, 동료간 팀케미스트리, 워크에식과 그날그날의 컨디션, 통계를 종합라여 평가하는 것이 가장 이상적인 건 자명하다. 하지만 그런 종합적 평가의 경지에 도달한 사람은 경험 많은 야구인 중에서도 역대급으로 꼽히는 소수의 몇명 뿐이다. 더군다나 일반 야구팬과 기자들이 볼 수 있는 건 고작해야 경기장에서 공개되는 선수의 지극히 일부 측면과 자극적인 몇몇 일화들일 뿐, 워크에식 같은 건 당연히 못 본다. 따라서 차선책으로, 공개된 데이터의 통계적 분석을 추구할 수밖에 없는 것이다.
오히려 통계의 허점에 대해서는 세이버메트리션 쪽에서 더 많이 언급하고 있다. 세이버메트릭스에 대한 비판 가운데 많은 수를 차지하는 것이 세이버 스탯에 대한 충분한 이해가 없이 그저 본인의 상식과 다르다는 것을 근거로 이루어지는 형태인데, 세이버메트릭스에서 주로 사용하는 스탯들과 그 스탯을 만들어낸 원리와 공식도 제대로 알아보지도 않고 까는것은 비판이 아닌 비난일 뿐이다. 정작 선수들과 선출 야구인들은 세이버메트릭스를 아는 경우 자체가 적은데다 설명을 들어도 '뭐 그딴 쓸데없는...'이라는 반응을 보인다. 무엇보다 유명한 세이버메트리션 대부분이 비선출이다. 인생을 야구에 바친 야구 전문인들 입장에선 자기들 가지고 수치놀음하는 이상한 사람들로 보일 뿐이다.
일반적인 야구팬들 사이에서 언급되는 대표적인 오해의 예로 '타선은 OPS 순으로 나열해야 한다' 같은 것이 있는데, 그 내용 자체도 세이버메트리션 쪽의 의견과는 다르다. <The Book>에서 타석에 서는 횟수와 타석에 섰을 때의 상황을 종합해서 낸 결론에 따르면 1번과 2번, 4번이 가장 중요하며 3번과 5번이 그 뒤를 잇는다. 전체적인 타격 능력이 비슷한 경우 출루에 강점을 가진 선수일수록 앞쪽에 놓으면 좋다. 6~9번은 잘 치는 선수일수록 앞에 두면 된다. 애초에 세이버메트릭스에서는 타순을 중요하게 다루지도 않는데, 연구 결과 효율적인 타선 배치로 인한 이득이 일반적인 통념보다 훨씬 낮게 나타나기 때문이다. 가장 효율적인 타선 조정으로 얻는 점수는 시즌을 통틀어도 5점 미만이다. 결국 이 논제는 세이버메트릭스에 대한 오해 중 하나다.
일반적인 야구팬들, 하다못해 세이버메트릭스에 대한 이해가 없던 세이버메트릭스 도입 초창기의 스카우터들도 갖고 있던 오해 중 하나는, 세이버메트릭스가 제시하는 이상적인 선수의 상이 하나뿐이라는 것이다. 대충 그들이 가지고 있던 생각은 '세이버메트릭스가 생각하는 이상적인 타자는 딱 하나인데 2할 중후반대의 그다지 높지 않은 타율, .360~.380 수준의 높은 출루율, .420~.460 수준의 적당한 장타율의 재미없는 선수가 그것이다' 라는 것. 세이버메트릭스에 대한 반감을 가지고 있던 스카우터들은 세이버메트리션과의 대담을 나누는 자리에 나와서 '너네들 방법으로 뽑는 선수는 다 똑같을 거다. 우리는 슈퍼스타를 뽑아낼 수 있지만, 이제 야구는 다 재미없어지고 똑같은 애들만 뽑게 될 거다'라는 뉘앙스로 비꼬기도 했다. 물론 이건 세이버메트릭스를 모르기 때문에 나온 촌극이자 무시다. 오히려 세이버메트릭스는 이전에 무시받던 유형의 선수에게도 중요한 가치가 있음을 알려주며, 더 다양한 선수들의 유형이 나오게 만들었다. 일례로 2017년 7월 3일 기준, 코디 벨린저는 .262, .335라는 낮은 타율과 출루율을 기록중이지만 미친듯한 홈런 퍼레이드로 .633의 장타율을 기록 중이다. 코리 시거는 벨린저만큼 홈런을 많이 치진 못하지만, 타/출/장이 거진 3/4/5 에 수렴하는 밸런스 잡힌 성적을 보여주고 있다. 다니엘 머피는 볼넷을 거의 얻지 못하며 출루율 따위는 개나 주라는 듯한 타석 접근법을 보여주고 있지만 .334라는 미친듯이 높은 타율로 출루율 역시 .387을 유지하고, .569 의 뛰어난 장타율을 보여주고 있다. 이 세 선수는 각각 일발 장타형 홈런 타자, 어줍잖은 밸런스 타자가 아닌 타출장 3/4/5의 완벽한 밸런스형 타자, 미친듯이 높은 타율과 꽤나 좋은 파워를 보유한 타자로 제각기 판이한 모습을 보여주고 있지만, 세이버메트릭스로 분석한 이들의 리그 평균 선수 대비 타석 효율은 각각 146%, 143%, 142% 로 매우 비슷하다.
하지만 상술된 반론이 무색하게 이런 우려는 2020년대에 들어서 슬슬 현실화 되고 있는데, 결국 세이버메트릭스상으로 가장 좋은 타자가 "선구안이 좋아 볼넷을 골라 낼 수 있으며, 삼진을 두려워 하지 않고 장타를 노리는 풀스윙 히터"라는 추세로 가고 있기 때문이다. 특히 플라이볼 혁명이라 불리는 대세에 힘입어 "결국 출루와 장타가 최고다"라는 결론이 나오면서, 많은 타자들의 플레이스타일이 2할 중후반의 타율도 아닌, 2할 초반, 혹은 잘 해야 2할 5푼 내외의 저타율과 상대적으로 높은 순출루율, 많은 홈런과 삼진으로 획일화되기 시작하였다.[17][18] 디 고든이나 조시 해밀턴 같은 선수는 이제 메이저에서 거의 볼 수 없고, 이제는 센터라인 내야수나 포수도 풀시즌 10-20홈런이 가능한 최소 중장거리포가 아니면 거의 뽑히지도 않는 상황이 되었다. 이로 인해 메이저 사무국은 수비 시프트 금지, 베이스 간의 거리 단축 등의 룰을 '진지하게' 고민할 정도로 이 문제는 눈에 띄게 현실화되고 있다. 결국 2023시즌부터는 룰 개정을 통해 극단적인 수비 시프트의 제한, 베이스의 크기 확장, 견제 제한 등의 요소를 도입해버리며, 대놓고 안타와 도루 같은 역동적인 장면이 많이 나오게 유도하기 시작했다.
비슷한 예시로는 NBA를 들 수 있는데, 2010년대 중반부터 시작된 스테판 커리의 3점슛 혁명으로 3점슛의 효율이 부각되면서 양궁농구와 빅맨 포지션의 기근화가 일어나기 시작했고, 이로 인해 모든 팀의 경기 스타일이 비슷해지기 시작한 것이 NBA의 인기 하락의 주범으로 꼽히고 있는 상황이다. NBA 사무국 역시 이 문제 때문에 매년 룰을 조금씩 개정 하는 것을 생각하면 야구 역시 같은 길을 걷는 것일 수도 있다.
오직 '승리'만을 위한 획일화는 '재미'를 떨어뜨린다는 치명적인 단점이 있다. 올림픽에서 대회 내내 삽질만 하던 이승엽이 결정적인 순간에 대형홈런 한방으로 팬들을 열광시키며 일약 영웅이 되고, 최고의 마무리 투수였던 트레버 호프만도 정작 중요한 경기에서 세이브 실패로 팬들에게 엄청 욕을 먹고 심지어 살해협박까지 받는 일도 있었다. 세이버메트릭스에선 무시당하는 '승패'이지만, 일반 야구팬들에게는 여전히 승패가 중요한 것은 '그가 등판한 경기에서 얼마나 승리했나'란게 직관적으로 느껴지기 때문이다. 하지만 세이버메트릭스에선 이런 점은 고려되지 않는다. 팬들은 베이징 올림픽을 떠올릴 때 이승엽의 통쾌한 홈런포를 감동적인 순간으로 기억하지만, 세이버메트릭스에서 올림픽에서의 이승엽은 대회 내내 침묵하다 운 좋게 한 방 날린 그저 그런 타자가 되고, 꾸준한 성적을 낸 선수를 최고로 치므로 팬들과 괴리가 생긴다.
또 그냥 일반 야구시청을 하는데 있어서 이미 기존의 자료로도 충분히 대략적인 파악은 가능하다. 흔히 타율만 거론하며 모순을 지적하지만, 극소수의 라이트팬을 제외한 대다수의 야구팬들은 타자 기준으로는 타율만 보지 않고, 최소 타율, 출루율, 장타율, OPS, 홈런 정도는 보는 편이고, 좀 더 나아가면 WAR, WRC+ 등 타자들의 실력을 잘 드러내면서도 이해하기 어렵지 않은 스탯도 보는데, 이 정도 수치만 봐도 선수들의 실력과 플레이스타일이 어느 정도인지 대략 파악 가능하다. 세이버메트릭스는 거의 학문이나 논문 수준으로 파고들어 접근하는데, 야구계에 종사하는 관계자나 스탯만 파는 덕후들에게는 흥미가 있겠지만, 일반 야구팬들에게는 흥미를 느끼게 하는게 아닌 벽을 느끼게 할 수도 있다. 어차피 일반인들은 그냥 시간날때 팝콘 먹으며 보는 수준인데, 직관적이고 쉬운게 아닌 너무 복잡하고 난해하여 선뜻 이해가 안되면 멀어질 수 있다. 실제 게임들도 시리즈화되면서 마니악해지며 점점 '하는 사람만 하는' 게임으로 변모해가는데, 야구도 복잡한 스탯은 신규 야구팬들을 유입하는데 방해가 될 수 있다.
다만, 이것도 시간이 지나면 너무 복잡하지 않고 직관적인 세이버 스탯들은 점차 대중들에게 널리 알려질 것이라는 견해도 많다. 2022년 기준에서 WAR이나 OPS는 야구에 이제 막 입문하거나 국가대표 경기만 가볍게 보는 시청자가 아닌이상 대부분의 야구팬은 어떤 수치인지 대강 의미를 아는 매우 대중적인 지표로 자리잡았지만 불과 10년전만 해도 WAR이라는 수치는 KBO에서는 극소수의 매니아들만 알고있는, 이제 막 MLB에서 신뢰성 있는 수치로 검증받은 스탯이었다. 당시 2012년 골든글러브 투수부문에서 승수만 적었지 세부스탯으로 압도적인 수치를 기록한 류현진이 고작 14표 밖에 얻지 못했을 정도로 투수의 가치를 평가하는 기준이 매우 구식이었으며,[19] OPS라는 매우 간단한 스탯조차 별다른 가치를 부여하지 않았던 시절이었다. 하지만 2022년 기준, WAR은 계산과정이 매우 복잡해도 결과값으로 도출하여 대중에게 보여주는 결과값이 매우 직관적이고 선수들의 가치를 수치 단 하나로 줄세우기를 할 수 있다는 점에서, OPS는 출루의 가치를 저평가한다는 단점이 있어도 계산이 너무나도 쉬우면서 타자의 생산성을 상대적으로 잘 표현한다는 매력적인 장점 덕분에 WAR과 더불어 스포츠 뉴스에서도 종종 나올만큼 아주 대중적인 수치로 자리잡았다. 적어도 WAR로 선수의 가치를 매기는건 과거의 투승타타로 대표되는 구시대적 안경을 끼고 선수의 가치를 매기는 것보다 훨씬 정확하며, WAR은 타율, 홈런, 승리, 탈삼진 등의 기본적인 스탯을 바탕으로 연구를 통해 얻어낸 스탯들이다. 결국 대중들에게 널리 보급되는 건 이러한 직관적인 스탯이니, 알게 모르게 대중들이 야구를 바라보는 관점도 세이버매트릭스의 관점을 점점 받았다고 얘기할 수 있는 것.
흔히 야구에서 '운도 실력'이란 말이 나오는게, 팬들 입장에선 어쨌거나 중요한 경기에서 승리하거나 중요한 순간에 안타나 홈런을 때리는 선수에게 점수를 크게 주고 기억에 남기 때문이다. 따라서 일반인들이 최고의 선수로 기억하는 선수와, 세이버메트릭스 최고의 선수와는 괴리가 생길 수밖에 없다. 재미없게 판정으로 승리하여 무패로 은퇴한 메이웨더보다, 비록 패도 많이 하고 한물간 평가를 받았던 당시에 최강의 조지포먼을 KO로 잡아낸 알리가 '킨샤샤의 기적'으로 불리며 수십년 지나도 여전히 최고의 선수로 기억되는 이유가 왜인지를 떠올려 보자. 메이웨더 vs 파퀴아오 경기는 기억나는게 중간에 김수미의 맥콜CF밖에 없다는 반응이 많은 지지를 받았다. 하지만 당시 복싱 마니아들은 메이웨더의 숄더롤이 예술이었다며 극찬했다. 일반인들은 물론 잘하는 선수를 좋아하지만, 팬들이 기대하는 일정 기준을 충족한 상위권 선수들 중에서는 '감동을 주는 선수'를 더 좋아한다. 클러치 히터에 대해 일반인들과 세이버메트릭스의 시각이 다른 이유다.
세이버메트릭스가 선수 능력을 수치화하는데 유용한 도구인 것은 분명하지만, 세이버메트릭스를 지나치게 맹신하는 것도 지양해야 할 것이다. 예를 들어 세이버메트릭스의 아버지 빌 제임스는 2017년 한국 언론과의 인터뷰에서 데이터로 사람을 평가한다는 것은 매우 어려운 일이며, 세이버메트릭스를 이용한 선수 평가 역시 틀릴 수도 있다는 것을 인정해야 한다고 말하였다.[20] 기사 링크 물론 어디까지나 세이버메트릭스만으로 평가하기 어렵다는 뜻이고, 현장에서 수집한 정보 등의 다른 정보와 합쳐지면 평가하기 상당히 좋아지며, 최소한 타율이나 타점, 승이나 평균 자책점만 보고 평가하는 것보다는 비교할 수조차 없을 정도로 신뢰도가 높다는 것은 변하지 않는다.
자세한 것은 야구의 기록 계산법 참조.
참고로 류현진에 의하면 2010년 후반 통계 분석이 치밀한 편에 속하는 LA 다저스는 다음과 같은 수준이라 한다.
단순히 A란 타자가 B 투수 상대로 몇 타수 몇 안타인지 같은 기록은 데이터 축에 들지도 않는다. 투수의 구속과 회전수, 회전축, 가로와 세로 무브먼트, 릴리스포인트를 전부 데이터화 하여 계산에 넣고 타자의 스윙궤적까지 측정해 계산한다. 이렇게 투수와 타자, 구종에 따라 세세하게 예측한 시뮬레이션을 바탕으로 매 경기의 계획과 전략을 세우고, 시나리오를 짜서 경기에 임하는 게 요즘 MLB 구단이다. 물론 이렇게 분석해도 이따금 지난해 포스트시즌처럼 아쉬운 결과가 나오긴 하지만, 단순히 ‘감’에 의존해서 불합리한 선택을 하는 과거 방식과는 비교가 되지 않는다.#
세이버메트릭스 자체의 문제는 아니지만 자료를 자의적으로 해석해거나, 심지어 그 자의적 결과를 맹신하는 경우도 비판의 대상이 된다. 보통 세이버메트릭스에 대한 비판과 그에 대한 반론이 격렬히 충돌하는 이슈는 다음과 같은 잘못된 과정을 거친다.
① 대상이 되는 스탯을 선정
② 자료 분석
③ 스탯과 성적 사이 유의미한 인과, 비례관계를 찾지 못함.
④ 결론 도출: 해당 스탯을 고려대상으로 취급하지 않는다. 또는 무의미한 것으로 판단한다.
상기 프로세스는 ③번에서 ④번으로 넘어가는 과정에 치명적인 결함이 있다. 유의미한 인과관계를 찾지 못했다는 것이 인과관계 자체가 없는 것은 아니기 때문이다. 얼핏 보기엔 맞는 거 아닌가 싶지만, 처음부터 잘못된 변수를 설정했거나 복합 변수인 경우 인과 관계가 없는 것처럼 보이기도 한다. 그러나 세이버메트리션 상당수가 오로지 숫자만을 믿고 기존의 가치관을 부정하는 성향이다보니 그런 식의 오류를 범하는 경우가 의외로 꽤 된다. 가령 FIP의 경우, 초창기에는 ERA를 완전히 대신할 수 있다거나, 혹은 ERA를 보는 것은 야알못이라는 식의 극단론이 풋내기 세이버메트릭션들에게 매우 널리 퍼졌었다. 그러나 현재는 ERA와 FIP의 상호보완 관계가 인정되면서 ERA의 평가가 다시 올라왔으며, 특히 통산 성적에서 FIP만 보는 것은 단일 시즌에서 ERA만 보는 것과 동급의 극단적인 오류로 판명되었다.
참고로 세이버메트릭스 같은 분석은 팀 스포츠의 탈을 쓴 개인 스포츠인 야구의 특성과 가장 잘 맞는다. 예를 들어 팀합이 더 중요한 농구나 축구 같은 스포츠는 분석하기가 매우 어렵다.
5. 세이버메트릭스 관련 사이트
5.1. KBO 리그
- 스탯티즈: 국내 세이버메트릭스 관련 사이트 중 가장 유명한 사이트. 2011년 박동희 스탯티즈 논란으로 문을 닫았으나 2015년 10월 다시 문을 열었다. KBO 관련 공개 기록사이트 중 가장 체계화된 모습을 보이며 세이버메트릭스의 대중화에 기여한 대표적인 사이트.[21]그러나 2024년 개편 이후 여러 중요 스탯 삭제, WAR 계산식 수정, 수많은 오류 등으로 완전히 신뢰를 잃은 상태로, 수많은 야구 덕후들은 KBReport로 이주한 상황이다. 현 시점에서는 클래식 스탯만 보고 세이버 스탯은 그냥 참고만 해야 할 수준으로 정확도가 떨어져 버렸다.
- KBO 공식 기록실: 극악의 가시성을 보여주다 2015 시즌부터 개편되며 개선되었다. 수비는 2002년부터만 보여준다.[22]
- KBO 공식 안드로이드 앱: KBO 공식 기록을 담당하는 스포츠 투아이에서 배포. 처음에는 유료앱이었지만 2013년 현재는 무료화. 투수에게 중요한 스탯인 피OPS를 찾아볼 수 있는 유일한 곳. 그리고 스포츠투아이에서 산출하는 war을 kbo앱을 통해 직접 확인할 수 있다.
strikes zone: KBO 문자중계 데이터를 정리해놓은 사이트. 매일 경기가 끝난 후 업데이트 된다. 2022년 현재 유일하게 스트라이크 존을 확인할 수 있는 사이트.[23]
- MLB Nation: FreeRedbird 등의 세이버메트릭스 스탯에 대한 칼럼을 읽을 수 있다.
- 베이스볼-인-플레이: 다양한 세이버매트릭스 소개하고 "도루는 어느정도 가치가 있나?"같은 양질의 칼럼들이 올라온다. 그리고 2010년부터 2015년까지 한국에서 유일하게 타구 지점을 제공하고 있다.
- 야구공작소: 세이버메트릭스는 물론이고 야구에 대한 양질의 칼럼들을 제공하는 사이트. '야자수'라는 이름의 팟캐스트 방송 또한 제작. 해당 사이트에서 칼럼을 쓰던 인물들 가운데 상당수가 현재 야구 업계에서 종사 중이다.
- bskyvision.com: 블로그 운영자는 컴퓨터비전 분야 석사로 자신의 분야를 활용해 세이버매트릭스에 관한 글을 포스팅하고 있다.
- 스포츠투아이: PTS 데이터에 기반한 선수들의 트래킹 데이터를 보여준다.
5.2. 메이저 리그 베이스볼
- 베이스볼 레퍼런스: MLB의 각종 역사와 기록을 가장 일목요연하게 확인할 수 있는 곳. 팬그래프나 BP 등의 세이버메트릭스 사이트들처럼 통계학 등을 이용해 숨은 내면을 분석하기 보다는 실제 벌어진 '역사, 기록' 그 자체에 더욱 중점을 두는 편. 때문에 투수의 WAR를 (실제 벌어진) 실점, 즉 RA9를 보정한 스탯을 기반으로 측정한다. 역대 MLB MVP, 사이 영 상 순위나 골드글러브, 행크 아론 상 등의 수상 기록, 심지어 역대 드래프트 순위, 출신 학교 등 '기록'이라는 측면에서는 어떤 사이트보다도 충실하다.
- 팬그래프: 위에 언급된 베이스볼 레퍼런스나 ESPN, 베이스볼 아메리카 등과 함께 덕후들이 좋아하는 곳. 레퍼런스가 '기록'이라면 팬그래프는 '분석'이라고 요약할 수 있다. 특히 이 사이트에서는 비록 최근이라 옛날 정보가 부족하긴 하지만 투구 추적 시스템(Pitch F/X)도 도입되었기 때문에 세이버메트리션들 뿐만 아니라 투구 궤적이나 무브먼트 계산 등 여러가지로 야덕후 전반에 걸쳐 유익한 정보들을 많이 접할 수 있다. 또한 수비 데이터 중 가장 신뢰도가 높다고 평가받는 UZR 데이터를 무료로 공개하고 있다.
- Baseball Prospectus: 최초의 세이버메트릭스 덕후 사이트 중 하나. 상기한 팬그래프나 레퍼런스보다도 더 매니악한 사이트로 여겨진다. VORP와 EqA의 개념을 처음으로 고안해 낸 곳이기도 하다. 2000년대 초반에 세이버메트릭스의 중심지 역할을 하였으나, 스탯의 계산법을 공개하는 경우가 드물고 공개하더라도 유료로 풀어버리는 등 폐쇄성이 문제가 되어 현재는 팬그래프에 완전히 밀려버렸다. 그후 칼럼진을 개편하고, cFIP, DRA(투수), DRC+(타자) 같은 스탯을 야심차게 내놓는 등 재역전을 노리는 중. 포수의 프레이밍 데이터를 WAR에 가장 먼저 반영한 사이트이다. 이 사이트의 진짜 단점은 너무나도 구린 사이트 인터페이스로, 2000년대 초중반 수준에서 전혀 발전을 못한 상태이다. 팬그래프도 모바일 최적화가 개떡이지만 이쪽에 비하면 양반이다.
- Harball Times: 가장 활발한 토론이 이루어지는 미국 세이버메트릭스 사이트 중 하나. 읽어볼 만한 칼럼이 정말 많다.
- Tangotiger Blog: 유명 세이버메트리션인 톰 탱고(Tom Tango)가 운영하는 블로그. 본좌들의 토론을 생생히 지켜볼 수 있다.
- Baseballsavant: 스탯캐스트 데이터와 이를 기반으로 한 2차 스탯을 제공하는 사이트. 주루속도, 팝타임, 타구의 속도 및 각도 등을 제공하며, xwOBA[24], OAA[25] 등 스탯캐스트의 기술력을 이용한 2차 스탯들을 제공한다. 당연하겠지만 스탯캐스트 도입 이전인 14시즌 전의 데이터는 제공하지 않는다.
다만 해외 사이트들 중에는 연간 일정 금액을 결제해야 고급 정보를 열람할 수 있는 사이트들이 많이 있으니 이용에 있어 유의할 것.
5.3. 일본프로야구
- 1.02 ESSENCE OF BASEBALL: 일본의 세이버메트릭스 사이트. 한국의 스포츠투아이와 비슷한 회사인 DELTA라는 스포츠기록전문 업체에서 운영하는 사이트로 2015년 11월에 오픈베타에 들어갔다. 수비 스탯인 UZR와 주루 UBR 데이터까지 공개된다는 점이 큰 장점. 정식 오픈 이후에는 유료제로 전환하여 무료회원은 규정타석/이닝 선수의 기록만 확인이 가능하였다가 최근 들어서는 클래식 기록만 확인하도록 변경되어 세부스탯을 열람하기 위해서는 유료회원 등록이 필수가 되었다.
6. 유명한 세이버메트리션
6.1. KBO 리그
- FreeRedbird: 한국 굴지의 세이버메트리션. 세이버메트릭스 항목은 스탯과 이론들을 소개하는 글 위주로 포스팅된다. 세이버메트릭스는 알고싶은데 영어는 자신없는 사람들의 필수 코스. 블로그 요즘에는 바쁜지 카디널스 얘기(원래부터 카디널스 팬이었다. redbirds가 카디널스의 별칭)만 하는 듯.
- 박기철 ('스포츠투아이' 부사장. 출처: 한국프로야구 1세대 세이버메트리션. 참고로, 언급된 기사에 의하면, NC 다이노스는 2014년 초에 세이버메트릭스 전담 직원을 채용, 적극적으로 활용중. 같은 기사에서, NC의 라이벌 롯데 자이언츠도, 2013년 최하진 사장 취임과 동시에 '미래혁신TF팀'을 만들어 세이버메트릭스를 적극적으로 활용하려는 작업을 진행. 2016년 4월 6일 심장마비로 사망.
- 이동현: 스탯티즈 운영자. 필명으로 스탯티즈라는 이름을 쓴 적도 있다.
- 최민규: 일간스포츠 기자로 한국 1세대 세이버메트리션 중 한 명. PC통신 시대부터 세이버이론을 펼쳤으며 인터넷 사이트 후추닷컴에서 기자를 시작한 이래로 스포츠 2.0에서 세이버메트리션 관련 칼럼을 연재하기도 했다.
- 정재승: 카이스트 교수. 과학 콘서트의 저자로 유명하며, 대중적으로는 가장 인지도가 높은 과학자로 손꼽히는 인물. 세이버메트릭스 계에서는 4할타자가 나올 확률에 대해 연구한 최초의 소셜 네트워크 연구인 백인천 프로젝트를 처음으로 기획한 것으로 유명해졌다.[26] 이 백인천 프로젝트 참가자들을 중심으로 한국야구학회가 성립되었고 첫 회장으로 추대되기도 했다.
- 비즈볼프로젝트: 유의미한 스포츠 컨텐츠의 지속적 생산을 목표로 하는 스포츠 리서치 팀. 기존에는 다른 여러 스포츠를 함께 아울렀으나 현재는 야구에 아무래도 무게 중심이 쏠리고 있다. 자체 팟캐스트인 트루볼쇼는 네이버 스포츠 라디오에도 올라오고 있다. 프로젝트 내 멤버들도 야구학회에 자주 참석할 뿐 아니라 자체 컨퍼런스도 개최하고 있다. 야구팀이 야구공작소로 분리된 이후 사실상 농구사이트로 탈바꿈한 것은 비밀.
- 야구공작소: 비즈볼프로젝트의 야구팀 구성원들이 독립하여 만든 사이트다. 2017년 현재 엠스플뉴스와 일간스포츠를 통해 기사가 송고되고 있고 네이버 라디오 야자수를 방송중이다.홈페이지페이스북
- 토아일당 Baseball-in-Play.com: 구글에서 검색되는 세이버메트릭스 이론과 개념 정리글 중 이 사람이 쓴 것이 꽤 된다. 개인블로그 뿐 아니라 KBreport, 비즈볼프로젝트, 야구학회 등에서도 활동한다. MLB가 아니라 KBO리그의 데이터를 바탕으로 한 분석이 많은 것이 특징이다. 블로그 페이스북
- 황규인: 야구사이트 파울볼에서 오랜기간 글을 연재해온 논객 출신 동아일보 기자. 당시 닉네임 kini. 주간동아에 베이스볼비키니라는 세이버 칼럼 연재중. 최민규의 영향을 받아 세이버메트릭스에 입문한 것으로 보임. 블로그에도 읽을 만한 각종 스포츠 글이 꾸준히 올라온다.
- 썩빡꾸: 세이버메트릭스에서 주로 타자의 스탯을 가지고 여러 가지 글들을 보여준다. 팬그래프에서 새롭게 제시되는 이론들을 재밌게 소개해준다. 홈페이지
- Buer: Pecota 프로젝션에 대해서 이해하고 싶다면 한 번 방문해 보자. 블로그
6.2. 메이저 리그 베이스볼
- 네이트 실버(Nate Silver): 통계학자, PECOTA(페코타) 프로젝션의 창시자, 통계 포털 '파이브서티에이트(FiveThirtyEight)' 창립자.(출처)
시대의 천재(genius)[27][28]
- 클레이 데이븐포트(Clay Davenport): 통계학자, 야구 통계 사이트 '베이스볼 프로스펙터스(Baseball Prospectus)' 설립자이자 Claydavenport.com 의 운영자 출처 KBO선수의 MLB 활약상을 예측하는 Davenport Translation도 볼 수 있다.
- 빌 제임스(Bill James): 일명 세이버메트릭스의 아버지.
- 키스 울너(Keith Woolner): 세이버메트릭스의 핵심 그룹 중 하나인 베이스볼프로스펙터스의 필진이었고 2007년 그 즈음의 많은 세이버메트리션들이 그런 것 처럼 MLB구단 프런트 오피스로 들어간다. (클리블랜드 인디언스) 그는 선수평가지표인 VORP( Value Over Replacement Player)를 고안했는데, WAR 과 같은 지표에서 사용하는 대체레벨(replacement level) 개념이 여기에 바탕을 두고 있다.
- 톰 탱고(Tom Tango): TangoTiger라는 닉네임으로 더 유명. 탱고는 세이버메트리션이란 명칭 대신 세이버리스트(Saberist)라 불러달라고 한다. 빌 제임스가 바흐 쯤 된다면, 톰 탱고는 모차르트이자 베토벤이다. wOBA를 비롯해서 WPA, FIP 등 2000년대 이후 가장 널리 사용되는 세이버메트릭스 지표 중 상당수가 그의 작품이다. 또한 탱고의 블로그는 세이버메트리션들의 토론의 장이기도 하다. 2016년에 하던 일을 그만두고 MLBAM으로 이직했다. 그동안도 야구 관련 일을 해오긴 했지만, 이사 문제 등으로 풀타임 제의는 고사해왔다. 이번에는 조건이 딱 맞아떨어졌다고. 이번 일을 맡은 기념으로 야덕 사이트 팬그래프의 수장 데이브 카메론과 톰 탱고의 이메일 인터뷰를 소개한 글인 (인터뷰)톰 탱고: MLB의 새로운 데이터 구루를 만나다도 그를 이해하는데 도움이 될 것이다.
- 폴 디포디스타: 애슬레틱스의 부단장이 되기 전까지는 평범한 세이버메트리션이였으나 빌리 빈 단장의 눈에 띄어 부단장 자리를 얻고 오클랜드 머니볼 시대를 이끌었다. 하지만 LA 다저스의 단장으로 영전한 뒤에는 토미 라소다 부회장 등과 갈등을 빚다 별다른 성과를 내지 못하고 물러났다. 2016년까지 뉴욕 메츠의 부단장을 역임하였고 현재는 NFL
의 영고라인클리블랜드 브라운스의 Chief Strategy Officer로 재직하며 미식축구계에 데이터 분석을 접목하는 시도를 하는 중.
- 피트 파머(Pete Palmer): 빌 제임스와 함께 초기 세이버메트릭스의 대표인물. SABR의 초기멤버이기도 하다.
참고로 이들을 포함한 수많은 세이버메트리션들은 상당수가 특정 구단이나 언론사 등에 고용되어 일하고 있다. 업계에서 세이버메트리션들이 가진 가치를 알아주기 시작하면서 덕업일치의 길이 열린 셈인데, 세간에 알려진 WAR 계산법이라던지 역사적 상수 계산법이라던지 등등을 아마추어의 정보력만으로 이들에 준하는 수준으로 섭렵하는 데에는 한계가 있음을 인정하는 것이 스스로의 정신건강에 이로울 것이다. 이들은 단순한 야덕이 아니라 빅리그 구단에게 고액의 페이를 받는, 학계에서 최고로 꼽히는 인재[31]들이다. 이들은 지금도 일개 아마추어 라이트팬들은 생각해내지조차 못하는 관점에서 DIPS나 WAR 같은 세이버메트릭스의 히트작들을 까내리며 뜯어고치고 있다. 까놓고 말해, 선수나 코칭스태프들이 부상 숨기고 팀내의 트러블 숨기는 것처럼 세이버메트릭스 업계에서도 영업기밀이 많다. 만약 이 글을 읽는 이가 새로운 발상을 떠올려서 인터넷에 게시했다면, 그리고 그것이 영어로 어째저째 괴수들의 눈과 귀에 들어갔다면, 흔한 천조국 야구팀의 정보요원들에게 납치(?)되어 평생 직장을 얻을 수도 있다.
역으로 말하자면 인터넷의 열린 토론 공간에서 자신의 정보를 널리 퍼뜨리던 사람들이 구단 산하로 들어가면서, 구단과 외부의 정보격차가 점점 벌어지고 있다는 비판도 나온다. 타구, 투구, 수비를 분석하기 위한 천문학적 비용의 분석도구들이 구단들에서만 돌고 외부로 풀리고 있지 않은 상황에서, 인적 자원마저도 구단 내부로 들어가면서 2010년대 세이버메트릭스 발전은 정체되어 가고 있다고 해도 과언이 아니다.
대표적인 세이버메트릭스의 장점과 한계를 보여주는 것이 스탯캐스트이다. 빅데이터 분석, 레이더 추적, 심박수 측정 등 야구 분석지 정도 보는 것으로는 답이 없는 자료가 생성 축적되기 시작했고, 여기 접근할 수 있는 사람과 없는 사람의 정보 격차가 안드로메다처럼 벌어졌다. 일부가 공개되기도 하지만 진짜로 중요한 정보는 공개되지 않는다고 봐야할 것이다. 단적으로 한국에도 스탯캐스트의 기본이 되는 트랙맨 시스템을 도입해서 구장에 설치한 구단이 몇몇 있지만, 이중 대중에 공개된 자료는 전혀 없다.
6.3. 일본프로야구
- 하토야마 유키오: 현재는 일본의 전 총리로 훨씬 유명하지만 원래 도쿄대에서 계수공학 을 전공하고 스탠포드에서 박사까지 딴 전도유망한 공학자 출신이다. 젊은 시절 세이버 메트리션이었고, 관련 논문을 발표하기도 했다.[32]
- ever_17: NPB Career WAR를 정리한 용자이다. NPB 세이버 스탯에 대한 이야기는 여기서 하자. 블로그
7. 말말말
대부분의 구단들이 큰 결정을 내릴 때 세이버메트릭스를 기준으로 삼는다. 물론 선수한테 세이버메트릭스가 도움이 될 때가 있다. 예를 들어 구단이 선수를 지원하고 정보를 공유해줄 때, 나도 그런 정보를 통해 배우는 부분이 있다. 구단이 선수의 의견을 존중하고 정보를 제공한다면 좋은 결과가 뒤따르기 마련이다. 그러나 선수와의 대화 없이 선수보다 세이버메트릭스를 앞세운다면 어느 지점에서는 충돌이 빚어질지도 모른다. (숫자의 한계를 의미하는 건가?) 그렇다. 예를 들어 숫자로 봤을 때는 내가 수비면에서 많이 뒤떨어진다고 하는데 경기에서 내 모습을 직접 본 동료들, 코치들, 심지어 상대팀 선수들은 전혀 그렇게 생각하지 않는다.[33] 숫자가 다 담지 못하는 것들이 존재하기에 그들이 내게 그런 말을 하는 게 아닐까 싶다. 세이버메트릭스가 도움이 되지만 나는 다른 선수들의 의견이나 코치들, 감독의 의견도 중요하다고 생각한다. 33세란 나이는 선수로서는 많아 보여도 사회에 나가면 젊은 축에 속한다. 야구에서는 나보다 나이가 많지만 여전히 훌륭한 성적을 보여주는 선수들도 있고, 나이가 어리지만 나보다 성적이 뒤떨어지는 선수들도 있다. 즉 나이가 전부는 아니라는 얘기다.
애덤 존스 #
애덤 존스 #
LA 다저스는 타 팀에 비해 최첨단 통계자료 활용을 중시한다. 연구원처럼 보이는 50여 명의 다저스 구단 리서치팀이 경기력 향상을 위해 다양한 분석자료를 내놓는 시대다. 예전에는 상상도 못했던 것이다. 하지만 아직도 많은 팀들이 다저스처럼 세이버메트릭스 자료를 신봉하는 것은 아니다. 예를 들어, 세인트루이스 카디널스는 포수 야디어 몰리나의 리드에 많이 의존하는 것으로 알고 있다. 통계자료에만 의존하는 것이 꼭 바람직한 것은 아니다. 요즘은 선수를 스카우트할 때 ‘숫자’로 평가할 수 없는 투지, 승부욕, 동료와 관계 등은 잘 보지 않는다.
클레이튼 커쇼 #
클레이튼 커쇼 #
요즘 야구에서 데이터에 의존하는 부분이 과도하고 야구는 의외성의 경기. 데이터에 지나치게 의존하는 것도 재미를 떨어뜨릴 수 있고, 이에 대응해 새로운 규정이 나오는 것도 달갑지 않다.
추신수 ##[34]
추신수 ##[34]
야구에서도 ‘유행’이라는 게 있다. 예를 들어 몇 년 전에는 유틸리티 선수들이 인기를 끌던 시절이 있었다. 매 경기마다 다른 포지션을 소화할 수 있기 때문이다. 몇몇 구단들이 유틸리티 선수들의 활약 덕분에 좋은 성적을 거뒀고 그것을 본 다른 구단들도 유틸리티 선수들을 영입하려고 많은 노력을 기울였다. 그러나 유틸리티 선수들을 영입했다고 해서 모든 구단들이 성공하지는 않았다. 세이버메트릭스와 선수들에 관한 통계들도 마찬가지다. 나 또한 내 기록 관련해서 통계들을 살펴봤는데 아직까지도 WAR(대체승리기여도)의 숫자가 높다는 게 확실히 어떤 부분을 의미하는지 잘 모르겠다. 시간이 지나도 선수에게 중요한 것은 ‘야구의 정석’이라고 생각한다. 공을 얼마나 잘 치는지, 수비를 얼마나 잘하는지, 공을 잘 던지고 있는지 등 야구의 기본에 충실하지 않다면 그 숫자들은 아무런 의미가 없다. 유행을 따라가기만 하는 것보다는 기본을 단단히 정립하는 게 더 중요하다.
찰리 블랙먼 #
찰리 블랙먼 #
프런트와 같은 것을 믿고 있고 같은 목표를 갖고 있다. 데이터 분석과 세이버 메트릭스에 대해서도 완전히 열린 마음을 갖고 있다. 라인업을 구성하기 전 최대한 많은 정보를 갖기 원하지만 최종 책임은 내가 지는 것.
데이브 로버츠 #
데이브 로버츠 #
요즘 야구는 숫자의 게임으로 변하고 있습니다. 많은 구단들이 데이터를 다룰 것을 요구하죠. 그들은 예를 들어 ‘그래, 우리가 보니까 너는 2M 정도의 가치가 있어. 너가 2M보다 못한 활약을 보일 경우엔 우리는 너를 방출할거고, 그보다 더한 활약을 보여줄 경우엔 계속 데리고 갈거야.’라고 말하죠. 모든게 다 숫자 투성이입니다. 하지만 야구는 사람이 하는 스포츠입니다. 각자의 성격과 감정이 들어가있는 스포츠죠. 그렇기에 감독은 소통을 할 줄 알아야 하며, 개개인의 능력을 최대로 뽑아낼 수 있도록 모두를 이해하는 사람이 되어야 할 것입니다.
네드 요스트(캔자스시티 로열스 감독) #
네드 요스트(캔자스시티 로열스 감독) #
만약 우표에 관심이 있는 사람들이 우표 수집을 하고, 몸집이 큰 사람들이 스모를 좋아한다면, 통계를 좋아하고 시시콜콜한 정보에 관심 있는 사람들은 야구에 끌릴 것이다.
스티븐 제이 굴드
스티븐 제이 굴드
내가 각 숫자들에 접근하는 방식은 기계공이 몽키스패너를 들고 일을 시작하는 것과 크게 다르지 않다. 내가 시작하는 것은 늘 내 눈으로 직접 목격하거나 그 곳에 있었던 사람들의 목격담을 듣는 것이 가능한 경기들부터이다. 그리고는 스스로에게 묻는다. 이것은 진실인가? 그것을 증명할 수 있는가? 측정이 가능한가? 이것은 내 기계 전체 구조와 어떻게 들어맞는가? 그리고는 이에 대한 해답을 얻기 위해 각각의 기록들을 파고든다. (중략) 오늘도 야구는 수많은 기록들을 만들어내고, 사람들은 그에 대해 무척 많은 것을 이야기하고, 논쟁하거나 생각한다. 그런데도 왜 사람들은 그 자료들을 이용하지 않고 있는 것일까? 또는 왜 아무도 이런저런 자료들을 앞에 놓고 그것을 '증명해볼 것'을 요구하지 않는 것일까?
빌 제임스, 1979 Baseball Abstract 중
빌 제임스, 1979 Baseball Abstract 중
데이터는 신비로운 마법도 절대적 진리도 아니다. 대신 "당신 야구 얼마나 해봤는데?" 라고 묻지도 않는다. 그것은 편견 없는 소통의 언어이며 협력의 플랫폼이다.
신동윤 한국야구학회 데이터분과장.
신동윤 한국야구학회 데이터분과장.
7.1. 2019년 9월 이벤트
9월 16일(한국 기준) LA 다저스-뉴욕 메츠 경기는 미국 스포츠전문채널 ESPN의 '선데이 나이트 베이스볼'로 미국 전국에 생중계됐다. 경기가 진행되는 도중 ESPN은 다저스와 메츠 선수들에게 세이버메트릭스 전문 용어들을 묻는 영상을 방송에 내보냈다. 다저스 선수 중에는 켄리 잰슨, 코디 벨린저, 맥스 먼시, 워커 뷸러, 키케 에르난데스 등이 출연했고 메츠 선수 중에서는 피트 알론소, 토드 프레이저, 노아 신더가드 등이 질문에 답했다.ESPN은 출연선수들에게 낱말 맞추기 형식으로 FIP, wOBA, wRC+ 등 용어의 알파벳 첫 글자만 알려주고 나머지 뜻을 질문했다. 출연한 선수들 대부분은 용어들의 뜻을 추측하며 FIP(수비 무관 평균자책점:Fielding Independent Pitching), wOBA(가중출루율:Weighted On-Base Average), wRC+(조정득점생산력:Weighted Runs Created Plus) 등을 전혀 알지 못한다고 응답했다.
다저스 투수 워커 뷸러만이 유일하게 모든 질문에 정답을 제시했다. 뷸러는 다저스 선수들 중에서도 세이버메트릭스 자료들을 신봉하는 것으로 알려져 있다. 팀 동료 키케 에르난데스는 wRC+ 묻자 "뷸러가 말한 것이 정답일 것"이라고 웃으며 응답했다. 그리고 에르난데스는 wOBA는 가중출루율(Weighted On-Base Average)이라고 올바르게 대답하면서도 "정확한 의미는 모르겠다. 하지만 연봉 중재시 중요하다는 것은 알고 있다"고 장난 섞인 응답을 내놓았다.#
8. 관련 문서
- 야구의 기록 계산법
- 농구의 기록 계산법
- 투승타타
- 스탯캐스트: 야구의 기록 발전에 획기적인 발전을 이끌고 온 물건이다.
- 야구 용어
[1] matrix와 혼동하여 세이버매트릭스라고 쓰는 경우가 많은데 metrics이므로 세이버메트릭스가 옳은 표기다. 나무위키 문서 내에도 매라고 기재된 부분이 너무 많아 더욱더 혼란을 야기한다.[2] 농구에도 비슷한 부류의 학파가 있는데, 그 쪽은 APBR메트릭스라 부른다. APBR는 Association for Professional Basketball Research의 약자다. 세이버라는 독음과 달리 간단히 읽기에는 영 좋지 않은 약자다보니 그냥 APBR메트릭스라고만 부르는 모양.[3] 여기서는 단타 0.41점, 2루타 0.82점 ,3루타 1.06점, 홈런 1.42점.[4] 이들은 엄밀히 말하자면 세이버메트릭스 스탯이 아니다.[5] 그리고 2016년부터 NFL 클리블랜드 브라운스에서 일하고 있다.[6] 하일성의 해설을 떠올려 보면 된다. 듣기 편하다고는 할 수 있어도 절대 정확하지는 않다. 거의 완전히 현대야구로 넘어온 미국/일본에 비해 한국 야구계의 경향은 아직 이쪽에 가깝다고 볼 수 있으며 팀별 편차 역시 극도로 커서 일부 팀은 아예 세이버메트릭스 따위는 밥말아먹은 운영을 한다.[7] 세이버메트리션들은 야구 기록 못지않게 야구 역사의 덕후이기도 하다. 일례로 위의 제임스의 경우 Historical Baseball Abstract라는 엄청나게 두꺼운 책에서 120년 간 MLB와 니그로리그를 역사 서술의 방법으로 분석했다. 또한 미국의 SABR에서는 동양 야구, 19세기 중반 야구, 유니폼의 역사, 야구선수 개개인의 biography 등 통계연구 이외에도 다양한 연구 분과를 두고 있다.[8] 금융가로서 선물전문가다.[9] 이 차이를 극명하게 느낄 수 있는 가장 쉬운 방법은 MLB 통계 사이트의 양대산맥이라 볼 수 있는 팬그래프와 베이스볼 레퍼런스의 WAR을 비교해보면 된다. 타자의 WAR은 대개 10% 이내, 많아야 20% 수준의 차이가 날 뿐이지만 투수의 경우 심한 경우 두 배 가까운 차이가 나기도 한다.[10] 에러를 할 수 있는 가장 좋은 방법은 공을 잡을 수 있는 위치에서 공을 잡으려고 시도하는 것이라는 이야기까지 있다. 때문에 세이버메트릭스에서는 초기부터 에러를 클러치 히터로 표현되는 타점과 함께 극도로 불신하는 성향을 보인다.[11] 사실 축구도 통계적인 기록(드리블 횟수, xG 등)이 있으나 큰 효용이 없다. 다른 스포츠도 매한가지로 통계적 분석이 없는 건 아닌데 모든 플레이가 독립시행의 연속인 야구에 비해 플레이마다 기저 환경이 매번 달라져 통계학을 적용하기 어렵다.[12] 세이버 외적으로 야구는 팀 스포츠의 탈을 쓴 개인 스포츠인 것도 평가가 쉬워지는 데 한몫한다. 예를 들어, 축구에서 골을 넣었다면 그 직전 10초로만 끊어도 골키퍼와 수비수, 공격수들이 복잡하게 얽혀 단순히 슈팅으로 인한 골과 골키퍼의 방어 실패만으로 선수들의 플레이를 온전히 평가할 수 없지만, 야구는 각 상황마다 타자와 투수의 일대일 승부이고, 인플레이 타구가 나왔을 때 추가로 타구가 향한 방향의 수비수 정도만 평가하면 한 상황에 대한 펑가가 깔끔히 종료된다.[13] 드리블 횟수 같은 게 의미없는 스탯인 이유도 측면에서 측면으로 가는 드리블을 성공해도 그냥 5초 전에 중앙으로 패스 툭 주는 게 이득이었을 경우도 많기 때문에 의미없는 스탯이지만, 화려한 개인기를 성공시키는 선수의 공허함을 팬들에게 납득시키는 게 어렵다. 드리블 돌파를 성공했으면 또 완전히 틀린 플레이까지는 아니기도 하고...[14] 물론 옛날에도 선수간 타율 비교, ERA 비교 정도는 했지만, 동시대의 유사한 스타일의 선수가 아니라면, 결국 어록 채굴 경쟁 밖에 답이 없었다.[15] 가령 애런 저지와 오타니 쇼헤이가 맞붙은 2022년 아메리칸리그 MVP 경쟁의 경우, 대부분의 야구팬들은 세이버 데이터를 근거로 선수 가치에선 애런 저지를 최고로 꼽았다. 투타겸업이라는 독특한 스타성 때문에 MVP로 오타니를 민 팬들도 당연 있었지만, 순수하게 선수 가치로 보면 저지가 이긴다는 데 야구팬들 의견은 거의 일치했다. 하지만 만약 세이버메트릭스가 없었다면? 야구팬들은 메호대전마냥 전문가 의견 채굴 경쟁을 벌였을 것이다.[16] 국내의 경우 이종범에 관해 김응용감독이 이종범은 10승 투수 2명과도 바꾸지 않는다.라고 발언한적이 있는데 실제로 일본 진출전 4.5시즌(방위병 근무로 홈경기만 뛴 시즌이 있다.) 평균 war이 8.4인데 10승 전후를 기대할 수 있는 2,3선발이 일반적으로 2~3을 기록하니 진짜 10승 투수 2명보다 뛰어난 선수임이 드러났다. 반대로 이종범 vs 양준혁에 있어서 통산 wrc+에 관해 양준혁이 국내 선수 1위,역대 3위에 달하는것이 드러나 양준혁은 최근들어 팬들에게 더 좋은 평가를 받고 있다.[17] 더 정확하게 얘기하면 난이도의 문제다. 거의 4할에 육박하는 타율이라면 그 선수는 똑딱이에 눈야구가 안 되더라도 충분히 가치가 있겠지만, 그런 성적을 만들어내기는 대단히 어렵다. 눈야구와 장타보다는 컨택에 집중하는 쪽이 에바리지히터 헝식으로 ops 히터의 기어도를 따라가기 위해선 훨씬 힘든 싸움을 해야하므로 타자들이 그 방향을 산택하지 않는 것이다.[18] KBO에서 20년 전에 이런 스탯을 기록한 선수가 있는데, 바로 해태 타이거즈에서 1년간 활약한 1999년의 트레이시 샌더스. 샌더스의 99년 성적은 타출장 0.247/0.408/0.575에 40홈런 105볼넷 133삼진으로, 정말 극단적인 OPS형 히터의 성적이다. 이 당시에는 KBO는 물론이고 MLB도 세이버매트릭스가 제대로 알려지지 않은 터라 샌더스는 타율이 2할 5푼도 안되지만 파워는 좋은 공갈포로 취급을 받았다. 하지만 현대야구의 관점에서 보면, 삼진도 많이 먹지만 볼넷도 매우 많이 얻어 눈야구가 되는 타입이고, 타고투저인걸 감안하더라도 한시즌 40홈런을 때려낼 수 있는 파워가 좋은 선수이다. 좀 더 세부적으로 보면 WRC+가 145로 리그 10위이며, wOBA는 0.414로 리그 9위에 해당한다. 샌더스가 지금 MLB에서 저정도 성적을 찍으면, 리그 한손가락에 꼽을 수 있는 엄청난 강타자로 평가받는다.[19] 장원삼이 128표, 나이트가 121표로 장원삼이 수상하여 매우 큰 논란이 되었던 수상이다.[20] 국내 사례만 봐도, 세이버메트릭스에 기반해 외국인 선수를 영입한 NC 다이노스의 2018년 외국인 선수 영입이 실패한 것만 봐도 알 수 있다.[21] 다만 15시즌 전까지 수비 기록이 임의적으로 기록된 부분이 굉장히 많았고, 어느 정도 수정이 된 이후로도 각 시즌별 수비와 주루에서의 신뢰도가 높게 평가되진 않는다. 때문에 무턱대고 사용하던 신규 유입자들이 점차 깨달아가는게 자연스러운 수순. 다만 이를 인지하고 이용한다면 더할 나위 없는, 자타공인 현재로서 가장 대중적이면서 유용한 사이트이다.[22] 그 이전 공식 수비기록은 사이트 내의 연감에서 확인하는 경우가 있으며, 이 역시 1993년부터의 기록만 알수 있고, 외야수는 포지션 구분 없이 묶여 기록되어있다는 불편함이 있다.[23] 2024년 ABS 도입 이후에 폐지되었다.[24] Expected wOBA. 타구의 속도와 각도를 기반으로 1루타, 2루타, 3루타, 홈런 등을 다시 구해 wOBA 공식에 적용시킨 스탯. 구장 효과, 상대 수비, 타자 본인의 스피드 등이 배제된 '타구의 질'을 구하는 스탯[25] 타구의 비거리, 체공 시간으로 구한 '포구 확률'을 기반으로 외야수의 포구 능력을 평가한 스탯.[26] 사이언스북스에서 단행본으로 나오기도 했는데, 통계 책보다는 야구 책으로서의 성격이 더 강하다.[27] 스포츠 바깥 영역에서도 놀라운 성과를 냈다. 2008년과 2012년의 미국 대통령 선거 선거인단 배정 예측에서 완벽에 가까운 적중률을 기록했다. 다만 2016년 선거 예측은 틀렸다[28] 또한 스포츠 중심 포털이라는 간판답게 파이브서티에이트에서 독자적으로 통계에 기반한 축구 칼럼을 쓰기도 했는데(네이트 실버 본인이 쓴 건 아니고 소속 필진이 쓴), 몇몇 칼럼이 번역되어 국내 축덕들에게 상당한 관심을 끌기도 했다.[29] 정치 평론가로도 유명하다. 2003년부터 2011년까지 MSNBC에서 <Countdown with Keith Olbermann>이라는 뉴스 평론 프로그램을 본인의 이름을 걸고 진행했었다. 이때 상당히 강성이어서, 빌 오라일리 등으로 대표되는 폭스 뉴스와 대립각을 세웠고, 조지 워커 부시 정부와 08년 대선 당시 공화당 미국 부통령 후보였던 세라 페일린은 올버만에게 두고두고 씹히는 안주거리였다. 유튜브에서 검색만 해도 영상이 쏟아질 지경.[30] 올버맨과 코스타스는 1992년부터 1997년까지 ESPN의 레전드 심야 스포츠정보프로그램 'Sportscenter'를 함께 진행했다. 이후 지금도 숨겨왔던 나의 절친.[31] MBA 출신도 많고, 통계학, 컴퓨터 공학, 물리학 같은 이쪽 관련 학문의 석박사 학위를 가진 이들도 부지기수다. 월 스트리트나 실리콘밸리에서도 이들을 두고 스카우트 경쟁을 할 정도.[32] 참고[33] 실제로 수비 지표에 관해서는 아직mlb에서 조차 약간 논란이 있고 골드 글러브에서는 25%밖에 반영하지 않는다[34] 정작 추신수 본인은 한국에서 선구안이라는 단어를 처음 듣게 만든 인물이며 ops히터라는 평가를 받으니, 세이버메트릭스가 아니었다면 그런 대형계약을 맺지 못했을 것이다.(...)[35] 한 가지 간과해선 안 되는 사실이 있는데, 세이버메트릭스가 통계인 건 맞지만, 확률과 같은 수많은 데이터를 하나로 집계한 것이 통계이다. 즉, 통계를 내는데 각종 확률들이 통계 안에 들어간다는 것이다. 그리고 안경현은 세이버매트릭스가 고안해 낸 각종 야구의 기록 계산법을 객관적인 통계가 아닌 확률이라는 우연성으로 치부해 버리는 발언 때문에 세이버메트릭스와 이를 잘 이해하는 야구팬들부터 무수한 비판을 받고 있다. 적지 않은 야구 팬들은 안경현을 현대야구에 뒤처진 상당히 구시대적인 야구관을 가졌다고 평가 한다.[36] 사람들이 간과하기 쉬운것이 흔히들 세이버매트릭스의 지표라고 하면 WAR이라던가 WPA, FIP 등의 스탯만 생각하는데, 넓은의미의 야구통계 지표라는 측면에서는 클래식 스탯인 ERA(투수의 방어율)과 타자의 타율 또한 세이버스탯의 일종이라고 할 수 있다. 이것 또한 한 해, 혹은 여러 해에 걸쳐서 해당선수의 기록을 통계화 한 확률이다. 방어율은 투수가 9이닝을 던질 시 실점할 확률이나 마찬가지이고, 타자의 타율 또한 이 타자가 타석에 서서 안타를 때릴 확률이다. 확률이라서 믿을 수 없다면 투수의 방어율도, 타자의 타율 또한 마찬가지로 못믿는다는 말인데 이건 그냥 야구의 스탯이라는것 자체를 안믿는다는 말과 다를 바 없다. 세이버매트릭스의 모든 지표는 타자의 타율이나 투수의 방어율같은 클래식 스탯이 그 선수의 모든 가치를 설명하는데 모자란 부분을 채워주기 위해서 좀 더 많은 모집단과 영향을 주는 요소들을 고려한 또다른 스탯일 뿐이기 때문이다.