본문 바로가기 주요메뉴 바로가기

본문

광고

광고

기사본문

등록 : 2019.10.27 10:39 수정 : 2019.10.27 10:48

[한겨레21]
프로야구, 감에서 빅데이터 분석으로 바뀌어

“작년에는 7, 8회 투입해야 하는 선수(투수)들을 정해놨고 그 틀을 깨지 못했다. 이번에는 전력분석팀에서 주는 데이터들의 확률이 맞다는 걸 느꼈다.”10월14일 프로야구 플레이오프 1차전에서 SK 와이번스에 3 대 0으로 승리한 뒤 장정석 키움 히어로즈 감독이 한 말이다. 5~7경기를 치러 승부를 겨루는 프로야구 포스트시즌의 승패를 좌우하는 요소로 그동안은 감독의 ‘동물적 감각’이나 ‘기상천외한 작전’, 가을에 유독 ‘미치는’(뛰어난 성적을 보여주는) 선수 등이 꼽혔다. 하지만 2019년 프로야구 포스트시즌을 지배하는 열쇳말 중 하나는 장 감독의 말대로 ‘데이터’다. 전력에서 열세로 평가받던 키움은 데이터 기반으로 경기를 운영하며 플레이오프에서 지난해 한국시리즈 우승팀 SK를 꺾고 한국시리즈에 진출했다. 장 감독은 팀 투수들과 SK 타자들의 상대 전적 데이터를 철저히 분석해 ‘불펜 투수’(경기 중반에 나오는 투수)를 수시로 마운드에 올려보내며 SK 타자들의 타격을 봉쇄했다.

이는 장 감독 개인의 역량을 넘어, 미국 메이저리그에 이어 최근 2~3년간 한국 프로야구를 지배하는 ‘첨단 기술에 기반한 데이터 야구’의 활성화와 닿아 있다. ‘이름값’에 기대어 감독을 선임하던 흐름도 최근 데이터를 활용할 줄 아는 지도자를 발탁하는 추세로 변했다. 삼성 라이온즈는 최근 새 감독에 현장 지도자 경험이 없는 허삼영 구단 전력분석팀장을 선임했고, 기아 타이거즈는 메이저리그 출신 맷 윌리엄스를 감독으로 임명했다. 롯데도 미국 시카고 컵스 스카우터 출신의 37살 성민규씨를 야구단장 자리에 앉혔다. 모두 ‘데이터 야구’에 능한 이들이다. 이런 추세는 장 감독은 물론 데이터 활용에 능한 40대 중반~50대 초반의 염경엽 SK 감독, 이동욱 NC 다이노스 감독이 올 시즌 성적을 내며 팀을 ‘가을 야구’에 올려놓은 것과 무관치 않다.

2020시즌에는 데이터 야구가 한국 야구의 ‘시대정신’이 될 것으로 보인다. 데이터 야구는 야구의 미래를 어떻게 바꿀까.

야구 기록표의 시작은 신문

야구와 데이터는 원래 낯선 조합이 아니다. 야구는 기록에서 시작해 기록으로 끝나는 스포츠다. 보통 스포츠 기록은 순위나 승패 등 결과를 알려주는 데 그치지만, 야구 기록은 ‘과정’을 보여준다. 투수가 던지는 공 하나하나, 타자의 타격 결과를 기록원이 한땀 한땀 작성한 야구 기록지를 보면 직접 보지 않더라도 1회부터 9회까지 경기를 재구성할 수 있다. 하지만 최근 데이터 야구가 주목받는 것은 쌓아만 놓던 기록을 통계로 가공하고, 첨단 기술의 발전과 함께 ‘빅데이터’로 활용하기 시작한 야구 역사와 연결된다.

1846년 6월19일 미국에서 최초의 야구경기가 시작한 뒤 기록은 야구 역사와 함께 발전했다. 당시 야구 기록을 체계화한 주역은 ‘신문’이었다. TV 중계가 없던 시절 야구 소식을 활자로 전하려던 신문에 기록은 중요했다. 지금의 박스스코어(출전 선수, 회당 득점·실점, 안타·삼진 개수 등을 한눈에 볼 수 있는 기록표)를 고안한 사람도 헨리 채드윅이라는 스포츠 기자였다.

하지만 150여 년의 야구 역사 동안 쌓인 엄청난 기록은 경기 결과를 전하고 선수들의 성적을 정리하는 데 주로 이용됐다. 이 패러다임을 바꾼 것은 2000년대 초반 메이저리그에 ‘세이버메트릭스’(야구를 통계학·수학적으로 분석하는 방법론) 바람이 불면서다.

실화를 바탕으로 한 영화 <머니볼>로도 알려진 오클랜드 애슬레틱스의 성공은 기록을 통계학과 경제학적 분석틀로 활용하면 팀 전력 강화로 이어진다는 사실을 증명했다. ‘몸값’ 높은 선수를 무작정 영입할 수 없는 ‘가난한 구단’ 오클랜드의 단장 자리에 오른 37살 빌리 빈은 예일대 경제학과 출신 피터 브랜드와 함께 ‘저비용 고효율’의 야구를 추구했다. 세이버메트릭스 도입 이전에 ‘좋은 타자’를 가르는 기준은 타율과 타점이었다. 하지만 피터 브랜드와 여러 경제학자의 분석 결과 득점 확률은 타율·타점보다 출루율(야구경기에서 타자가 베이스에 얼마나 많이 살아 나갔는지를 백분율로 나타낸 수)과 장타율에 비례했다. 전통 야구에서 관심 밖의 기록들이었다. 빌리 빈은 이를 야구단 운영에 적용했고, 기존에 주목받지 못하던 선수들도 출루율이나 장타율이 높으면 저렴한 연봉을 주고 다른 팀에서 데려와 주전 선수로 경기에 내보냈다. 감독과 스카우터는 반발했지만 오클랜드가 2002년 20연승을 하는 등 강팀으로 성장하며 빌리 빈의 판단이 옳았음을 증명했다.

투수가 공 1개 던질 때 데이터 80~100개

세이버메트릭스가 데이터 야구의 1세대라면, 최근 야구는 첨단 기술 발전과 함께 ‘2세대’로 진화했다. 고성능 카메라와 군사용 레이더 기술을 적용해 공과 선수들의 움직임을 쫓는 트래킹(Tracking·추적) 시스템이 도입됐다. 메이저리그는 2015년 스탯캐스트(Statcast) 시스템을 구축해, 팀과 팬들에게 모든 데이터를 공개하고 있다.

한국은 2010년대 이후 구단별로 스포츠데이터 업체 ‘스포츠투아이’가 운영하는 카메라 기반의 투구/타구 추적 시스템(PTS)을 도입했고, 2018년에는 대부분 구장에 레이더 기반의 트랙맨(애슬릿미디어 운영) 장비와 시스템이 구축됐다. 추적 시스템 도입은 천문학적 데이터를 양산하기 시작했다. 신동윤 애슬릿미디어 이사는 “트랙맨의 경우 투수가 타자에게 공 1개를 던질 때 80~100개 데이터가 나온다”고 말했다. 과거에는 투수가 공을 던지면 공 속도가 평균 시속 몇㎞인지만 알 수 있었다. 현재 추적 시스템은 투수가 쥔 공을 마지막으로 놓는 위치가 어딘지, 공이 18.44m를 날아가며 얼마나 회전하는지(속구는 2천 회 이상), 공 궤적의 초속과 종속은 얼마나 차이 나는지, 공의 상하 좌우 움직임은 어떤지, 공이 포수에게 도달한 위치는 어딘지까지 실시간 측정된다. 타자가 공을 치면 발사 각도(타구 궤적과 지면의 각도)와 타구 속도 등이 실시간으로 잡힌다. 타자가 친 공이 경기장 내 도달한 좌표와 지면에 떨어지기까지 시간도 알 수 있다.

기존 홈런·타율·방어율 등의 기록이 선수들의 시험 성적표라면, 추적 시스템이 측정한 데이터는 선수들이 문제를 푸는 과정을 보여준다. 문제 풀이 과정을 분석하게 된 선수들과 야구단은 야구의 전통과 결별하고 ‘다른 야구’를 하기 시작했다. 대표 사례가 ‘뜬공 혁명’과 ‘수비 시프트’다. 뜬공 혁명은 메이저리그 타자들이 올려치는 스윙으로 ‘뜬공’을 만드는 데 집중하며 홈런 개수가 기하급수적으로 늘어난 것을 말한다. 세이버메트릭스와 추적 시스템의 협업은 타구의 발사각이 지면에서 26~30도, 타구 속도가 158㎞ 이상일 때 ‘홈런이나 장타가 나올 확률이 높아진다’는 분석을 내놨다. “공을 수평으로 치거나 내려치라”는 기존 타격 이론을 뒤집는 분석으로 타자들은 무조건 공을 퍼올려 치기 시작했다. 그 결과 메이저리그 30개팀 홈런 개수는 증가 추세(2018시즌 5585개→ 2019시즌 6776개)로 2019년 역대 최다 기록을 깼다. 한국 타자들도 발사각과 속도에 신경 쓰기 시작했다. 이를 적극적으로 훈련에 도입한 SK와 KT 위즈는 나란히 2018시즌 팀 홈런 1·2위를 기록했다.

류현진 슬럼프 탈출에도 도움

데이터를 근거로 타자에 따라 수비 위치를 극단적으로 옮기는 ‘수비 시프트’ 열풍이 메이저리그와 한국프로야구에 불어닥치기도 했다. 스포츠 전문지 기자 출신 최민규 한국야구학회 이사는 “과거 김성근 감독도 타자 성향에 따라 외야수의 위치를 옮기는 수비 시프트를 했다. 물론 단순하게 타구 방향을 기록해놓고 외야수들이 감으로 위치를 잡는 기초적인 방식이었다”고 말한다. 하지만 현재 시프트는 타자가 야구장의 어느 위치로 타구를 보내는지, 타구 속도는 얼마인지를 분석해 수비 위치를 조정한다. 야구장 오른쪽(우익수 방면)으로 대부분 타구를 보내는(당겨치는) 기아의 최형우 선수가 타석에 들어설 경우 내야수들이 ‘다이아몬드’의 오른편 1~2루로 위치를 옮기는 ‘최형우 시프트’가 대표적 예다. 올해 한국프로야구 선수들은 타자들의 데이터를 분석한 ‘페이퍼’(자료)를 주머니에 넣고 경기 중 수시로 꺼내보며 수비 위치를 조정하고 있다.

선수들의 ‘슬럼프 탈출 방식’도 바뀌었다. 꿈의 1점대 방어율을 기록하던 류현진(LA 다저스) 선수는 8월 갑작스레 부진에 빠지자 구단과 함께 데이터를 분석했다. “어느 순간부터 직구와 체인지업을 던질 때 팔 각도가 살짝 떨어지기 시작했고, 그로 인해 주무기인 체인지업이 좋지 않은 코스로 들어간 겁니다.”(네이버 류현진 MLB일기) 부진 원인을 찾은 그는 훈련으로 이를 수정했고, 9월 공의 위력을 되찾았다. 그동안 선수들의 부진을 심리적 요인이나 체력 저하로만 분석하던 것과 180도 다른 접근법이다. 한국 야구도 젊은 선수들을 중심으로 매 경기 뒤 데이터를 찾아보는 문화가 퍼지고 있다.

데이터 야구는 선수들의 능력을 최대치로 끌어올려 팀 전력을 강화하는 데 목표를 둔다. 하지만 데이터가 ‘기적’과 ‘감동’으로 대표되는 스포츠의 매력을 떨어트린다는 반론도 있다. 일찍부터 데이터 야구와 저널리즘의 접목을 시도한 최민규 이사도 “데이터가 실제 선수를 대체할 수는 없다. 경기 중에 벌어지는 여러 상황에 데이터를 적용하기 어려울 것”이라고 말한다. 데이터 야구로 한국 시리즈에 올라온 키움이 예상치 못했던 실책이나 (데이터가 보증하던) 구원투수의 부진으로 1·2차전 모두 두산 베어스에 패한 것도 데이터가 ‘신’이 아니라는 것을 방증한다.

데이터 야구의 목표는 재미

그러나 데이터가 야구를 즐기는 재미를 다채롭게 할 거라는 데는 대부분 의견을 같이한다. 신동윤 이사는 “미국의 스탯캐스트 관계자에게 데이터에 왜 집중하냐고 물으니, ‘선수 육성에도 도움이 되지만 야구의 재미를 늘리는 데 목표를 두고 있다. 그럴수록 팬들이 더 야구에 몰입하고 결과적으로 수익을 창출할 수 있다’고 답하더라”고 말했다. 실제 데이터가 실시간 공유되며 일반 팬들도 야구팀과 선수들을 직접 ‘분석’하기 시작했다. 신동윤 이사는 말한다. “데이터는 ‘야구란 무엇인가’라는 질문을 던지며 야구에 새로운 인사이트(통찰)를 준다고 생각해요. 야구라는 콘텐츠의 재미를 더하고, 결국 팬에게 다양한 즐거움을 줄 것입니다.”

이승준 기자 gamja@hani.co.kr

광고

브랜드 링크

멀티미디어


광고



광고

광고

광고

광고

광고

광고

광고


한겨레 소개 및 약관