close

Wins Avobe Replacement,WAR,身為現代棒球迷,不得不懂的數據之一。隨著電腦科技越來越進步,棒球統計也有更進步的方法,從以前因為沒有科技分析所以使用用紙筆就能計算的防禦率,打點,打擊率等數據,而現在既然有進步的科技儀器可以幫忙建檔,那麼跑迴歸分析,利用電腦記錄球員在場上一舉一動的貢獻是必然之趨勢。

其中,WAR又是賽伯計算學的集大成之作,Sabermetrics從西元1970年代嶄露頭角,經過40年的洗禮,終於在2008年左右找到了量化球員在場上"任何一舉一動"的方法,這是賽伯計算學從未辦到過的。現在他們有了WAR,球界最完美的數據-也是目前唯一可以量化球員"任何一舉一動"的數據。

不過WAR既然要量化球員的"任何一舉一動",他公式比較繁瑣,難懂是必然的。他也算非常新穎的數據,所以即使美國本地WAR已經很普及了,但在臺灣,球迷懂WAR到底是怎麼算的可能比例來講算是很少了。究竟WAR是怎麼算出來的,本文將一塊帶您了解!

~定義~

首先,我們在了解WAR怎麼算之前,就應該先了解定義。在講解定義之前,容我問個問題。有一天,從來不看棒球的老媽看到你在看球賽,指著電視的某個球員問:他的成績如何?強嗎?試問以下你回答的答案哪一個最容易讓你媽理解:

1.他今年有80分打點。

2.他今年打擊率0.295。

3.他今年的wOBA是0.355

4.他今年的長打率是0.432

5.他今年有3.80防禦率

6.他今年有17次救援成功

7.球隊有他,一年可以多拿下5勝.

  試問:在上述七個中,哪個比較讓"外行人"一看就懂呢?不是ERA,不是wOBA.外行人會知道什麼是防禦率,防禦率好壞的標準嗎?但是如果你跟外行人講球隊多了X可以贏Y勝,簡直是一目了然。這就是WAR好用的地方。

因為球員交出1WAR,他所屬的球隊在球季勝場數就會多一勝,你要比球員貢獻,不用把一堆各方面數據(打擊,防守,跑壘等等全搬出來),你只要了解球員可以給球隊幾勝,這樣就可以直接比較不同球員的貢獻值了。因此,WAR不僅是很先進很全方位的數據之外,他的意思還很簡單明瞭:1WAR=1勝。那麼,WAR公式到底要怎麼計算呢?首先,讓我們先從打者的計算開始。

1.打擊。

一名野手在場上,最主要的任務,打擊絕對是其中之一。舉2008年的Adrian Beltre來說,他當年的打擊三圍是.266/.327/.457,我們知道這是一份聯盟很常見的一份打擊成績,但有多少價值?我們永遠回答不出來。所以,要考慮球員在打擊區上到底有多少價值必須要有更進階的方法。首先,我們找出球員的wOBA. wOBA這個數據,在美國數據網站Fangraphs每位球員的個人成績檔案中都能查的到。

當然,既然本篇是解釋算法文,那我毫無疑問的要在這裡解釋wOBA要怎麼算。由於每年聯盟的投打消長以及聯盟環境不太相同,因此由電腦跑回歸分析的wOBA計算公式每年都會有一點點的微調,但影響不大,如果要求方便,FG網站都已經幫你算好好了,去查一下即可。那麼wOBA公式究竟怎麼算?

由於2014還沒打完,公式還不能確定,我們這裡就先拿2013的wOBA公式版本來解釋wOBA算法。公式如下:(0.690×uBB+0.722×HBP+0.888×1B+1.271×2B+1.616×3B+2.101×HR)÷(AB+BB-IBB+SF+HBP)。其中,uBB是非故意四壞球保送,HBP是觸身球,而IBB則是故意四壞,SF是高飛犧牲打。wOBA是靠著電腦長期建檔之後來算各種打擊情況的預期得分值平均。比如說公式中的2B,也就是二壘安打,之所以會乘上1.27,

就是因為整個球季平均下來,只要球員在該年在球賽中打出二壘安打,整年大聯盟的平均是打出二壘安打的該局,所有球隊平均可以在那局得1.271分。別誤會,並不是在該年某局打一支2B球隊就會在該局得1.271分。當然也有可能該局球隊打擊正好爆發拿個單局6分,但也有可能在該局一分都得不到。所以,wOBA給2B的加權1.27的意義是"該年平均"只要打出2B球隊在該局的"平均得分"為1.27,

因此,這是長期下來,也就是靠著一整個球季的資料檔案,在去做平均,這就是我們所謂的回歸分析,靠著電腦記載一整個球季的資料,再去求平均值。

解釋完wOBA的公式之後,我們取得了球員們的wOBA(也可以去FG查)。如果一名球員有.355wOBA,他的攻擊價值是多少?我們還是不知道。所以接下來要做的事是把

wOBA轉換成分數,對,就是棒球場上球隊可以打下幾分的那個得分數。(Runs)。把wOBA轉換成得分,我們稱這個數據為wRAA,這個數據跟wOBA一模一樣,在美國進階數據網站Fangraphs的球員個人頁面上都能查到這個成績。

怎麼把wOBA轉換成wRAA?當然,Fangraphs網站上都能查到數據了,但這裡還是解釋一下要怎麼算。wRAA公式如下:(球員wOBA-聯盟wOBA)÷1.277×球員打席。
"1.277"這個數字每年同樣會因為聯盟環境不同而有小幅微調,但影響不大,"1.277"為2013球季之數字。把Adrian Beltre在2008年球季的wOBA帶入公式,他該年球季的wRAA為3.9。3.9定義為何?由於wRAA的英文全稱是weighted "runs above average",顧名思義,
wRAA 3.9的意涵為"比聯盟平均打者多攻下3.9分",也就是說聯盟平均打者wRAA 0,Adrian Beltre可以比平均打者多為球隊攻下3.9分。wRAA算完之後,我們要再算入球場校正。為什麼?我們都知道,大聯盟球場有些利於打者,有些不利。在水手球場和落磯球場各打出20發全壘打,難度不同,價值當然也不同。Adrian Beltre當年在水手隊打球,所以理論上難度會比較高,他的帳面wRAA很不利,所以要經過球場校正調整。wRAA要怎麼球場校正?同解,校正過後的數據Fangraphs同樣能查到,但這邊依然解釋算法。
 
wRAA球場校正公式如下:
wRAA+(聯盟每打席的平均得分數- 聯盟每打席的平均得分數÷球場校正數值)×打席。
首先,什麼是聯盟每打席平均得分數?就是把大聯盟一整個球季所有的打席數除上該年大聯盟所有的得分數即是答案,不用自己算,同樣的,Fangraphs一樣查的到。2013球季這個數值是0.11,也就是說去年球季,大聯盟平均大概每9個打席會有1分產生,1個打席平均製造0.11分。
接下來,什麼是球場校正數值?這個在Fangraphs可以查的到,以1為基準,超過1越多就是越有利於打者的球場,低於1越多則有利於投手。2008年水手球場的校正值為0.96,該年聯盟平均每打席能製造0.12分,把所有元素丟下去算算,
經過校正之後,Adrian Beltre從原本的3.9 wRAA變為5.9。所以,可以說Adrian Beltre在2008年球季的時候他比聯盟平均打者攻下了5.9分的分數。也就是說WAR裡頭的攻擊端計算到這裡告一個段落,拿球員的wRAA去球場校正,得到的數字即是球員比聯盟平均打者多攻下(或少攻下)幾分。
 
2.防守
 
相較於比較麻煩計算的打擊,(但其實上數據都可以在FG網站直接查到),防守相對好處理。首先我們可以點進Fangraphs查詢球員個人頁面,上面都會有守備的成績,而這裡要查的是UZR做為計算守備的方法。
UZR和wRAA的定義一樣,只是他是防守端,意義是"比同守備位置的聯盟平均選手"多為球隊省下或丟掉幾分。如果一名游擊手的UZR是+5,那麼就代表他比聯盟防守平均值的游擊手多替球隊省下了5分的失分。如果一個左外野手,他的UZR為-5 ,那麼就代表他比聯盟防守平均值的左外野手多讓球隊丟掉了5分的失分。
如果有一名球員wRAA+UZR等於20,那麼就代表這個球員這兩項上數據加起來比聯盟平均球員多替球隊賺了20分。
 
3.守備位置加權
 
我們都知道,一個wRAA,UZR甚至其他加總數據差不多的一個游擊手,一個一壘手,很明顯,游擊手比較重要。因為游擊手在大聯盟的攻擊能力較弱,較一壘手難以取得,而且游擊防區顯然比一壘難守,在游擊區拿到UZR+5的難度比一壘還高。也就是說能在一壘達成這件事的人比在游擊還多。 
所以守備位置加權的用意就是,找出每個位置的守備難度。比如說大聯盟在右外野防區可以替球隊守下7.5分的人和能在一壘防區省下12.5分的人一樣多,
然後中外野能守下"-2.5"分的人和在右外野能守下7.5分的人一樣多(或難度一樣),那麼這三個的位置加權便是:1B: -12.5分, RF= -7.5分,CF=2.5分。
照上面的觀念,以下是各守備位置的加權。1B=-12.5分, 2B=2.5分,
3B=2.5分,SS=7.5分,RF=-7.5分,LF=-7.5分,CF=2.5分,C=12.5分,DH=-17.5分 (每162場比賽)。
假設有一個wRAA+UZR=20分的球員,他在球季守了150場的二壘,
那麼他能獲得的守備位置加權會是2.5÷162×150=2.31分,加上前述的20分,這名二壘手共可以幫球隊賺入22.31分。
 
4.跑壘
 
當打者同樣打一支很淺的一壘安打的時候,如果你一壘上的跑者是
Jacoby Ellsbury,他可能一口氣衝上三壘,Prince Fielder可能只能乖乖停在一壘上。
當打者打出很淺的外野高飛球,三壘上是Dee Gordon,Jose Molina,這兩個哪一個回來得分的機率比較大一目了然。所以,跑壘能力球員各有不同的能力差異,所以我們不能忽略他。那麼跑壘要怎麼計算?首先跑壘有兩個數據,一個是UBR,一個是wSB先解釋UBR.UBR的意思是"球員在壘包間的跑壘可以替球隊賺取或失去幾分",而UBR不算入盜壘,純粹是看擊球者在四個壘包間的跑壘能力。
 
解釋UBR算法,我可以舉個例子。
假設一出局二壘有人,擊球者把一個滾地球打向游擊防區,在大聯盟所有這種情況下,跑者上三壘然後打者出局的機率是20%,然後跑者停在二壘打者出局的機率是70%,
跑壘者在三壘被抓到,打者上壘的機率是5%,全部都沒抓到的機率也是5%.
然後在這種情況下,大聯盟該球季所有發生該種情況(跑者在二壘,一出局,打者擊出游擊滾地)的局數平均可以得到0.25分。 跑者進壘打者出局,該局平均可以得到0.5分.
拿0.5-0.25,這名跑者可以得到的分數是0.25分。 如果他停在二壘上,該局平均可以得0.23分,所以他能得到的分數是-0.02分。而這些分數就是跑者會拿到的UBR。
wSB則是把UBR沒有看的盜壘獨立出來看,UBR只看跑者在壘間的破壞力。wSB怎麼算?公式如下:SB×0.2+CS×(-0.384)+lgwSB×(1B+HBP+BB-IBB)。
 
其中,lgwSB公式如下:(SB×0.2+CS×(-0.384))÷(1B+HBP+BB-IBB)。
wSB帶入的是球員個人的跑壘成績,lgwSB則是帶入全mlb的數據成績。wSB和UBR同樣不用自己算,Fangraphs同樣查的到。
而UBR+wSB即是一名球員的總跑壘成績,如果有一個球員的UBR是3.0,wSB則是3.5,那麼這名球員一整個球季的跑壘可以為球隊帶來6.5分。
假設有一個wRAA+UZR=20分的球員,他在球季守了150場的二壘,
那麼他能獲得的守備位置加權會是2.5÷162×150=2.31分,加上前述的20分,這名二壘手共可以幫球隊賺入22.31分。如果這名球員的UBR+wSB=6.5,那麼他一季可以比"聯盟平均球員"多替球隊貢獻28.81分。
UBR+wSB不用自己算,FG網站已經算出了兩個總和起來的BsR,可以查詢取得。wSB和UBR單獨看,FG網站同樣可供查詢。
 
5.聯盟強度,環境差異
 
1955年和2015年的國聯環境一定不一樣,因此會根據該年聯盟強度加權。但影響不大,最大值球員大概只能在這項數據拿到3分左右,同樣不用自己算,查FG就有了。
假設有一個wRAA+UZR=20分的球員,他在球季守了150場的二壘,
那麼他能獲得的守備位置加權會是2.5÷162×150=2.31分,加上前述的20分,這名二壘手共可以幫球隊賺入22.31分。如果這名球員的UBR+wSB=6.5,那麼他一季可以比"聯盟平均球員"多替球隊貢獻28.81分。
然後如果他拿到的聯盟分數加權為2.5分,他 他一季可以比"聯盟平均球員"多替球隊貢獻31.31分。
 
6. 定義replacement level
 
WAR的意思就是算出"wins above replacement",也就是一個球員比replacenent的球員多贏幾場比賽。那麼,replacement球員是誰?又要怎麼定義?
首先,我先來解釋很多人常對這個詞的錯誤解讀:
Q: replacement level是0WAR球員,因為他沒有任何wins above.
而WAR的前提是0WAR球員到處都可以隨便取得,只要用底薪。但是問題來了,Lincecum在去年的WAR很靠近0,可是你說他還是簽了一張35M的約,所以他並不能隨手就能取得,但是WAR不是假設0WAR球員能隨手取得嗎?那這樣不就矛盾?
 
答:WAR在計算的時候,的確是要先在聯盟找到"replacement"是誰,那麼Lincecum是0WAR,所以成績上來講他應該會被找去計算,可是你會說他不是能被隨便取得,
所以這樣算很奇怪。
事實上是,WAR不會這樣算。他們在找大聯盟"replacement"的球員時,除了成績真的要符合,還會顧及下面兩個點:1:是否領底薪,2:是否能只以底薪的代價取得。Lincecum在這兩個點就會被刷,為什麼?第一,要符合上面兩個點,有下列球員符合定義。1.進入FA,但只簽下一張底薪約。2.能從球隊交易,DFA,或其他釋出名單中免費取得,然後他只要花你底薪。3.從小聯盟拉上來,他只要花你底薪.4.成績水平要在0WAR等板凳水準。
 
Lincecum領35M,他不是隨便取得,因此在計算replacement的時候,他們並不會考慮Lincecum,也就是說即使成績符合,但他不符其他條件,因此不能說他是RL球員。從上述四點,才是在計算WAR時對replacement level的定義。
那麼,RL球員要怎麼找?以下是找出RL球員的方法:1.球隊不用花費任何交易代價直接從DFA或其他釋出名單從其他隊找來的底薪0WAR等級球員,把這些球員成績收集起來做平均。
2.找出很接近大聯盟但還沒上大聯盟的球員。比如說大聯盟30支球隊陣中會帶5個外野手,大聯盟大概會有150個左右。把每隊最接近大聯盟的外野手(不是超級新秀,而是要找成績等級一直卡死在那邊,很難進步的外野手)如果是每隊找出1個這類的外野手
,那麼就是在找出在美國職棒系統151-181排名的外野手。而這個排名範圍內的球員都是RL球員的定義範疇。(其他守備位置以此類推)。DFA及釋出讓渡名單時時刻刻都會改變,所以小聯盟球員比較利於解釋計算算法。
由於小聯盟沒有進階防守數據,所以先用wRAA,單純看他們的打擊成績。wRAA則是電腦分析預測系統將他們的小聯盟成績進行分析,然後轉換預測這個球員升上大聯盟的wRAA會有多少。
經過計算這些小聯盟的球員,以及DFA等讓渡釋出名單的球員的成績之後(只看wRAA),然後看看這類球員的平均成績如何,即是RL球員的定義標準。
 
算出的結果大致上分守備位置的話,以下是RL球員的攻擊貢獻:
(大聯盟wRAA平均為0,越低越糟,然後這裡是假設這些所有RL球員
皆打滿600打席)
捕手: -30分
一壘: -10分
二壘: -22.5分
三壘: -22.5分
游擊手:-27.5分
左,右外野: -12.5分
中外野: -22.5分
每個位置不太一樣,但我們這裡把8個位置加總在平均,我們可以得到-20分,所以我們可以說,"大聯盟的Replacemet level球員"每600個打席會比聯盟平均球員讓球隊損失了20分之多。
所以,假設一整個球季大聯盟球隊會有600個打席分配給游擊區,而某個游擊手真的打了600打席,那麼球隊就不需要找RL球員打這些打席,RL球員一季會讓球隊損失足足20分,所以這個打了600打席的游擊手幫球隊省了20分損失。
那麼如今有一個游擊手該季在球隊中打了550個打席,剩下50個打席空缺,球隊最容易取得的替代方案就是找RL游擊頂這50個打席。
由於這個打了550打席的球員讓球隊在這550打席中不用找RL球員頂替,所以這個球員替球隊省下了20÷600×550=18.33分。
假設有一個wRAA+UZR=20分的球員,他在球季守了150場的二壘,
那麼他能獲得的守備位置加權會是2.5÷162×150=2.31分,加上前述的20分,這名二壘手共可以幫球隊賺入22.31分。如果這名球員的UBR+wSB=6.5,那麼他一季可以比"聯盟平均球員"多替球隊貢獻28.81分。
然後如果他拿到的聯盟分數加權為2.5分,他一季可以比"聯盟平均球員"多替球隊貢獻31.31分。
而這個二壘手在該季打了658個打席,20÷600×658=21.93,所以說
這個球員替球隊剩下了21.93分,加上剛才貢獻的31.31分,這個二壘手已經替球隊賺進53.24分。
另外值得注意的是,球員在RL部分替球隊省了幾分同樣不用勞煩我們自己算,Fangraphs同樣能查.
 
7.將分數轉換為勝場
 
可以替球隊貢獻53.24分的二壘手,他值幾勝?要問這個問題之前,我們必須要問:贏一場棒球比賽需要多少分數?幾分能轉換為一勝呢?
首先,我們把Bill James發明的畢達哥拉斯公式來求解。這個公式可以利用"球隊總得分"和"球隊總失分"兩項數據來推估球隊的預期勝率,既然是預期勝率,想當然爾就是完全扣除運氣影響的勝率期望值。
公式如下: (RS^2/RS^2+RA^2),RS為球隊總得分,RA為球隊總失分,^為平方。假設有一支球隊在一個球季中得失分都是775分,將數字帶入公式,會得到"0.500"這個數字,而這個數字即是這支球隊會有的勝率。一季可以贏81場球。
如果有一支球隊得分是765,失分則為775分,比剛才那個例子少了10分得分。把數字代入公式,可以得到"0.4935"的預期勝率,乘上一個球季162場比賽,這支球隊可以贏79.95勝,約80勝。
 
注意到了嗎?總得分少了10分,結果球隊會少一勝。
如果有一支球隊得分保持在775,失分則為785分,比五成勝率的那支球隊多丟了10分。把數字代入公式,一樣可以得到"0.4935"的預期勝率。
 
那我們把總得分往上加呢?
如果有一支球隊得分到達785,失分則為775分,比五成勝率的那支球隊多攻下了10分。把數字代入公式,可以得到"0.5064"的預期勝率,乘上162,約等於81勝,比80勝
還要多出一勝,所以,我們可以安心的說:贏一場棒球賽要10分,每10分可以轉換為一勝。
不過10分同樣是個大概值,每年會因為聯盟環境不太相同而有小幅微調,FG可以查的到幾分能轉換一勝。
所以,一個53.24分的二壘手可以轉換成幾勝?去年球季贏一場球賽需要9.264分,
因此53.24分除以9.264,約等於5.75勝,也就是這位球員有5.75勝可以貢獻給球隊,球隊擁有他會多贏5.75場球賽,所以,這位球員便是5.75WAR.所以,我們把WAR算出來了。
不過這只是野手的WAR,至於投手的WAR要怎麼算,接下來會在寫作一篇。
歡迎指正(≧∇≦)
 
arrow
arrow
    全站熱搜

    高睿鴻 jerrykao 發表在 痞客邦 留言(2) 人氣()