The Pinstriped Morningside Heights

Friday, February 17, 2006

Pitchers and Catchers Report, so Does This Blog

投捕手終於報到了，冬天也終於接近尾聲。

由於今年冬天 FA 市場比起過去幾年來更為缺乏會有重大影響力的球員，所以過去幾個禮拜大家幾乎都沒有什麼話好說。現在應該是時間看一下明年的展望了。今年 AL East 的 contender 一般認定是 Yankees、Red Sox 和 Blue Jays 三隊。我們從 Pecota 的 WARP 和 VORP 來看看他們的預期。WARP 事實上已經包含了 VORP 加上防守的貢獻，不過由於防守評估及預測的不易，我們還是連 VORP 一起看一下比較清楚。

Yankees:

C Posada 4.6/28.5
1B Giambi 3.3/30.8
2B Cano 3.7/21.1
3B A-Rod 8.8/76.4
SS Jeter 6.6/49.9
LF Matsui 4.8/32.5
CF Damon 5.3/29.5
RF Sheffield 6.9/56.2
DH Williams 1.8/7.7
Andy Phillips 2.0/8.5

Sum: 47.8/341.1

由於 Yankees 這一季可能會用 DH 這個位置來讓 Giambi、Sheffield、Matsui 甚至 Damon 輪流休息，所以 Bernie 不會得到所有的打席。我把 Phillips 一起算進來，算做一組 platoon。去年同樣一批球員的 VORP 總和是 447.2，不過 Pecota 給他們的預期是 335.7。我沒有針對 Pecota 做大規模比對，不敢說他們有普遍的低估球員表現的傾向。一般認為去年的 Yankees 除了 Posada 和 Bernie 之外幾乎所有的人表現都比預期要好，所以他們去年實際表現的 VORP 高出 Pecota 預期達到 111.5 分並不能期待他們可以複製。

不過我們從去年和今年的 Pecota 預期多少可以看出這個程式在做修正。下面數據分別是 2005 Pecota VORP/2005 Actual VORP/2006 Pecota VORP

Posada 39.5/32.6/28.5
Giambi 26.5/58.4/30.8
Cano 7.0/27.5/21.1
A-Rod 60.3/99.7/76.4
Jeter 46.6/66.3/49.9
Matsui 33.8/53.0/32.5
Damon 33.8/49.2/29.5
Sheffield 49.9/56.5/56.2
Williams 27.9/7.3/7.7

Pecota 是按照球員過往成績來找尋跟他們同年齡時表現比較接近球員接下來的成績以做出預測。在 Yankees 這個充斥超過卅歲球員的隊伍裡，成績還要進步是不太容易的。那些 Pecota 預測居然還往上漲的球員中，除了 Cano 以外，都是理論上已經達到巔峰而不應該再進步的了。從這裡來看，我們應該可以說 Pecota 去年低估了 Yankees。今年是否還有低估？不是說不可能，但是程度應該不會像去年這麼大了。

事實上 341.1 VORP 這個數字以預測來說算相當不錯了，不過在沒有比較的情況下不容易看出好壞。我把 Red Sox 一起列出來：

Red Sox:

C Varitek 4.7/29.1
1B Youkilis 3.0/13.5 Snow 1.3/1.8
2B Loretta 4.0/22.7
3B Lowell 3.7/17.8
SS Gonzalez 3.1/15.9
LF Ramirez 5.5/49.8
CF Crisp 4.9/27.4*
RF Nixon 3.4/18.3
DH Ortiz 5.3/60.9

Sum: 38.9/257.2

* Coco Crisp 的 WARP 和 VORP 是以 LF 來計算，若是移到 CF 雖然防守上要打點折扣，但是 WARP 和 VORP 兩者都會在往上加一些。他的 VORP 會超過 Damon，WARP 大約相當。

Red Sox 的 lineup 不像 Yankees 一樣那麼確定，Alex Gonzalez 有可能會被 Dustin Pedroia 取代，Youkilis 也可能讓 Snow 沒有上場機會。Lowell 如果沒有辦法反彈回來，他也有可能失去他的先發位置。就以目前我們看到的這個 lineup 來講，他們的 Pecota 預測比 Yankees 低了 84.9，大約是八場到九場之間。

今年冬天製造了許多噪音的 Blue Jays 還比 Red Sox 再少個六場到七場勝場，所以我就不列出來了。在一切交易及 FA 簽約塵埃落定後，Jays 並沒有大家想像的好，他們在打擊上還是落後 Yankees 及 Red Sox 一段不小的距離。

除非受到傷兵影響，今年的 Yankees 的打擊的確比去年球季開始的時候看起來要好。這似乎不用多說，任何一個主流媒體也看得出來。接下來我們再來看看個別球員和投手。

// posted by CCLu @ 2/17/2006 09:21:00 AM 15 comments

Comments:

Hi,
Are those PECOTA numbers 50th percentile numbers？If they are, then I don't see PECOTA predict improvement for anyone but Bernie. Or the improvement you mean is relative to 2005 PECOTA numbers?

# posted by

Andre : 2/17/2006 2:02 PM

Red Sox部分你好像忘了 David Ortiz?
如果加上去那就差不多了吧！

# posted by

Bei-Chun : 2/17/2006 10:39 PM

To Bei-Chun,

David Ortiz 在打字時忘了列出來，不過在我的 Excel spreadsheet 上沒有漏掉。總和仍然是對的。

# posted by

CCLu : 2/18/2006 6:20 AM

To Andre,

BP 說這是 weighted average，跟 50% 相距多遠就要看分布是否對稱了。

印象中去年及以前他們在點估計上用的是 50 percentile，使用 weighted mean 應該是今年的事情。隨手看了幾個人，雖然分配多半不是對稱，但是相差不會太大，而且左偏或右偏也沒有一致性。

由於年紀的關係，在預測上絕大部份 Yankees 都應該持續走下坡。如果今年的 Pecota 反而比去年 Pecota 高，那就足以表示去年成績高過預期的已經太多而使得整個分配必須重新考慮，不能簡單的以誤差來看待。以 Yankees 的例子來看，幾個去年預期和實際表現相差太多的人去年應該是被 Pecota 低估了。Damon 和 Matsui 是兩個反例，Pecota 今年的預期比去年的預期還要低，即便他們去年實際表現成績也超過預期不少。A-Rod 是實際表現超過預期最多的 Yankee，今年的 Pecota 向上修正不少。

# posted by

CCLu : 2/18/2006 6:32 AM

因為PECOTA是用過去三年的加權作為基線，去年表現好基線自然上升，所以今年PECOTA比去年高是很合理的現象。

# posted by

Andre : 2/18/2006 9:50 AM

To Andre,

你說得沒錯，不過不是我想談的重點。

Pecota 的特色在於
1. 使用跟球員類似的以前球員成績來對未來做預測，而非僅由該球員自己過去的成績來看。
2. 使用 interval forecast，而不只是通用的 point forecast。

Bill James 的預測也使用了第一點，以這部份來講他才是先驅，Pecota 只是跟隨他的腳步而已。Pecota 真正有趣的是第二點。

可能有些其他的人不太清楚什麼是 interval forecast，什麼是 point forecast，我花點工夫解釋一下。通常我們預測某球員明年會有 .290/.387/.450 的成績，或者說 35 HR, 107 RBI 之類的數據，這些叫做 point forecast，是眾多可能出現的數據中的期望值或者是最可能出現的數據。

由於下一個球季的成績在沒有打之前我們不可能『觀察』到，這些數據可以被視為隨機變數 (random variable)。隨機變數在事後可能只有一個觀察點，但是在事前我們不知道這個點到底為何，只有一個主觀的機率分配。以 Pecota 為例，Baseball Prospectus 2003 以降列入書中的 Pecota 數據只有一點，早先是否只是 50 percentile 不復記憶，現在一律是 weighted mean。在 BP 網站上他們讓訂閱讀者下載的 Excel 檔案也是一樣的東西。不過在每一個球員的 Pecota Card 裡面，他們列出了 10, 25, 40, 50, 60, 75, 90 percentile，讓大家對球員有何種表現的 Pecota 主觀機率為何有更好的概念。我們舉例來看，如果有兩個球員的成績預期都是 35 HR，在一般的 point forecast 裡面我們的資訊就到此為止了。但是如果

Player A: 90per 55HR/50per 35HR/10per 15HR
Player B: 90per 42HR/50per 35HR/10per 28HR

* per 是 percentile 縮寫。

這兩個球員的風險是不同的。原因也許是 A 球員的 HR/PA 比 B 好，不過他比較容易受傷，所以沒有受傷的話會打出不少全壘打，但是受傷了的話出賽時間會受到限制，以致於全壘打數會很少。player B 相對來講就穩定許多。當然這也有可能是受傷以外的因素，不過以全壘打這種被視為球員能力的數據來講，要有 A 那種劇烈變化大概非靠受傷不行。

Nate Silver 在 BP 2003 介紹 Pecota 時強調了 variation 的重要。預測是避免不了真實成績出現 variation 的，與其說這是不可預期的因素不如說這是不可避免的現實。在預測時連 variation 都預測進去是比只做點預測要更進一步的。

回到我之前想要談的問題。Pecota 使用 "Most Comparable Player" 來作成績預測理論上會比拿過去幾年成績直接做一個函數來預測要來的變異數小一些。球員過了卅歲以後成績表現是很現實的，絕大多數的人都逐漸走下坡，只是速度有快有慢而已。除非單季成績變化太大導致 "most comparable player" 這個名單都發生劇烈變化，否則 Pecota 預期不應該會受到太大影響。只要是拿差不多的同一批人來預測，成績大概都會逐漸往下走。以今年的 Pecota card 來說，應該看到的就是從 2006-2010 的預測中 WARP 和 VORP 這些數字一年比一年低。

由於相當程度的 variation 是必然會發生的，所以前一年 Pecota 預期如果不太離譜的話，我們不預期跟球員最接近的過往球員名單有很大變化，因此像 Yankees 這些超過 30 歲的球員他們今年的 Pecota 預期多半是應該要繼續往下走。Derek Jeter 去年實際 VORP 比 Pecota 預期多出 19.7，這只讓他今年的 Pecota 預期增加 3.3 而已(從 46.6 增加到 49.9)。Matsui 的實際表現比 Pecota 預期多出幾乎相同的 19.2，不過他的 Pecota 預期仍然呈現下降的趨勢 (33.8 到 32.5)。對於理論上已經過了巔峰期的球員，單季表現超過預期甚至前面幾個球季的成績並不是太稀奇的事情，但是要能夠脫離先前的預期到連跟他最相近的球員都要大翻修就不太容易了。A-Rod 的變化是最誇張的。他去年實際成績超過 Pecota 預測的幅度非常大，VORP 差了 39.4（60.3 的預測，實際表現是 99.7）。大部分球員一整個球季下來累積的 VORP 都還沒有 39.4。更驚人的是他今年的 Pecota 預測比去年多了 16.1，這個變化是相當大的。這種劇烈變化原因不只是去年成績好，更仔細去看他的 BP Pecota card 可以看到他的 similarity index 並不算高，只有 27。換句話說能夠拿來跟他比較的其他球員並不是那麼相像，以致於預測的變異可能會更大些。

拿 Matsui 跟 A-Rod 比較，他的 similarity index 高達 47，也就是說從歷史來看他的類型是比較固定的，變異就會小些。以去年的情況來講，A-Rod 相對於 Pecota 的好表現有很大程度是 Pecota 無法掌握他的能力，而 Matsui 則較大程度是運氣好。

談到這裡必須提一下 Pecota 有一些先天的限制。對於 Randy Johnson、Roger Clemens、Barry Bonds 這一類年紀大且有歷史性表現的球員我們幾乎無法從歷史資料找到足以跟他們相比的球員，這幾個人的 similarity index 都是個位數。對於這些人的預測多半得從他們自己的成績和健康來看，Pecota 的預測不會比你我好到哪裡去。對於 A-Rod、Albert Pojols 這種球員 Pecota 所能夠提供的也有限，他們的 similarity index 也都不太高。尤其是 Pujols，他只有 16 而已，像他這麼年輕就有這麼好表現的球員實在不多。

Gary Sheffield 是 Yankees 裡面另外一個讓我意外的球員。從 Pecota Card 看來他除了打擊姿勢以外，成績表現也是相當與眾不同的。

# posted by

CCLu : 2/21/2006 12:16 AM

這篇那麼長又詳盡的解說放在comment裡會不會太可惜了點

# posted by

coe : 2/21/2006 2:50 AM

大大您好：
不好意思請教您一個問題
有沒有專門統計美國職棒的觀眾人數
以及他的人口統計變項的相關網站
或是書本資料可以參考啊

在此先謝過

# posted by

惡搞金剛高中 : 2/21/2006 9:51 AM

"只要是拿差不多的同一批人來預測，成績大概都會逐漸往下走。以今年的 Pecota card 來說，應該看到的就是從 2006-2010 的預測中 WARP 和 VORP 這些數字一年比一年低。"

Well, Yes.

不過不論comparable player list的組成有沒有變化，球員到了一定年紀他的comparable players的趨勢應該會是向下的，不過只要今年的好表現能夠把baseline提高到一定程度以上，那麼他的projection就會比去年高了。

Ex.
假設A球員去年的baseline是100，預測會下滑6%，那麼他去年的projection是94。
今年他打得好，把baseline提高到104，而因為他老了一歲所以變成預測下滑8%，那麼他今年的projection就是95.7。

Btw, 其實我覺得weighted mean這東西似乎實際上的意義不大，我不覺得有必要特意去抵銷Giambi effect。

weighted mean本身不代表什麼特定意義，硬要說大概是對球隊的平均可能貢獻程度，而且我不太知道他們是用怎樣的methodology或者threshold來減低表現太差的可能性帶來的影響。wighted mean充其量似乎只是以球隊整體而非球員本身為出發點，多加入些風險考量的數字。

# posted by

Andre : 2/21/2006 2:40 PM

to 惡搞金剛高中:

各支球隊的觀眾人數資料在 espn 就找得到了。
http://sports.espn.go.com/mlb/attendance

關於各地的人口統計，美國的 Census Bureau 應該有最完整的資料。

# posted by

walaykao : 2/22/2006 2:16 PM

To Andre,

我看不懂你在談得 weighted mean，不知道是否誤解了 Pecota 的原意。Weighted mean 是球員的預期成績，由他的成績分配計算出來的，與他的隊友無關。

http://www.baseballprospectus.com/glossary/index.php?mode=viewstat&stat=196

從 BP 2003 Nate Silver 的 Pecota 介紹裡我們看到他們的做法是先從球員過去三年記錄以及年齡等參數找出跟他們比較類似的球員，然後依據這些過去球員的 similarity index 以及接下來的表現推算我們要討論的球員接下來的表現。

Hediki Matsui 和 Derek Jeter 是兩個適合在這裡拿來比較的例子。他們的 2005 VORP 超過原先的 Pecota 預期約略相當，但是 2006 的 Pecota 預期受到這個誤差的影響卻不同。由於 Matsui 可以找到較多跟他類似的球員，所以 Pecota 預期如常理般下降，他已經過了巔峰期，成績不太容易隨著年齡進步了。Jeter 則不然，Pecota 原先對他的預期的可信度就較低，以致於 2006 逆勢上漲，這以他的年齡來講是不容易的。

Pecota 並不是拿過去成績直接預測未來成績，他們之間並沒有一個固定的函數關係。BP 的做法是拿過去成績找到一批球員，然後拿這批球員接下來的表現來做出 Pecota 預測。這些球員扮演了一個 filter，破壞了過往成績與未來成績的簡單函數關係。當然我們仍然可以廣義的說這些成績之間仍然存在某種『函數』關係，不過那不太可能用任何一個多項式表達出來。

當球員表現跟 Pecota 不同時，對於他們到底跟哪些球員接近當然會有影響，不過影響程度可能不如想像中來的大。比較一下 Matsui 和 Jeter 的 Pecota card 就很清楚了，在跟 Matsui 相似的球員中並沒有太多人位置上升或下降，但是在 Jeter 那一邊則不同。如果相似球員的 pool 和這些球員相對順位沒有太大改變，我們就會看到像 Matsui 這樣新一年的 Pecota 仍然比前一年預期稍低，畢竟跟他能力相近球員在相近的年齡時成績也是逐年下滑得。

Jeter、A-Rod、Pujols 甚或 Big Unit、Clemens 和 Bonds 這些在歷史上沒有太多人跟他們類似的球員比較可能因為前一年的表現而改變整個 pool，遑論裡面球員的順序。事實上後面這三個準名人堂球員根本就沒有多少人跟他們類似，與其看 Pecota 恐怕還不如看 Will Carroll 的 Team Health Report 和 Under the Knife 專欄來瞧瞧這些人的健康狀況有用。

# posted by

CCLu : 2/25/2006 2:00 AM

看過 Will Carroll 的 Team Health Report 後第一個感想是 — Wow, 紅潮。
如果 Carroll 再嚴謹一點搞不好只得一個綠燈........

倒是給了 Cano 一個黃燈令我有點意外。

# posted by

kan tong : 2/25/2006 5:00 AM

我沒有說跟隊友相關啊，我想你是不是弄錯Giambi effect的意思了。

如果一個球員realize了PECOTA預測15%的糟糕成績，那麼很可能他會丟了先發位置。有許多球員的playing time是會隨著表現的優劣而有一定幅度的變動，這個情況稱為Giambi effect，這個Giambi是指Jeremi而非Jason。

理論上一個球員的表現的期望值應該就是他每個percentile的mean，但BP不直接用平均而用weighted mean的功用就在於試圖移除Giambi effect的影響。

# posted by

Andre : 2/25/2006 11:47 AM

To Andre,

我誤解你的原意了。原來在討論的東西並不是這個角度，我沒有想到你在談這件事情。

我當然知道去年的好表現可以提高次年 PECOTA 預期的 baseline，我只是要說這並沒有如一般的函數那麼容易。同時在大部分 Yankees 都在 "wrong side of 30" 的情況下，他們必須把 baseline 上修不少才能夠讓今年的 PECOTA 在隨年齡增長而下降的情況下居然還能比去年的 PECOTA 高。Most Comparable Players 的 pool 對於不少球員來講相當有限，即使在實際成績有相當大變化的情形下，這個 pool 的變化並沒有那麼大，從而限制了次年 PECOTA 預測所使用的數據。我早先比較 2005 和 2006 PECOTA 發現有些球員逆勢上漲，所以我提出來去年的 PECOTA 可能低估了不少 Yankees 的球員。這一部份的邏輯是這樣子的。當然，如果是一個僅只拿前三年數據用普通函數預測次年成績的程式，我們當然也會按照球員年紀來打折，出現的模式也可能類似，但是我認為 PECOTA 這個系統下由於一些明星球員他們的獨特性（低 similarity index）會使得這種『低估』更為難得。更多情況下實際成績的差異和 PECOTA 的差距會只被視為這個 random variable 的 realization 偏離 distribution 的 mean，而不會將原先認定的 distribution 都必須做相當大程度的修改。一但要做後面這種程度的調整，那麼 PECOTA 在前一年的預測就可以被視為偏差相當大了。

球員表現的期望值未必是這裡公佈出來的每個 percentile 的 mean，這後面還要做不少關於 distribution 的假設。

Jeremy Giambi effect 的影響在討論先發球員時沒有那麼大，尤其是 Yankees 這些人，他們落在較低的 percentile 的原因主要是受傷而不是能力的問題。在 Red Sox 部份可能問題比較大，有幾個先發位置最後可能會換人，可是整體來說影響應該有限，我想我們這裡不需要擔心。

# posted by

CCLu : 2/25/2006 12:43 PM

PECOTA 是 Baseball Prospectus Premium 的內容，要訂閱才能看。

# posted by

CCLu : 3/03/2006 10:07 AM