Tuesday, April 29, 2008

書摘:Baseball Between the Numbers

這本書討論和棒球有關的數字, 目的協助讀者更進一步了解棒球

這書的副標題寫的是: Why everything you know about the Game is Wrong. 中文翻成:你對棒球的原來觀念都是錯的! 為甚麼?


這本書的作者群來自於Baseball Prospectus 的統計專家, 這本書討論的學問叫做 Sabermetrics 中文說成:用統計學的方法研究棒球的數據, 英文解釋是 Sabermetrics is the analysis of baseball through objective evidence, especially baseball statistics. The term is derived from the acronym SABR, which stands for the Society for American Baseball Research. It was coined by Bill James, who was among its first proponents and has long been its most prominent advocate known to the general public.

摘要一段


投手的表現很難預測, 影響投球的因素很多, 投球是很不自然的動作, 對身體的壓力大, 投手身體容易受傷. 投手一受傷, 投球的品質就會受到影響.

Won-Lost record: 先發投手最常被提的就是贏球的場數, 一季的球賽如果能贏20場以上, 就會被視為優異, 賽揚獎也常常頒給贏球最多場的投手, 但是用這個標準來比較不同投手的表現, 問題很多.
  • 投手能控制的只有防止對方得分, 投手不能控制隊友得多少分, 如果隊友攻擊表現不好, 投手表現再好, 贏球的比率也不會高.
  • 進一步說防止對方得分部分也不是先發投手完全能控制的, 現在的球賽, 先發投手多半無法投完全場, 投了五局以後, 需要牛棚的中繼投手來接手, 所以先發投手本身能影響球賽勝負的部分其實只有前五局部分
  • 還有防止對方得分部分也不是投手完全控制的, 隊友守備如何也是重要的, 還有運氣等等因素
總結用贏球賽數目的多寡來評估先發投手的表現好壞, 是很不精確的

Earned Run Average(ERA): 很久以前, 棒球界就知道用Won-Lost record來評估投手的表現不精確, 後來就發展出ERA, 這個ERA也是有問題.
  1. 如何區分哪些是Earned Run哪些不是, 是主觀的, 同樣一顆界內飛球, 沒有隊友跑去接, 那表示球的落點好? 這會被算是投手的帳, 相似的一顆界內飛球, 有隊友跑去接, 也接到球啦, 那就表示投手投的好? 這球算高飛球接殺, 很會接飛球的Andruw Jones輕而易舉可以接到的飛球, 如果是Bernie Williams在守備的話, 很可能會變成二壘安打, 好的守備肯定會壓低投手的ERA, 壞的守備會升高投手的ERA, ERA當初良好的本意是想區分出哪些失分是投手的錯哪些失分不是, 可惜這絕對是不實際的幻想. ERA還是無法區別出隊友防守和投手的表現(做不到就是做不到)
  2. 不討論輸贏, 那麼就產生一個問題, 球賽的結果就是贏或輸, 這才是球迷最關心的, 所以不是投手失去的每一分都該有一樣價值, 一場比賽輸了10分後再輸一分沒差 反正比賽輸了 平手輸了一分那可不得了, 輸贏就在哪一分之差啊, 同樣失一分會有不一樣的含義 贏了好幾場比賽, 表現非常好的投手, 有一天在一場球賽了被打爆了, 他的ERA會馬上往上竄, 投手只要一場表現不好, 整體ERA都受影響 因為ERA沒有考慮比賽輸贏, 所以ERA就無法正確反應出個別分數的不同重要性.(見樹不見林)
  3. 兩個有同樣被安打數目和保送數目的投手, 如果投手的運氣好, 這些安打和保送分散在不同局, 投手就不會失分, 只看失分, 沒有注意到這些安打和保送是不是有聚集的現象. 投球只是普通好, 每一局都驚險度過, 因為最後沒失分, 和掌控全場比賽的投手ERA是一樣的, 這樣無法正確反應出投手的投球內容.(粗略不夠微觀)

Run Average: 既然無法區分出哪些失分是投手的錯哪些失分不是, 那就把投手和隊友防禦的能力合在一起描述, 但是這樣還是有ERA同樣的問題,


PERA(Peripheral ERA):這是根據被安打數目, 保送數目, 三振數目, 和全壘打數, 同時考慮安打保送有否聚集的運氣成分, 算出來的假設的PERA, 這個PERA可以解釋成, 下次這位投手再出場比賽時的預測失分數, 比上述的ERA, RA更能正確預測下次比賽的失分, 對觀眾來說, PERA更真實反映投手的能力, 這比ERA, RA好一些, 但還是無法區別出隊友防守和投手的表現, 也沒有討論輸贏對每個失分的加權效應
  • PERA和ERA一樣, 沒有排除掉隊友防禦能力的影響. 投手後面有很會接飛球的防守隊友會對PERA有正面的影響. 所以PERA還是不完全代表投手的能力.
BABIP(Batting average on balls in play) 這個把投手防禦和隊友防禦能力合在一起的數據,j完全無法區別出隊友防守和投手的表現.

Defense-Independent Pitching Statistics(DIPS)(和隊友防守能力無關的投手表現統計) 統計出投手比較能控制的是 滾飛比 奪三振率 四壞球 全壘打(這四個項目投手最有控制, 其中全壘打因為風向, 球場形狀受影響, 沒有滾飛比穩定) 把這些指標巧妙的合在一起可以導出一個假設的DIPS ERA, 這更能表示投手的能力(和隊友防守能力無關)
  • 問題是如何合在一起產生新的數據, 這些數據可信嘛? 例如 Support Neutral Statistics: Baseball Prospectus提出一個評估數據是SNLVAR(Support-neutral Lineup-adjusted Value Added Above replacement) 舉例來說 2005年 火箭人Roger Clemens 有 9.4 SNLVAR (這是那年度裡美國大聯盟投手之中最高的, 這數據表示說火箭人他2005年的投球內容比起一個能力平均的投手, 面對一個攻擊能力平均的敵隊, Roger Clemens能替一個攻擊平均並且防守平均的球隊多贏9.4場比賽. 當然我們也沒忘掉, 去年2007火箭人在洋基表現就蠻普通. 2005年SNLVAR表現最好的並沒有成功預測出2007火箭人還是表現良好)

總結的說,

任何包含球賽輸贏的投手統計都有下面根本的缺陷(Won-Lost record)
  1. 無法區別出隊友攻擊能力和投手的表現
  2. 無法區別出隊友防守,防守運氣和投手的表現
  3. 無法區別出牛棚投手和先發投手的表現

任何包含喪失分數的投手統計都有下面根本的缺陷(ERA, RA, PERA)
  1. 還是無法區別出隊友防守和投手的表現
  2. 也無法完全區別出牛棚投手和先發投手的表現
  3. 無法正確反應出個別分數的不同重要性(一場輸十分和十場各輸一分當然不一樣)

任何包含安打數目的投手統計都有下面根本的缺陷(BABIP, WHIP)
  1. 無法區別出隊友防守和投手的表現
  2. 無法正確反應出個別安打不同重要性(一場十支安打和十場各一支安打當然不一樣)
  3. 無法區別長打和短打(長打易失分)

只包含 滾飛比 奪三振率 四壞球 全壘打(組合)的投手統計都有下面根本的缺陷(如DIPS ERA)
  1. 雖然這些數據是和防守無關的, 好像真好! 確實是評量投手表現的好指標 但這些是投手表現的全部嘛? 當然不是, 要讓打擊者出局的方式很多種(輸贏的方式百百種), 可以高飛球接殺, 可以雙殺, (飛不遠的高飛球很難量化), 這些要隊友守備的幫助, 當我們只注意和防守無關的投手數據, 我們看到的投手表現一定是投手表現的一部份. 有一個研究說, 投手表現和BABIP完全無關, 真的嘛? 這引起很大的爭議, 後來有反對的研究結果說, 投手只能影響BAPIP約28%(另外Luck 44%, Defense 17% Park 11%). 注意窩, 這是指平均, 同樣的數據未必能套用在個別投手. 就像王建民先生, 滾飛比很高, 王先生能影響的BAPIP應該比較高.(投手和防守隊友的巧妙結合, 也是好投手的重要特質. 王建民被打出來的球就比較好防守, 不是嘛?)
  2. 不考慮輸贏的指標都不會是棒球的全部: 例如投十場 一場球爆了九場好投, 那樣只會輸一場贏了九場, 和投十場五場好投五場普通, 最後贏了六場, 前面情形的投手對球隊的貢獻多多了.但是微觀的數據看不出來(見樹不見林)
  3. 如何使用這些微觀的指標也是問題, 這些指標對球賽的輸贏不是線性的貢獻, 三振率達到一個臨界值之後, 投手基本上就掌握這個比賽,超過臨界值三振率再高增加的好處不是線性的增加(一局只有3個打者), 三振率往下掉到一個程度, 再低也不會更差(要靠其他方式讓對手出局, 高飛球接殺, 雙殺, 這都要靠隊友防守), 同樣的 滾飛比高到一個臨界點, 投手和防守隊友合作, 基本上也可以掌握這個比賽, 滾飛球超過臨界點再高增加的好處不是線性的增加(一局只有3個打者, 一個雖然上壘, 然後來個雙殺, 對手一樣不會得分), 滾飛比低到一個程度, 再低也不會更差(要靠其他方式讓對手出局, 高飛球接殺, 這要靠隊友防守, 或是三振 這要靠投手自己),所以這些數據不是簡單加加減乘除就能反應投球的內容, 這些都只是瞎子摸象一樣的單一指標, 就像王建民, 在2006和2007年的三振率都不很高,但是滾飛比達到一個臨界值, 雙殺多, 讓王建民最後都拿到一季19場勝投, (勝投多不代表投球內容一定比別人好, 但是如果每年勝投都比別人多(2006, 2007, 2008), 那合理的推測, 投球內容可能真的比人好, 最後結論是投球內容還沒有一個完美的橫量標準啊) (微觀見樹不見林)
統計上, 一個投手每年表現的相關性來說
  • 滾飛比 最高 .8
  • 奪三振率 高 .79
  • 四壞球 高 .67
  • 被安打比率 普通 .49
  • 被全壘打比率 普通 .47
  • ERA 只有 .38
  • BABIP 只有 .272
  • Won-Lost record 只有 .204






Monday, April 28, 2008

書摘: Bad Luck And Trouble

Bad Luck And Trouble 這本小說的作者是Lee Child
這是一本 Thriller, 這個詞中文解釋成 玄疑復仇探險偵探, 英文解釋成 'a suspenseful adventure story or play or movie adventure story, heroic tale - a story of an adventure'

這本小說 主要做為消遣(如等飛機) 文字描述好, 讓讀者能在腦中畫出景象


男主角在小說描述的特定時空環境下-根據叢林法則復仇的, 殘暴的敵人和不明危險隨時出現的時空環境下, 男主角是最強的腳色, 但在現實文明世界裡, 作者把男主角描述成一個無固定住所, 無固定工作, 無固定伴侶, 長期在破產邊緣的人物. 雖然是21世紀, 男主角選擇像原始人那樣的生活著, 男主角喜歡講 I don't make plans. 當然啦, 不肯做長期計劃的人活在現代的社會, 不會太成功, 這點作者的觀察很好.

感想
  • 強弱的定義離不開時空環境, 鯊魚在海底是最強的掠食動物, 把鯊魚放在陸地上, 哪就什麼都不是, 虎落平陽被犬欺也有類似的涵義. 古時候最好的戰士最好的獵人擺在現代學校裡, 可能會被判定成過動兒.現代人氣旺的藝人擺在古老的中國, 會被視做和妓女同等級的行業, 現代醫師也是一樣, 擺在傳統中國社會, 醫師被叫做郎中, 聽起來好像騙子. 充滿創意想像力的學生放在亞洲傳統的教育體系, 會被欣賞贊美的機會不大.

  • 貪官, 奸商和刁民擺在傳統威權統治下, 應該是蠻適合生存的一群人. 同樣的騙人把戲拿到現代法制民主國家, 肯定會受到文明法律懲處, 時空環境改變, 強弱的腳色會互換.

  • 現代人一生之中也會面臨各種時空改變, 過去學校所學那一套, 畢業後還能適應變遷的社會真的不多.若時光倒流, 我又回到學校, 我將會把學習重點放在如何獲得知識如何管理知識而不是記憶知識的片斷. 我相信學校教育成功與否的評量重點在於是否能培養出學生終生學習的態度

抄一段這書中的描述主角的話

' His life and his history lacked many things. He had never known stability or normality or comfort or convention. He had never counted on anything except surprise and unpredictability and danger. He took things exactly as they came, for exactly what they were. Therefore he heard the slide rack back and felt no disabling shock. No panic. No stab of disbelief. It seemed entirely natural and reasonable to him that he should be walking down a street at night and listening to a man preparing to shoot him in the back.'

Saturday, April 26, 2008

書評:Awakening The Entrepreneur Within

為何大部分的創業者都是失敗收場? 這本書給了一個解釋!

要創立一個成功的企業(事業), 首先要有想像力-作夢的能力, 想像力可不是 想要有黃金屋? 想要有顏如玉? 抱歉不是指這種私人的渴望, 私人的渴望難以滿足的, 貪婪只會導致更加的不足! 有了房子又想要豪宅! 有了嬌妻又想要有美妾! 有了百萬想要千萬, 有了千萬想要億, 有了億想要百億, 私人的欲望有可能滿足嘛! 節制慾望才是正道! 其實這本書指的想像力是說, 把自己暫時擺一邊, 想一想這個社會需要什麼? 社會有了什麼會更好? 年輕的人買得起房子! 弱勢貧窮的家庭可以受到照顧! 沒有水的家庭有了乾淨的自來水! 本來很難用的電腦有了視窗介面! 電話讓遠端的親人可以馬上通話! 這些才是這裡所說的想像力! 所以想要創業, 先張開雙眼看這個社會, 看看缺了什麼! 把這個補起來, 那這個企業點子就會是好點子. 神奇的是, 這樣成功的企業, 因為生意興隆, 也通常不必擔心公司財務的問題.

節錄一段我欣賞的

'The shine of it goes away, the joy of it goes away, the look of it goes quickly away. It is as if there can be no rest from the continued disappointment of the personal dream. In time, doesn't everything personal leave us longing for something else personal?'

下面是我的想像力

例如說, 人口老化了, 老人家身體逐漸的變得沒有那樣健康啦, 年輕的一輩必須在職場上奮鬥, 想要把父母接來同住嘛!父母親未必習慣, 如果子女遠居他方如國外, 那更慘啦! 想要多照顧一下父母又分身乏術, 請外勞還不到那樣的條件, 那麼設立一個公司, 每天去拜訪老者, 錄影量血壓, post上網讓子女看得到, 幫忙代買食物 陪著去醫院 幫忙煮食物 評估身體狀況 根據不同的需要做出計劃調整.

例如說, 海關安全檢查非常的煩瑣, 能否想出一個方法把恐怖分子快速的找出來, 這樣大家浪費在安檢的時間可以減少!

Tuesday, March 25, 2008

學齡孩童教育重要的是?-系列(1)

我身為學齡孩童的父母, 常想的課題就是如何教育小孩? 先描述一些我經歷的情境.

情境1:運動家的精神VS叢林的競爭法則!
  • (美國): 小孩拉小提琴的Rehearsal, 某家的小孩拉的很好, 會後其它家長和小孩通常都會圍過來, 贊美表現好的小孩 Your kid did a good job. She was wonderful. Your kid got talent,etc. 看到他們的父母親這樣做, 表現不好的小孩, 也都會開心的跑來贊美表現好的小孩.
  • (華語教育下的台灣): 英文演講的會場, 某家的小孩被公佈得獎啦, 馬上看到其它沒得獎的小孩一臉辛酸, 有的甚至忍不住就流淚啦, 絕少家長或小孩會前去恭喜得獎的小孩或家長, 這個環境是一個小孩高度競爭的環境. 家長沒當場喊出比賽不公, 應該算還有水準啦. (我也要我小孩去參加英文演講, 本來是去訓練膽量吧, 不過依我的標準 這個我小孩參加的英文比賽還真的不公ㄟ 評審敢這樣評 服了他們 他們大概想說家長不懂英文啦! 我還讓小孩參加一些台灣的音樂比賽 台灣的音樂比賽就蠻公平的 畢竟每個人都有耳朵, 應該不太好搞假

情境2:學習漢字的特殊現象?
  • (美國): 小孩上學很輕鬆, 那也當然囉, 才26的字母要花多久時間學啊? 在學校很多的時間是在玩, 從玩之中學習, 當然也有鼓勵啦, 小孩比較好的文章會被貼在學校牆壁. 小孩很早年紀就開始學習歷史 生物 物理 化學 天文
  • (華語教育下的台灣): 小孩學校很多考試, 那也當然囉, 有那樣多漢字要學啊! 學校寫不夠, 回家還要一個字寫上一行, 不然怎麼記得起來啊? 作文能力? 剛進小學的, 字認識的不多, 小學六年級漢字終於學的差不多啦, 不過嘛, 華文世界六年級學生貼在學校牆壁上的寫作的內容其實和英文世界裏二年級的小孩差不多. 當然我說的好壞不是文章寫的字好不好看, 我說的好壞也不是詞句修飾的華麗與否, 我說的是文章的內容. 當英文世界的小學小孩在寫文章討論雨林的動植物 同年齡學華文的小學小孩上的課文還是小明很乖 太陽好大

情境3:高壓力的學習環境VS低壓力的學習環境
  • (美國):老師給評量沒給名次. 評量告訴家長的是, 學習那些部份落後啦, 要加油, 那些部份很好, 繼續努力.
  • (華語教育下的台灣): 老師不給名次那行? 家長才不肯! 有些小孩如果拿不到100分, 回家據說還會被吊起來打, 當然這可能只是虛言恐嚇啦, 出了校門, 轉個角, 旁邊高中學校牆上貼的是某某狀元基測滿分, 或者是今年本校基測高分創紀錄, 申請入國立大學最多, 別懷疑, 這是21世紀的台灣, 注意窩我們看到的和19世紀的科舉放榜本質還是一樣的, 教改能改的都只是制度的表相, 難改的是人心啊.
  • (美國亞洲人多的學區):亞洲人指的是台灣人, 中國人, 印度人, 不像白人居多的學區, 這些學校的學習壓力也是不小窩, 小孩要上補習班ㄟ, 其實亞洲父母要求小孩的都不是適才適所, 亞洲父母要求小孩的是要進入一流大學, 要求小孩將來得做醫師或是做律師. 相當功利
情境4:婚前性行為VS婚前的禁慾
  • (美國)一位大學女孩新生, 質疑父母說? 為何不可以有婚前性行為? 沒有試過怎樣知道這個人可以托付終身呢? 她已經18歲, 她有權做自己的主人! 父母說: 你可能會得性病, 將來影響生育能力! 她回說: 她對現代醫學有信心, 她懂得避孕, 她的男朋友還是世界第1代的試管嬰兒. 美國的文化認為小孩到18歲以後就可以自己作主, 亞洲父母就算小孩到了30歲, 還是把他們看做是小孩一樣呢! 究竟那一個方式才是對 這個價值觀的不同 無有對錯啦
  • (美國)一位約旦裔美國計程車司機, 告訴我說, 他把他7個小孩通通送回約旦接受教育, 他是回教徒, 他說他無法忍受他女兒受到美國開放文化的污染, 他說, 很奇怪ㄟ, 10幾歲的男孩可以和女孩上床, 要他們去結婚嘛, 他們會回說, 我們還年輕, 沒辦法結婚, 年輕沒辦法結婚? 卻可以上床? 這一點他很不懂! 他說如果他女兒留在美國, 女兒的同學都這樣搞, 她女兒會受到壞的影響, 如果他兒子留在美國受教育, 兒子的同學都可以搞, 只有他兒子不可以, 他兒子會心生不平!所以他認為僵化的教育也有好處ㄟ 這是保護還是洗腦? 是開放還是墮落? 這個價值觀的不同 無有對錯啦