2024年9月24日 星期二

(2024-9-24) p-hacking

為了提升期刊的聲望,期刊編輯們都更傾向於接收低 p-值因子的文章;為了在更高水準的期刊上發文,學者們更傾向挖掘低 p-值的因子。在美國絕大多數學校裡,學者如果能在金融領域頂級期刊發表一篇文章,就有可能得到終身教職。

有意或無意的資料窺探、不嚴謹的統計檢驗手段、錯誤解讀 p-值傳達的意義,以及忽視因子背後的其他原因,使很多在功利心驅使下被挖掘出的因子僅僅是樣本內過度擬合的產物,在實際投資中根本站不住腳。

在功利心的驅使下,學術界對於超低 p-值的追逐導致出現了一種發表偏差(publication bias),即學者們更願意把研究時間和精力花到可以利用各種手段來找到低 p-值的因子上,只願意發表“最顯著”的研究成果,而不願意冒險來研究“無效的因子”。從推動學科發展的角度來看,“無效的因子”和“有效的因子”同樣重要。如果能夠確切地證明某個因子無法帶來超額收益,那麼它對因子投資實踐仍然很有價值,因為人們可以放心地避開該因子。

學者們在面臨這些選擇做決定時心理會“非常微妙”,一切阻礙超低 p-值誕生的數據都會被巧妙地避開。學術界把這種為了追求低 p-值而在資料處理和分析時千方百計地進行資料操縱,直到發現足夠顯著結果的行為稱為p-hacking。




沒有留言:

張貼留言