偵探網提起貝葉斯公式,相信很多同學都會無奈地搖搖頭,彎彎繞繞太多了,解題的時候一不小心就會出錯。
今天,我會教大家用偵探的思維方式學習貝葉斯公式,并在此思維方式的基礎上為大家總結貝葉斯公式考題的標準解題流程,只要大家掌握了套路,并適當練習,以后再也不用擔心貝葉斯公式了,哦耶!
首先,大家把自己想象成一名思維縝密的偵探,現在有一個棘手的案子:
破案的關鍵點是確定30年前的某一天是下雨天的概率,這一天就是案發時間,只要當天下雨的概率大于等于75%,就能進一步縮小排查范圍,甚至鎖定犯罪嫌疑人。
現在的最困擾的問題是,30年前的信息記錄并不像現在這么完善,30年前該地區的每天的天氣情況現在找不到直接的線索,走訪了氣象局等部門后,能得到的信息只是當年降雨的天數占比為40%,也就是說當年任意一天是下雨天的概率是40%,但這個概率只是泛泛而談,如果沒有更加精準的分析,調查就會被迫中止,難道真的要看兇手逍遙法外么?
就在一籌莫展之際,一位學校小超市的老板娘提供了一絲線索:在下雨天的情況下該超市雨傘當日售罄的概率是80%,在不下雨的情況下該超市雨傘當日售罄的概率是10%,這組概率三十年來一直保持穩定。
翻開已經泛黃但字跡依然清晰可辨的超市30年前的進貨記錄登記表,可以發現上面記錄著案發當天的雨傘是售罄的。偵探目前拿起紙筆,打算根據這條最新線索,重新評估一下案發當天是下雨天的概率。
偵探的內心OS:
在沒有這位老板娘提供的最新信息的情況下,當天是下雨天的概率(先驗概率)為40%,現在的新信息告訴我,當天雨傘是售罄的,雨傘售罄這件事在下雨天發生的可能性要比在不是下雨天的時候發生的可能性大很多,因此根據新信息調整更新后的當天是下雨天的概率(后驗概率)肯定會顯著的大于40%,但具體等于多少需要用一下貝葉斯公式。
哈哈,柳暗花明又一村,看到了破案的希望!
為了方便標識和套公式,把該地區下雨記為事件A, 把該超市的雨傘售罄記為事件B?,F在已知的信息為:當年該地區下雨的概率為40%, 即P(A)=40%。下雨的情況下該超市雨傘售罄的概率為80%,即P(B|A)=80%。不下雨的情況下該超市雨傘售罄的概率為10%,即P(B|A^C)=10% (A^C讀作complement of A,表示A事件的反面,即不下雨)。
我們現在要求的是P(A|B),根據貝葉斯公式:P(A|B)=P(A)×P(B|A)/P(B),貝葉斯公式的本質就是根據新信息對先驗概率進行更新調整。到底怎么調整,調整幅度是多少,就看P(B|A)/P(B)這個調整因子有多大了。
其中P(B|A)是已知條件,而P(B)需要用全概率法則求出,該超市雨傘售罄可以分為兩種情況,在下雨天售罄和在不是下雨天的時候售罄,而下雨和不下雨的概率分別為40%和60%,因此:
顯然,84.21%大于進一步縮小排查范圍需要的最低概率,75%。也是就是說,偵探利用貝葉斯公式在查案上取得了重大突破!
回顧該案件,在運用貝葉斯公式的時候,之所以根據新信息更新后的后驗概率比先驗概率大很多,是因為調整因子足夠大:P(B|A)/P(B)=80% /38% ≈2.1
貝葉斯公式解題標準操作流程
一般需要使用貝葉斯公式的題目問的問題從形式上看肯定是一個條件概率,題中的已知信息會告知一組條件概率,但看著都有點蹩腳,因為已知的這組條件概率跟問題問的角度是岔開的。遇到需要使用貝葉斯公式解題的題目時,按照以下四步走:
①根據問的問題定義出A事件和B事件。
由于最終貝葉斯公式計算出的是B事件發生的情況下A事件發生的概率,即P(A|Β),因此要把題目中的新信息(剛發布的消息/剛剛發生的事情/剛得到的線索等)定義為B事件,在剛才這個案件中,就是該超市雨傘售罄。另外,把題目中已經告知先驗概率、現在需要求后驗概率的對應的事件定義為A事件,在剛才這個案件中,就是該地區下雨。
②找出A事件發生的先驗概率,并寫下來。
這個概率是后續做調整更新的對象,把這個概率找對非常重要。
③計算調整因子P(B|A)/P(B)。
需要注意的是分子P(B|A) 一般題目中會直接給出,而分母P(B)一般需要使用全概率法則計算,全概率法則的本質是先分類討論然后再按照每種情況發生的概率加權平均對應的條件概率。
④套用貝葉斯公式,P(A|B)=P(A)×P(B|A)/P(B),把第②步和第③步得到的結果相乘就得到了最終的答案。
以上四步就是貝葉斯公式問題的標準解題流程。如果大家計算完了之后,想再略微核對一下中間的計算步驟有沒有出現明顯錯誤,一個可行的辦法是看一下這道貝葉斯公式題目中,新信息B事件是在A事件發生的時候發生的概率更大,還是在A事件不發生的時候發生的概率更大。
如果是前者(新信息B事件在A事件發生時發生的概率更大),那最終得到的后驗概率P(A|B)一定會大于先驗概率P(A)。
如果是后者(新信息B事件在A事件不發生時發生的概率更大),那最終得到的后驗概率P(A|B)一定會小于先驗概率P(A)。
如果違反了這樣的經驗法則,那肯定是在某個步驟中不小心數字代錯了。例如在上述案件中,如果最終算出的P(A|B)等于35%,那肯定是算錯了,因為先驗概率P(A)就有40%,而事件A發生的前提下B事件發生的概率要比A沒有發生時B事件發生的概率更大(下雨天該超市雨傘售罄的概率為80%,不下雨的情況下該超市雨傘售罄的概率只有10%),因此P(A|B)不可能小于40%。