一個班級要至少多少人,有人生日相同的機率才可以超過50%?
這是數學家理察·米澤斯(Richard von Mises,1883-1953)首先提出來的有趣問題。
答案是23人。是不是比你想像中的小很多?
解:
假設p(N)是N個人中,每一個人生日皆不同的機率。(所以,1-p(N)就是至少有一對(2個人)生日是相同的機率)
N=2。p(2)=第1個人在365天中某一天生日的機率* 第2個人在第1個人生日之外的364天中任一天生日的機率=(365/365)*(364/365)
N=3。p(3)= 第1個人在365天中某一天生日的機率* 第2個人在第1個人生日之外的364天中任一天生日的機率* 第3個人在第1個人和第2個人生日之外的363天中任一天生日的機率= (365/365)*(364/365)*(363/365)
……
N=23。p(23)= (365/365)*(364/365)*(363/365)*…*(343/365)=0.4927
1-p(23)就是至少有一對(2個人)生日是相同的機率=0.5073
所以在一個群體中要發現有人的生日相同,只要人數夠多而且不用太多,只要超過23人,機率就超50%了呢!
如果把生日相同,改成身份字號後4碼相同的機率,只要把365換成9999就可以了。
1-p(118)>50%。只要群體大到118人,那麼有人的身份證號後4碼相同的機率就大於50%了。
我們相信的偶然,其實很多是統計機率的必然呢!
但是,如果說是我在網路上認識的朋友,和我是同年同月同日生的機率呢?
先考慮同月同日生的情形。如果我的生日是某一天,譬如七月一日,那麼我其他的朋友,如果都和我不同一天生日,每個人的機率就364/365,如果我有N個朋友,那我跟他們每一個人生日都不同的機率就(364/365)^N。
(364/365)^252.65=50% 。意思是說只要我認識高達253位朋友,那麼有人跟我生日的機會就會大於50%。(1-(364/365)^253>50%)。
那麼,如果加上年度的考慮呢?為了簡化問題,假設年紀與我相差在10歲之內,那考慮的天數為加減3650日,要碰上一位同年同月同日生的人,就是(1-(7299/7300)^5,105>50%)。必須認識超過5,105,如果在5年內,意思每天3個人,勤快一點,似乎是有可能。但是並不會每次都會談到生日,如果每100次對話才有1次,那麼代表我必須遇見510,500個人,這就蠻難的。
所以,碰上同年同月同日生的人,同班同學容易,但是如果是網路上不同年度的朋友,就相對難得多了。
另外一個有趣的命題,是法國數學家埃米爾·博雷爾(Émile Borel, 1871-1956)提出來的:「如果給定足夠的時間,一隻猴子可以在鍵盤上隨機敲出莎士比亞全集。」
什麼?!
為了探討方便,我們先假設猴子要打的是這麼一句話:shall I compare thee to a summer’s day?猴子能夠隨機用26個字母的鍵盤敲出來的機率是多少?
先試算敲出shall這5個字母的機率,假設每次敲什麼字母之間是獨立的,敲對shall這5個字母的機率是(1/26)^5,那沒有敲對的機率就是:
1-(1/26)^5=0.99999991573,也就是說幾乎不可能對,這和我們的直覺一致,一次要敲對的機會微乎其微。
不過因為我們給猴子「足夠多次」的嘗試,假設是N次的嘗試,那麼沒有敲對的機率變成:
(1-(1/26)^5)^N
N=8,235,542 的時候,1-(1-(1/26)^5)^N>50%,會有50%的機率蒙出「shall」這個字。
這在密碼的保護程度方面,有很大的啓發。對於電腦來說,試上8,235,542次並非難事。由5個字母組成的密碼,破解並非難事。所以,一般會要求加上大小寫、數字甚至特殊符號,就是為了增加破解的難度(呈現指數增長)。
這也是為什麼法國數學家埃米爾·博雷爾會說,「如果給定足夠的時間,一隻猴子可以在鍵盤上隨機敲出莎士比亞全集。」以現代的語彙來講,所謂足夠的時間,其實就是電腦的速度。這也是為什麼有人會擔心量子電腦的速度,將可能是現在超級電腦速度的100兆倍(10^14=100,000,000,000,000倍),那麼現行的很多的加密方法將不再可靠了。
最後再來思考一個問題:一位經常在不同城市間旅行的私募基金女執行長,在芝加哥叫了一輛計程車,三年後,她在邁阿密叫到一樣的計程車並發現和芝加哥是同一位司機的機率是多少。
首先估計計程司機從芝加哥遷移到邁阿密的機率。
芝加哥有15,327名計程車司機,邁阿密大約5000名,但是我們無法知有多少芝加哥的司機會搬去邁阿密。2014年,芝加哥人口為2,722,389,遷出95,000,也就是每年29分之1。如果假設計程車司機遷出率相同,那麼三年內就有529位遷往他處。芝加哥是美國第3大城,邁阿密是第44位,我們難以猜測芝加哥的司機遷往何處,但依照美國熱門移居城市排行,邁阿密名列第40位,因此我們可以假設芝加哥司機遷往邁阿密的人數很少,或許介於20到40之間,那麼這位女執行長攔到同一位司機的比率就是介於20/15,327和40/15,327之間。機率是0.13%-0.26%之間,看來並不是不可能,只是機率蠻低的。
當然,這其中的一些假設會面臨考驗。譬如,計程車司機難道不會因為對一個地區比較熟悉,而變得更安土重遷嗎?如果是,那麼會再碰上的機率就要再打個折扣,但是機率大小的級量就是在百分之零點多,原來的數字也有參考的價值。
最後,給大家一個值得思考的問題,在公司的電梯裏會碰到大老闆的機率有多少?大家可以用各種假設去推算,可是,為什麼要算這一題呢?不如先想好,怎麼跟大老闆打招呼,如果他問起什麼,要怎樣回應才好留下良好的印象吧!
在公司碰到大老闆的機率如果不高,不代表它不會發生;而且往往在我們不預期的時候可能會發生,那就是莫非定律。大家要好好把握,拍個馬屁,皆大歡喜,也不枉花時間研究機率一場。
*:《是湊巧還是機率》,約瑟夫·馬祖爾 Joseph Mazur 著,王秋月
2022/8/22 是湊巧還是機率 Damakey

