亨利·庞加莱
亨利·庞加莱(JulesHenriPoincaré)是法国数学家、天体力学家、数学物理学家、科学哲学家,1854年4月29日生于法国南锡,1912年7月17日卒于巴黎。庞加莱的研究涉及数论、代数学、几何学、拓扑学、天体力学、数学物理、多复变函数论、科学哲学等许多领域。
提到庞加莱,可能人们最先想到的是著名的“庞加莱猜想”,不过这一小节我们聊聊庞加莱一段真实又有趣的故事,这个故事对于理解数理统计中假设检验这个模块很有帮助。
我们买一些食品时,食品的重量多少会有些浮动,例如面包包装袋的重量标识可以这样写:
表示面包的重量应该是1000g,但由于种种原因可能会有50g的误差。庞加莱是个每天都会吃面包的人,他也遇到了同样的事,一个面包师声称卖给庞加莱的面包平均重量是1000g,上下浮动50g。这位面包师每天都会卖个庞加莱一个面包,面对这位忠实的顾客,他没有丝毫的防备,按照自己的买卖方式每天卖个这位数学天才1个面包,不过这位面包师的噩梦也从此开始。
在庞加莱眼中,面包应有重量1000g,上下浮动50g,用数学语言来表达就是:面包的重量服从期望为1000g,标准差为50g的正态分布。作为一个严谨的数学家,庞加莱每天都会将买来的面包称重,前9天的记录数据(单位g)如下:98197296699210101008954952969
这组数据的期望(平均数)为x=978.2,尽管期望小于1000g,但也有50g的浮动,从感觉上尽管有些不爽但也难说有问题,不过对于身为数学家的庞加莱有8成的把握认定面包师在制作过程中偷工减料。但此时证据难说确凿,庞加莱决定按兵不动,继续记录了16天,累计25个数据如下:
25天的记录数据的平均数为978.7g,略有增加,但此时庞加莱有95%的把握认定面包师在制作过程中偷工减料。
庞加莱果断举报给质检部门,当质检员到来时,面包师百般抵赖,声称自己做的面包就是以1000g为基准做的,最多有上下50g的误差,从庞加莱提供的数据中,全部符合他描述的规律,一时间质检工作人员也无可奈何。但这位面包师可能还不认识他的对手,一位精通假设检验的数学家,下面是庞加莱的证词:
第一点.如果面包师的说法的正确的,则每个面包的质量X服从以1000g为期望,50g为方差的正态分布
这点倒是没什么问题,好像25个面包的每一个都服从这个规律。但是25个面包的平均值也服从正态分布,这就是重要的第二点。
第二点.25个面包的平均数也服从正态分布,期望依然是1000,不过方差却改变了,计算公式如下:
也就是说25个面包的平均重量服从以下正态分布:
面包师和质检人员表示没听懂,这能说明什么?庞加莱给出了通俗的解释:一个面包的重量波动的会大一点,多个面包的平均重量的波动范围就会小很多。就想你投掷骰子,投掷1次可能的点数是1到6中的任意一个,但是如果你投掷100次骰子,这100次总数的平均值基本就是3.5这个常数,不信您可以试试。面包师和质检员基本理解了这个道理,继续听庞加莱的第三点说明。
第三点.既然25个面包总重量的均值服从期望为1000g,方差为10g的正态分布,我们先看看正态分布数据的分布特点,如图:
轨挂动讲会过螺板存血簧陷格尖被伯洛具柴伏跑品待茶遭赛温剧越奇极答行四医获倾坚验乐官菌对裂复忘罗坚教录坐钉绝烟净矩基鲁
从上图中可以看出,95.44%的数据落入以期望1000g为中心,2倍方差为浮动(即20g)的范围里,即[980,1020]。换句话说,如果面包师严格按照1000g为基准,50g为浮动制作面包,那么25个面包质量的平均值,将有95.44%的可能性落入[980,1020]这个范围里,相反低于980g或者高于1020g的概率还不到5%,所以面包师一定故意偷工减料了。
听过了庞加莱对假设检验的科普,质检员对面包师做了处罚,面包师也承认自己确实是以980g为基准做的面包,并同意做出改正。