| 欢迎来到梦题库! 请登录 注册 今天是2026/3/3 |
![]() |
![]() |
12 | ||||
| 课程 | 题库 | 下载 | 答疑 |
戈赛特(Gosset)好像名字不是特别响亮,不像Fisher或Pearson,在很多书中都有,有的统计学书中甚至不提戈赛特的名字。但我个人认为,他的贡献并不在其他人之下,甚至可以说,开创了一个时代,开创了统计学小样本推断的时代。在戈赛特之前,统计学基本上就是“大样本”的代名词,正因为有了戈赛特,才有了小样本统计推断的提出。所以,将戈赛特称为小样本的鼻祖,基本上应该是名至实归的。
戈赛特据说同时拥有数学和化学两个学位(这在当时似乎并不是很少见,不少学者都同时拥有两个甚至以上的学位)。与许多学者一样,他当时并没有直接从事统计学的研究,毕竟,在100多年前,统计学甚至还算不上一门学科。他当时从事的是啤酒酿造行业,然后就在这一似乎与统计无关的行业里,他做了一项研究,想弄清楚发酵时需要加多少酵母最合适。当时戈赛特做出了结果并准备将其发表,可惜他所在的是酿酒行业,贸然发表的话会引起泄露机密之嫌。但戈赛特又确实想发表这一文章,因此采取了折中的办法:匿名发表。他采用了一个笔名,也就是现在我们仍可以在统计学课本上见到的“student”。2020年高级统计师报名时间高级统计师考试教材统计时政热点统计师辅导高级统计师历年真购买点图片
题
戈赛特与K皮尔逊是好朋友,当年曾专门脱产一年跟随K皮尔逊学习统计学,所以当他写好文章后,首先就是想到在《生物统计》上发表。后来据说好像戈赛特所在的公司似乎发现了他偷偷发文章,不过戈赛特的这些研究为公司带来了不少效益,他们可以生产质量更为稳定的啤酒。所以戈赛特并没有因此而被开除,反而职位有所升迁。但这也仅限于大家心知肚明而已。
戈赛特最重要的一个贡献就是提出了小样本的检验思想。现在我们看起来似乎并无任何出奇。但在当时,统计学几乎就是大样本的科学,一提起统计学,就想到大样本。当时的K皮尔逊的几乎所有工作都是基于大样本的假设。但戈赛特根据自己的经验认为,有的情况下,大样本对于研究者来讲太过于奢侈了,必须专注于小样本。但是一旦用小样本分析,无可避免地会牵扯到误差的问题。在大样本情况下,你可以假定没有误差或者误差很小可以忽略不计,而小样本必须考虑到这一问题。那么小样本情况下,误差有多大呢?这就是戈赛特所关注的。
戈赛特通过自己的不断演算,最终于1908年发表了一篇极为重要的文章《the probable error of the mean》,提出了t分布,这也是至今我们仍在广泛应用的t检验(也叫student t检验)的基础。考虑一下当时的条件,可想而知戈赛特做出了多少次的计算才得出这一结论。他需要一次一次地计算均数、标准误,再把二者相除,以确定相关数据的概率分布,现在条件下通过计算机模拟可能很快出来结果,但当时显然是很复杂的。但不管如何,通过戈赛特的努力,最终发现了小样本的分析规律,并奠定了小样本分析的基础。现在的人通常称其为小样本理论的鼻祖。
有了戈赛特提出的分布,统计学界突然发现很多事情变得简单了。原来K皮尔逊提出的四参数的分布过于繁琐,而通过戈赛特的分布,一切都变得简单多了,它提供了几乎每一个学统计的人都会使用的工具。
后来Fisher在研究一个天文学问题时,也提出了类似的理论,结果发现原来戈赛特早已在1908年发表过了。当时Fisher显然还是比较年轻气盛,他把论文给戈赛特看,结果戈赛特指出了其中一个小错误。然后Fisher给戈赛特寄了满满的2页数学论证,证明他的结果的可靠性。尽管如此,戈赛特还是很欣赏Fisher的才华。
戈赛特是一个非常谦逊的人,当时K皮尔逊和Fisher之间的矛盾很深,而戈赛特作为二者之间的调和人,协助他们在各自领域里做出了不少贡献,而且作了很多穿针引线的事情,保持几位统计学大家的关系。这在以后也是很为人所称道的。
到了今天,我们突然发现,统计学从最初的“大样本”到戈赛特开创“小样本时代”,再到现在的“大数据时代”,似乎又回到了原点。但这就像我们认识论中所说的,这是循环式的上升,而不是回到原点。统计学经历了统计推断的风风雨雨,很多人甚至现在叫嚣:统计学可以消失了。因为现在都是大数据,统计学已经没有用了。真是如此吗?我想,时间会说明一切的。很多的现象,往往在一个时间点上看起来似乎很有道理,但是时间才是证明最终真理的最有力的证据。
戈赛特(Gosset)好像名字不是特别响亮,不像Fisher或Pearson,在很多书中都有,有的统计学书中甚至不提戈赛特的名字。但我个人认为,他的贡献并不在其他人之下,甚至可以说,开创了一个时代,开创了统计学小样本推断的时代。在戈赛特之前,统计学基本上就是“大样本”的代名词,正因为有了戈赛特,才有了小样本统计推断的提出。所以,将戈赛特称为小样本的鼻祖,基本上应该是名至实归的。
戈赛特据说同时拥有数学和化学两个学位(这在当时似乎并不是很少见,不少学者都同时拥有两个甚至以上的学位)。与许多学者一样,他当时并没有直接从事统计学的研究,毕竟,在100多年前,统计学甚至还算不上一门学科。他当时从事的是啤酒酿造行业,然后就在这一似乎与统计无关的行业里,他做了一项研究,想弄清楚发酵时需要加多少酵母最合适。当时戈赛特做出了结果并准备将其发表,可惜他所在的是酿酒行业,贸然发表的话会引起泄露机密之嫌。但戈赛特又确实想发表这一文章,因此采取了折中的办法:匿名发表。他采用了一个笔名,也就是现在我们仍可以在统计学课本上见到的“student”。2020年高级统计师报名时间高级统计师考试教材统计时政热点统计师辅导高级统计师历年真购买点图片
题
戈赛特与K皮尔逊是好朋友,当年曾专门脱产一年跟随K皮尔逊学习统计学,所以当他写好文章后,首先就是想到在《生物统计》上发表。后来据说好像戈赛特所在的公司似乎发现了他偷偷发文章,不过戈赛特的这些研究为公司带来了不少效益,他们可以生产质量更为稳定的啤酒。所以戈赛特并没有因此而被开除,反而职位有所升迁。但这也仅限于大家心知肚明而已。
戈赛特最重要的一个贡献就是提出了小样本的检验思想。现在我们看起来似乎并无任何出奇。但在当时,统计学几乎就是大样本的科学,一提起统计学,就想到大样本。当时的K皮尔逊的几乎所有工作都是基于大样本的假设。但戈赛特根据自己的经验认为,有的情况下,大样本对于研究者来讲太过于奢侈了,必须专注于小样本。但是一旦用小样本分析,无可避免地会牵扯到误差的问题。在大样本情况下,你可以假定没有误差或者误差很小可以忽略不计,而小样本必须考虑到这一问题。那么小样本情况下,误差有多大呢?这就是戈赛特所关注的。
戈赛特通过自己的不断演算,最终于1908年发表了一篇极为重要的文章《the probable error of the mean》,提出了t分布,这也是至今我们仍在广泛应用的t检验(也叫student t检验)的基础。考虑一下当时的条件,可想而知戈赛特做出了多少次的计算才得出这一结论。他需要一次一次地计算均数、标准误,再把二者相除,以确定相关数据的概率分布,现在条件下通过计算机模拟可能很快出来结果,但当时显然是很复杂的。但不管如何,通过戈赛特的努力,最终发现了小样本的分析规律,并奠定了小样本分析的基础。现在的人通常称其为小样本理论的鼻祖。
有了戈赛特提出的分布,统计学界突然发现很多事情变得简单了。原来K皮尔逊提出的四参数的分布过于繁琐,而通过戈赛特的分布,一切都变得简单多了,它提供了几乎每一个学统计的人都会使用的工具。
后来Fisher在研究一个天文学问题时,也提出了类似的理论,结果发现原来戈赛特早已在1908年发表过了。当时Fisher显然还是比较年轻气盛,他把论文给戈赛特看,结果戈赛特指出了其中一个小错误。然后Fisher给戈赛特寄了满满的2页数学论证,证明他的结果的可靠性。尽管如此,戈赛特还是很欣赏Fisher的才华。
戈赛特是一个非常谦逊的人,当时K皮尔逊和Fisher之间的矛盾很深,而戈赛特作为二者之间的调和人,协助他们在各自领域里做出了不少贡献,而且作了很多穿针引线的事情,保持几位统计学大家的关系。这在以后也是很为人所称道的。
到了今天,我们突然发现,统计学从最初的“大样本”到戈赛特开创“小样本时代”,再到现在的“大数据时代”,似乎又回到了原点。但这就像我们认识论中所说的,这是循环式的上升,而不是回到原点。统计学经历了统计推断的风风雨雨,很多人甚至现在叫嚣:统计学可以消失了。因为现在都是大数据,统计学已经没有用了。真是如此吗?我想,时间会说明一切的。很多的现象,往往在一个时间点上看起来似乎很有道理,但是时间才是证明最终真理的最有力的证据。
![]() |
|
| 高级统计师选课中心 | |