近来 blog 有收敛到「瞎逛博物馆」的趋势。为了扭转这一势头,并且提升点品味,准备陆续放一些关于学术的内容。第一篇,也就是今天介绍的,是关于连续个随机变量的大数律。这个结果应该是我老师这辈子最得意的结果。
对于一个随机事件,基于较少的样本量,一般来说人们不容易做出富有意义的预测。但是,大数据量的独立样本却可以给出随机事件均值的一个近似估计,并且其精确程度随着数据量的增大而提高;这就是被人们所熟知的大数律。这个想法可以追述到大约 500 年前意大利数学家 Gerolamo Cardano(吉罗拉莫•卡尔达诺)。Cardano 写到,随着试验次数的增多,经验统计的精度程度有着提高的趋势;但他并未给出证明。
大数律的第一个严格证明来自于瑞士数学家 Jacob Bernoulli(雅各布•伯努利);在其著作 The Art of Conjecturing 中,他证明了关于二元随机变量(binary random variables)的大数律。
Daniel Bernoulli
经典大数律的完整证明则归功于著名的前苏联概率学家 Andrey Kolmogorov(安德雷•柯尔莫哥洛夫);他在 1933 年出版的书籍 Foundations of the Theory of Probability 中证明了关于可数个独立随机变量的大数律。
Andrey Kolmogorov
开始正文之前,先放参考文献:
Yeneng Sun, The exact law of large numbers via Fubini extension and characterization of insurable risks
Journal of Economic Theory 126 (2006), 31–69
下载地址:http://dx.doi.org/10.1016/j.jet.2004.10.005