首先从博雷尔正轨数定律(Borel’s Normal Number Theorem)说起。众所周知,(0,1]区间上的每一个实数\(\omega\)都与一列唯一的无穷的二进制展开序列\(\{X_k(\omega)\}\)一一对应,其中\(X_k (\omega)\)表示二进制展开的第k位,对应关系为:

$$ \omega=\sum_{k=1}^n\frac{X_k(\omega)}{2^k} $$

如果用(0,1]上的勒贝格测度\(\lambda\)作为概率测度来计算\(X_k(\omega)\)的分布,我们容易发现

$$ \{\omega:X_1(\omega)=1\}=(\frac{1}{2},1]\\ \{\omega:X_2(\omega)=1\}=(\frac{1}{4},\frac{1}{2}]\cup(\frac{3}{4},1]\\ \vdots\\ \{\omega:X_k(\omega)=1\}=(\frac{1}{2^k},\frac{2}{2^k}]\cup(\frac{3}{2^k},\frac{4}{2^k}]\cup\cdots\cup(\frac{2^k-1}{2^k},1] $$

而其中等式右边每一个集合的勒贝格测度都为1/2。由此,\(X_k(\omega)\)是事件集\(\Omega=(0,1]\)导出的概率为1/2的0-1分布的随机变量。

事实上,\(X_k(\omega)\)不仅是同分布的,而且是相互独立的。强大数定律的结论告诉我们:

$$ \lambda\{\omega:\frac{1}{n}\sum_{k=1}^n X_k(\omega)\rightarrow \frac{1}{2}\}=1 $$

即:如果考虑区间(0,1]上这样一个子集\(A\),这个子集的构成元素是所有与均值收敛于 1/2的二进制展开序列相对应的实数,那么这个子集的“长度”,即勒贝格测度为1(\(\lambda(A)=1\))。这就是博雷尔正轨数定律。

以上所介绍的(0,1]上实数与其二进制展开序列的对应关系,我认为是解释概率空间基本概念的最经典、最直观的模型:它不仅近乎完美地解释了事件集与随机变量的对应关系,进而直观揭示分布与测度的关系,而且证明了如何在同一个概率空间中生成无穷维相互独立的随机变量。

如果对以上模型稍作推广,可以得到一些更有趣的结论。对于任意的\(0-\frac{1}{2}\)之间的常数\(p\),我们考虑\(\omega\)的“非对称”的无穷二进制展开序列\(X_k(\omega)\),其中每一个\(X_k(.)\)都是如下集合\(A_k\)的指示函数:

$$ A_1=(1-p,1]\\ A_2=(p-p^2,p]\cup(1-2p+2p^2,1-p]\cup(1-p^2,1]\\ \vdots\\ $$

由对称性可知,\(p>1/2\)的情形可以类似得到。表达式虽然复杂,但是构造的原理很直观:首先将区间分为长度为p:(1-2p):p的三段,然后将每一小段安比例p:(1-2p):p继续分割,如此不断进行下去,将第k步得到的3k个区间中每隔两个选取一个合并,如此就可以得到\(A_k\)。容易得到,这种无穷序列和(0,1]区间的实数也是一一对应的,\(X_k\)服从相互独立的0-1分布,\(P\{X_k=1\}=p\)

这里采用了的分割方法和二进制分割略有区别;当\(p=\frac{1}{2}\)时,每次分割的中间那段区间是退化的,因此得到的结果与二进制的分割本质相同。在这种形式下,与集合\(A\)对应的集合\(B\)包含所有那些与收敛于\(p\)的“非对称”二进制展开序列对应的实数集合,即:

$$ B=\{\omega:\frac{1}{n}\sum_{k=1}^nX_k(\omega)\rightarrow p\} $$

强大数定律告诉我们:

$$ \lambda(B)=1 $$

当p不为1/2时,我们显然有

$$ \lambda\{\frac{1}{n}\sum_{k=1}^nX_k(\omega)\rightarrow \frac{1}{2}\}=0 $$

因为大括号内的集合属于集合\(B\)的补集,所以其测度为0。我们把括号内的集合记为\(A’\)。注意:虽然\(A’\)\(A\)的表达式相同,但是两个集合对应的二进制展开形式是不同的,因此它们是两个截然不同的集合,所以它们虽然在相同的测度空间内,但有着截然不同的测度。

最后,我们按照如下次序构造集合\(C\)

$$ C_1=(0,p]\cup(1-p,1]\\ C_2=(0,p^2]\cup(p-p^2,p]\cup(1-p,1-p+p^2]\cup(1-p^2,1]\\ C_3=(0,p^3]\cup(p^2-p^3,p^2]\cup\cdots\cup(1-p^3,1]\\ \vdots\\ C_k=(0,p^k]\cup(p^{k-1}-p^k,p^{k-1}]\cup\cdots\cup(1-p^k,1]\\ \vdots\\ C=\cap\_{k=1}^\infty C_k $$

我们首先挖去(0,1]上中央长度为\((1-2p)\)的区间;在剩下的两个区间内,我们继续挖去每一个区间中央长度为\((1-2p)p\)的区间,如此不断进行下去,最后得到的集合就是\(C\)

给定\(\omega \in C\),那么该条件下的\(X_k\)如何分布呢?

首先考虑\(X_1\)。容易知道,\(P(X_1=0,\omega \in C)=\lambda(C\cap(0,p])\),而\(\lambda(C\cap(1-p,1])=P(X_1=1,\omega \in C)\)。由集合C的对称性,\(\lambda(C\cap(0,p])=\lambda(C\cap(1-p,1])\),因此,\(P(X_1=1,\omega \in C)=P(X_1=0,\omega \in C)\)。即:在集合C上,\(X_1\)服从等概率的0-1分布。以此类推,所有的\(X_k\)在集合\(C\)上都服从等概率的0-1分布。

强大数定律告诉我们:几乎所有\(C\)中的实数,与之对应的二进制展开序列均收敛于1/2。而这样的实数构成的子集,属于零测集\(A’\)的子集,因此也是零测集。这就说明\(\lambda(C)=0\)

如果令\(p=1/3\),我们就解释了在强大数定律意义下康托三分集测度的含义。

类似地,我们可以进一步解释广义康托集与强大数定律的关系。有兴趣的读者可以作出相应推广。

注:本文已经由COS编辑部整理为PDF(LaTeX)版本,读者可以下载:强大数定律与康托三分集(PDF,105K)

发表/查看评论