Author: Eiko
Tags: Probability Theory, Measure Theory, Dominated Convergence, Independence, Random Variables, Sigma Algebras, Conditional Probability, Bayesian Statistics, Kolmogorov Zero One Law, Distribution, Convergence of Random Variables, Weak Convergence, Almost Sure Convergence, Convergence In Probability, Poisson Limit Theorem
这是我2022年讲概率论课程所编写和使用的讲义。其中很多内容和例子都是我自己编写的。
基础知识
本章的目的是从最基础的集合操作和极限的复习开始,介绍拓扑等基础概念。然后我们将学习一个迷你版本的测度与积分理论,这将不仅是概率论的基石,也对分析学的学习乃至于对逻辑与关系的理解大有帮助。
集合的基本操作
我们不去复述集合的基本概念,而着重复习一下集合的基本操作。以下所有内容都极为浅显,如果你从来没有见过,你应该逐个验证它们。
集族,指标集
对于一个集合,一个子集族是指的一些子集构成的集合或序列。通常我们用一个指标集来编号这些子集,即把它们写成或.
集合的交 对于一个集合的某个子集族,可以定义它们的交 这也是的一个子集。
类似的,定义集合的并 还可以定义集合的无交并,记为,即把的所有元素放在一起,即使有相同的元素,在不同的里面也要视为不同的。
笛卡尔乘积 给定一列集合, 它们的笛卡尔乘积是由所有有序对组成的集合。更精确的说,它是所有映射组成的集合,这里要求.
分配律
如果把看成加法,看成乘法,那么有如下’乘法分配律’ 事实上,运用下面将要叙述的对偶律,还可以得到反过来的分配律
补集
设是某个大空间的子集,其补集记为 容易看出,取两次补集会回到自身
对偶律
补集把交变成并,并变成交 因此,一个对大空间中的任意子集成立的集合恒等式中,将并和交全部互换得到的仍然是恒等式。
定义集合的差为
映射与集合操作的关系
设是集合之间的映射,那么
对于,定义的像为
对于,定义的原像为
原像与交,并,补都可交换。
像与并可交换,但一般不与交,补交换。
不过有一个有用的例外情形是.
实数集上的特殊运算
对于的一个子集,如果内所有元素都, 我们就说是的一个上界,这里可以取无穷。实数集的一个基本性质就在于,一定存在一个最小的上界(这与实数的完备性有关),称为的上确界,记为.它可以看成是最大值的一个推广。
类似的可以定义下确界,它们可以由下式联系起来 对一个实数数列,还可以定义上极限: 和下极限 它们之间也有类似的联系
拓扑
连续性与中的拓扑
在中,有一类起着基础作用的集合,它们就是球。定义 称之为开球,而 称之为闭球。注意到时,开球就是开区间,闭球就是闭区间。下面是一个重要概念
定义 1.1. 我们称是一个开集, 如果内任何一点都有一个非空开球. 称是一个闭集,如果是一个开集。
注意,集合并不是非开即闭,大部分集合既不是开集也不是闭集。
拓扑最初是用来描述连续变化的现象。回忆一个函数在处连续,是指 或者,等价的来说,就是指只要离足够近,就能离任意近。如果我们取一族越来越小的区间, 无论这个区间多么小,都必须包含一个包含了的(开)区间。用开集的理论来说,就是对于任何一个附近的开集, 都需要包含一个附近的开集。如果我们要求函数对所有连续,这就要求中的每一点都需要有一个开邻域被包含在里面,因此成为开集。这就给出了如下定义
定义 1.2. 我们称是连续函数,如果对任意开集,都是开集。
一般集合上的拓扑
上述关于开集的理论可以推广到任何一个集合,我们称的一个子集族构成一个拓扑,是指
中的集合的任意并还在中,即如果取出一族,那么
中的集合的有限交还在中。
.
那么,集合和其上的拓扑就构成一个拓扑空间 ,这个里面的集合就叫拓扑空间的开集。类似的,闭集就是指开集的补集。我们称是的开邻域,如果包含并且是一个开集。今后,当我们谈到’拓扑空间’时,总是指是一个集合,并且在其上已经指定了一族满足上述定义的’开集’.
拓扑空间可以想象成带有’连续性’概念和点与点之间的’远近’概念的一种空间,如果包含两个点的开集越多并且越小,两个点就可以看成越近。
命题 1.1. 是开集当且仅当它里面每一点都有一个开邻域被包含在内。
Proof. 如果是开集,那么它是内所有点的开邻域。
如果内每一点都有开邻域,那么 是开集的并,于是是开集。 ◻
上述说法启发我们,验证一个集合是不是开集只需要给出一组基本的开集,比如中的开球,就可以了。事实上,我们想要找的这类基本的开集就可以称为拓扑空间的一个拓扑基.准确的说,如果是一个拓扑空间,是一族开集,我们说这族开集是的一个拓扑基或者开集基,如果任何开集都是中集合的并。根据上一命题,这等价于说任何开集中的每一点都包含一个中的集合作为邻域。
接下来我们研究这样一个问题,给定中的一族集合,通过让中集合任意并的方式,我们可以生成集合。那么,这个什么时候构成一个拓扑呢?
定理 1.1 (拓扑基).
设是一个集合,是一族子集。设是包含了的那些子集,那么能作为拓扑基生成一个拓扑,当且仅当对任意都有且对任意,存在被包含在中。这时就是它在上生成的拓扑的拓扑基。
如果,是两个拓扑基,并且中每一个元素都包含的一个元素,那么它们生成的拓扑满足.
于是它们生成相同的拓扑当且仅当每一个的元素都包含一个中的元素,并且每一个中的元素都包含一个中的元素。
Proof.
生成的拓扑就是其中元素的所有可能的并 当然,也包括空并,即空集。它显然满足任意并性质,那么为使它是一个拓扑,需且只需要满足和有限交性质。
前者等价于对任意,.
现在假定的有限交性质,为验证拓扑的有限交条件,考虑 中有限个集合 的交。如果该交为空集,那么这个空集已经在里面了,因此有限交性质在此时是成立的。如果不是空集,对任意,可以找到是一个中包含的集,根据的有限交性质,存在被包含在之中,故 反过来,如果中元素的所有可能的并确实生成了一个拓扑,那么都是开集。中的开集的有限交都是开集,并且都包含所以非空,于是该开集是中元素的并,其中一定有一个包含从而在中。
只需说明中每一个元素都是中元素的并。事实上,取,对于所有,由于,可以找到一个中的元素,从而
◻
推论 1.1. 设是一个关于开集的性质,它保持任意并,即:如果对一族开集, 成立,那么成立。对于这样的性质,为验证它对所有开集成立,需且只需验证它对的某一组开集基(拓扑基)成立。
说人话:为验证映射是连续的,需且只需要对的一组拓扑基中的元素验证是开集。
上的拓扑
上的拓扑如前所述,是由开区间(一维的开球)生成的,即开集定义为任一点都包含一个在该集合内的开区间的集合,而所有开集都是开区间的并。
换而言之,所有开区间是的拓扑基。
练习 1.2. 证明,所有以有理数为端点的开区间也构成的拓扑基,即它定义的拓扑与上的通常拓扑等价。
上的拓扑则按即平面上的拓扑给出,即开集定义为任一点都包含一个在该集合内的开球(当然,二维的球是圆)的集合,而所有开集都是开球的并。
练习 1.3. 事实上,这句话中的所有’开球’也可以改成’开矩形’,所定义的拓扑是一样的。换而言之,证明开球,开矩形,开正方形这三种拓扑基是等价的。
在扩充实数上的拓扑,即实数加上正负无穷两个点的空间上的拓扑和上几乎类似,它是在的所有开集之外,添加了 和 这两种开区间得到的拓扑。
抽象测度
一个测度空间是指如下一组内容
一个空间
一个的子集族,叫做-代数,里面的集合叫可测集或者-可测集.
一个测量子集大小的函数(允许取无穷值)
它们需要满足如下性质:
(-代数) 中的元素在可数交,可数并,补集等运算下封闭。(事实上,根据对偶律,只需要验证可数并、可数交中的一个,以及对补集封闭)
(测度的可数可加性) 如果是一列(可数)的互不相交子集,那么 这里两边需要同时为正无穷或者同时有限。
也可以记为. 在这个定义下,一个概率空间是指一个满足的测度空间,通常记为. 对于一般的测度,通常有使用不同的记号,常用的记号如等。
集族生成的-代数
给定的一些子集,我们可以对这些些子集进行可数交,可数并,和取补操作(为什么这保证了一定在其中?),来得到一个由生成的-代数,它是包含所有 的最小-代数,所以也可以定义为的所有包含了 的 -代数的交,由于即的所有子集构成-代数并且该-代数包含,这个交是非空的,于是这保证了由生成的最小-代数是存在的。
例 1.2. 由有限个子集生成的-代数由以下有限多个元素组成: 于是我们知道个集合生成的-代数最多有个元素。
练习 1.4. 在上,由所有形如的子集生成的-代数是什么?
可测函数的概念
一个从测度空间到拓扑空间的函数称为-可测的,或者简称可测,如果对任意开集, 都是里的可测集。什么意思呢?回忆Lesbegue的积分理论中我们希望对函数进行值域分解,那么就需要在这个值附近时,对应的原象的大小可以用测度精确的测量出来。事实上,对于的函数,它可测当且仅当对任意是可测的。首先这是一个必要条件,因为是开集,而可测函数在可数交并补下封闭,由此可以由这个开集生成上的任何开集。
虽然可测函数的概念如我们所说可以定义在一般的拓扑空间上,但是绝大多数时候我们所用的都是实可测函数,因此我们将后一句话作为实可测函数的定义,即要求对任意都是可测的。更精确的来说,我们可以用如下一个命题来叙述。
在一般的拓扑空间中,由所有开集生成的-代数叫做的Borel -代数,其中的元素称作Borel可测集。
推论 1.2. 一个可测函数复合一个连续函数得到的复合是可测的。这里是测度空间,是拓扑空间。
命题 1.2. 设是一个关于拓扑空间的子集的性质,满足成立。如果它保持可数交,可数并和补集运算,那么为了验证对所有Borel可测集成立,需且只需验证对所有开集成立,或者对所有闭集成立,或者对所有开集基成立(但此时你的拓扑基需满足任何中的开集能写成可数个开集基的并!)。
Proof. 我们对开集的情形说明,闭集的情形是类似的。 由于开集是Borel可测集,对所有Borel可测集都成立的性质显然需要对开集成立。下面我们来说明对开集成立可以推出对所有Borel可测集成立。事实上,令 由于保持可数交并补,并且, 这是一个代数。由于Borel -代数是包含了所有开集的最小代数,它一定被包含。 ◻
推论 1.3 (可测性). 首先设是一个测度空间到一个拓扑空间的映射,那么以下说法等价
是可测的,即对任意开集, .
对任意闭集, .
对任意Borel可测集, .
推论 1.4. 作为一个特殊情形,如果是一个实函数,那么以下说法等价
是可测的
对任意开区间, 是可测集
对任意, 是可测集
对任意, 是可测集
对任意有理数, 是可测集
对任意有理数, 是可测集
上面几条改成, .
例子:中的Lesbegue测度
这是最早构造出的测度的例子,对于上的一个集合,我们希望能定义出一个测度来测量的体积。 遗憾的是这样的体积函数并不能对的所有子集定义出来!这是因为的子集实在是太多了,里面可以有很多很坏的子集,这些子集的存在会阻碍任何一个具有良好的性质的体积概念的存在。比方说 解决方案是,要么引入外测度来对所有集合定义出体积,但是这个外测度不一定满足可加性。要么就不再追求对所有的子集定义体积,而是将视野限制在所谓’可测集’上,从而在可测集上,可加性等良好性质得到保持。
事实上,上的Lesbegue外测度定义为 这里是一族-维正方体,它们的并要求盖住,表示通常意义下立方体的体积。可以由这个外测度引出Lesbegue测度, 不过,我们不打算详细讲解Lesbegue测度的构造,因为其过程是非平凡的,会花去太多时间。而这与我们概率论的主题相悖。简单来说,中的可测集就是由所有开集再加上所有-测集(即外测度为的集合)生成的-代数(即所有开集和零测集通过反复使用可数交,并,补得到的集合构成的集族)。在这些可测集上,测度可以由长方体的体积唯一确定下来,这里是.
例子:离散空间上的测度
这里设是一个有限集,是的所有子集,定义 是某些给定的非负实数。那么构成一个简单的测度空间。当时这个测度就是计数测度,对于这个测度,任何子集的就是集合的元素个数。
例子:概率测度
这里把符号换成,如果,那么我们称这个测度空间是一个概率空间,可以称作状态空间,-代数里面的元素也叫事件,也叫概率测度。而的可测函数称作随机变量。这是今后我们会反复见到的例子。
投硬币的例子
假设我们要投次硬币,投的过程是独立的并且每次正反面的机会相等。如果我们用一个序列来表示投硬币的结果,其中或分别表示正面和反面。那么在这个问题中,状态空间就是 它的-代数,即所有可测集由的所有子集构成, 其上的概率测度为由每个序列都赋予概率得到的离散概率测度 那么可测函数是什么呢?比如可以定义为第枚硬币的结果 这就是上的一个随机变量。类似的,等等这些都是不同的随机变量(也即可测函数). 事实上,由于我们定义的里面的所有子集都是可测集,所有函数都是可测的。
练习 1.5 (). 设是一个测度空间,证明,是一个可测函数当且仅当的实部和虚部, 是可测函数。这里是一个视为与相同的拓扑空间。
测度和可测函数的基本性质
定理 1.2 (测度的性质).
(单调性), 如果是两个可测集,那么. 事实上,如果此时,那么还有
(递增极限), 设 是一列递增的可测集,并且,那么
(递降极限) 如果是一列递降的可测集,并且,记,我们有 测度的递增极限和递降极限性质也叫单调极限。
(可数半可加性), 如果,这里都是可测集,那么
如果是上的一族以为可测集的测度,那么对任意非负实数, 也是一个测度。(事实上,该命题对可数个的情形也成立。)
Proof.
. 当时,都是有限的,于是自然有
如果有一个的测度为无穷,那么两边都是无穷。于是可设所有的.记,约定.那么 由可数可加性,
由于,考虑.这是一个递增极限,并且有.那么由递增极限, 即.
首先由单调性,可以将替换为.然后, 这说明不等式对有限多个的情形成立,即 两边取极限,利用递增极限性质有
◻
练习 1.6. 举一个当时,递降极限性质不成立的例子。
定理 1.3 (可测函数的基本性质).
如果可测,则, 都是可测的。从而得出都是可测的。
如果是一列可测函数,那么和都是可测的。
Proof.
如果,常数显然是可测的。否则或者对任意也是可测的。
对于,可以将它视为映射再复合得到的.只需证明前者是可测的,后者是连续的。对于前者,考虑上开矩形的拓扑基,对于每一个开矩形,从而是可测的。对于后者,考虑对任意开区间,取原像集中的任何一点,那么它满足. 故可取包含的开矩形,这里.
事实上,还有一种利用有理数的可数性质的证明,只需验证以下式子,这里是任意有理数。
只需注意到 然后注意到.
◻
练习 1.7. 证明,对于复的可测函数,函数都是可测的。是复数。
测度的积分
简单函数的积分
对于任何一个可测集, 定义如下称之为 的示性函数或特征函数(不要将它与后面要讲的随机变量的特征函数即傅里叶变换混淆), 记为,为 在许多文献中也记为,这是记号上的差别。
对于一些常数和一些可测集, 形如的函数叫做(非负)简单函数。简单函数的特点是其值域仅为有限多个点,那么我们可以对简单函数的值域进行重新分解,使得集合互不相交。令为一个简单函数,其值域由有限个值组成,那么定义 我们就有如下分解 这称为简单函数的标准分解(注意到简单函数可以有很多种不同的分解)。简单函数的积分可以很容易地定义出来,可以定义 这里约定.然后对于可测集, 定义 有一个麻烦的地方是,需要说明这个定义不依赖于简单函数的分解的选取。
命题 1.3. 非负简单函数的积分不依赖于分解的选取。
Proof. 设是两种不同的分解(如果项数不同,可以引入空集)。考虑集合的所有可能的交集(至多有限个),我们记是这里面产生的所有可能的不同的交(去除空集)。
事实上,每一个都形如 其中在中选取,在中选取。可以看出它们两两不相交并且它们的并是整个. 那么我们可以将和写成一些的并,设是指标集使得 注意这是不交并,因此 我们可以将表达式重写为 同理 由于两两不相交并且非空,通过取并比较两边的值我们可以得到这两个分解的系数是完全相同的。于是通过对积分做相同的操作我们也可以得到 ◻
下面一个命题留作练习
非负可测函数的积分
事实上,(非负)简单函数是构造整个积分理论的’砖块’。下一步是对于任何非负可测函数,我们定义
这里取遍的所有简单函数,并约定 容易看出非负可测函数的积分满足如下性质
(单调性I) 如果是可测函数,那么 这是上确界的性质。
(单调性II) 如果, 是可测集,那么 可由单调性I得出。
(线性性I) , 是常数,那么 基本上就是定义。
若,则无关的值,
若,即使,也有
收敛定理
定理 1.4 (单调收敛定理). 如果是一列递增的可测函数,设它的极限是,我们有也是可测的并且
Proof.
由的单调性容易看出是一个递增集,于是有 以及 从而知是可测的。
如果是正测度的集合,那么显然两边都. 事实上,显然有 从而由测度的递增极限知 对任意成立。
于是接下来假定是零测集。但是零测集不影响积分,可以将替换为, 替换为,命题中涉及的积分都不改变。于是接下来我们可以假定.
设,任取一个简单函数,定义集合,则由收敛性有. 这表明 而右边是一个测度,由测度的递增极限性质,取极限时有 再对的所有简单函数取上确界,得到 这里是任意的,于是我们得出不等式, 而反向不等式显然成立。
◻
命题 1.5. 对任意非负可测函数,存在一列递增的非负简单函数.
Proof. 如果,即是有界的,那么定义 如果不是有界的,则定义 如果要具体写成简单函数的形式,令,这里,我们有 它显然是递增的,并且. ◻
Proof. 取递增的非负简单函数, , 那么因而由单调收敛定理 而左边的极限正是. ◻
练习 1.8. 利用上述推论,证明,一个非负可测函数所定义的积分 也是一个上的测度。
下面的Fatou引理是证明测度积分论的里程碑,Lesbegue控制收敛定理的关键。
定理 1.5 (Fatou引理). 对于一族非负可测函数,我们有
Proof. 显然有 这里注意到关于是递增函数列。于是两边取下极限,利用单调收敛定理就有 ◻
练习 1.9. 给出Fatou引理中等号不成立的例子。
一般函数的积分
对于取值在的一般可测函数, 设, 是两个非负可测函数,那么显然. 在测度意义下的一般的函数的积分由下式定义 这里由于涉及两个非负数相减,需要避免的情况,于是只要当上述两个积分至少有一个不为无穷时,的积分是可以唯一的被确定下来的。不过一般意义上我们所说的可积函数是指满足 的函数,此时都小于无穷。有时我们需要考虑取值为复数的可测函数.根据上的拓扑,它可测当且仅当都可测,这时我们可以定义它的积分为 而我们说可积等价于都可积,这也等价于说.我们记上所有可积(实或复)函数构成的空间为,简记为.
一般积分的定理
Proof. 显然成立,故只需证明. 设,我们有 即 注意由可积,也可积并且上述六个函数的积分都是有限的。于是从非负的积分的可加性,有 我们相减得到 ◻
定理 1.6 (线性性). 对于一般的复函数和复数,我们有也是可积的,并且有
Proof. 通过给乘以一个单位复数调整的辐角,可以将调整到非负实数。此时它就等于,而两边的积分都不改变。于是对这样的, ◻
接下来我们终于迎来了本章最后一个重要定理,它将是测度积分论中处理各种极限过程的有力手段。
定理 1.8 (Lesbegue控制收敛定理). 设是一族可测函数,其逐点极限为.如果存在非负可测的可积函数使得对所有成立,那么也是可积的,并且
Proof. 事实上我们证明一个更强的命题 对非负可测函数用Fatou引理,有 这里用到了的可积性。此即 ◻
练习 1.10 (). 设是一个测度空间. 考虑由某个开区间上的实数编号的一族函数.假定是可积的并且关于可导并有导函数连续,以及是可积函数。证明对任意有 注意需证明对任意, 是关于可测的。
练习 1.11. 利用上的计数测度,讨论级数与积分的联系。
说明,是可积函数当且仅当绝对收敛。
利用控制收敛定理,证明调和级数的和发散(到).事实上,假定可积(即调和级数收敛),用控制收敛定理考察函数列
用类似的方法,证明若非负递降序列的和收敛,那么.
练习 1.12 (特征函数的应用). 设是一个集合,是一些子集,可以将它们视为中具有一些性质的元素构成的集合。记为包含的最小-代数,是至少具有一个性质的那些元素构成的集合,则是不具有任何性质的元素构成的集合。通过展开,证明 即 当假定上式右侧对的每一项都可积时,整个式子可积。从而对上的任一个对可测的测度积分,在可积的假定下(),得出一般的容斥原理 说明对计数测度,概率测度分别能得到什么式子?
练习 1.13 (无限项的容斥原理). 证明,如果 那么无限项的容斥原理成立
积分记号说明
如前所述,在明确对哪一个空间,测度和变量积分时,的积分可以直接记为 当我们想要强调在对这个测度积分时,或者要强调被积函数的变量是,亦或者强调积分的空间是时,我们将上述积分写成 特别的,对于或上的勒贝格测度,可以写为,通常也直接写为.
非负可测函数的Radon-Nikodým定理
本节是硬核的测度论内容,想尽快进入概率论的同学可以选择先将该定理承认。
如果,我们就说是有限的。如果存在一族使得且,我们就说是-有限的。
对于可测空间上的两个测度,如果对任何可测集有, 我们就称关于绝对连续,记为。如果存在集合使得对任意成立,我们就说集中于上. 如果集中于上而集中于上(这等价于说),我们就说和互相奇异,记为.
设是一个测度空间,回忆前面证明过,如果是一个非负可测函数,那么 是一个测度。它相当于在原来的测度上进行了’加权’。那么自然我们想问,是否所有上的测度都能写成这个样子?答案当然是否定的,因为这个积分的定义依赖于你原来的测度的定义。如果你原来的测度就是测度,即什么集合都给出的测度,那么任何非零测度都不能写成上述形式。由积分的性质我们容易观察到,任何上述形式的测度都是关于绝对连续的,那么这给出了一个将任意测度表达为指定测度的积分的必要条件。而事实上这是一个充分条件。
定理 1.9 (Radon-Nikodým). 对于上两个-有限测度,如果,那么存在非负可测函数使得 其含义为 事实上,对于任两个-有限测度,存在一个测度的分解,将分解为对绝对连续的部分和互相奇异的部分: 使得从而, 并且.
为证明该定理,我们需要讲一些别的内容,首先定义一个有趣的概念。我们说一个有界符号测度是指一个上的有界函数 满足可数可加性。准确的来讲,这就要求对任意可数的不交并, 我们有 其中右边的级数我们要求绝对收敛(因为不像非负和与求和次序无关,一般的收敛级数与求和次序无关当且仅当它绝对收敛)。那么我们注意到,两个有限测度的差是有界符号测度。反过来,能否将有界符号测度写为两个测度的差?这个过程就是如下的Hahn分解。
定理 1.10 (Hahn). 任何有界符号测度可以唯一的写成两个有界,非负,并且互相奇异的测度的差。即
Proof.
我们考虑找一个使最大的集合,相当于先把的’正的部分’集中起来。由有界性,可以取出一列使得 注意 归纳可得那么通过选取子列,不妨设,由递增极限性质(利用可数可加性容易证明,对有界符号测度成立递增极限和递降极限性质)可以得到 于是再由递降极限,是一个可测集并且.
我们来证明就是我们要的,而就是我们要的,从而它们自动是互相奇异的。从 我们知道,只需验证有界符号测度和是测度,即取值非负即可。 如果有集合使得,那么,这与的定义相悖。故是非负的,同理也是非负的。
还需证明唯一性。设有另一个分解,这里,那么设集中在上而集中在上。那么 同理,从而在上都是. 我们有 同理.
◻
那么接下来,我们看看Radon-Nikodym的证明还需要什么。先考虑都是有限测度的情形,我们定义 那么可以取出一系列可测函数使得它们的积分.注意到,如果,即满足,那么它们的最大值也满足,即 .这是因为可以取和,因而对任意, 这表明也满足条件。对取极限,由单调收敛定理有并事实上取到积分的最大值. 考虑 我们希望证明.那么也就是说,如果它们不互相奇异,我们希望能找出一个积分非零的函数使得,这样于是就会和的积分极大性质冲突,从而得到矛盾。为了做到这一点,我们需要用到Hahn分解这个非平凡的结论。为了尝试得到这样一个函数,我们要考虑越来越小的可能的.考虑一族有界符号测度 并根据Hahn分解,设集中在上,对应的集中在上。那么我们就有,但是关于的积分还不知道是不是正的。由于递增时,也递增,故可以假定是一个递增集,那么令 注意到,从而 这表明集中在上。 由于假定了和不互相奇异,这也就是说,对任意可测集,至少有一个不是.那么取就会有,从而由递增极限知存在使得.这就表明的积分是正的并且.
对于唯一性,考虑是另一组分解,那么,由于左边关于绝对连续,右边关于互相奇异,这样关于一个测度既绝对连续又互相奇异的测度或者有界符号测度只能是.具体来说,可设右边集中于上,这里.则对任意由于绝对连续,.这就表明对任意可测集合,上述等式两边都是. 至于关于在至多相差一个零测集上的唯一性则是显然的。
现在我们回到-有限测度上来,由于空间可以分解成至多可数个可测集的不交并,其中每个关于的测度都是有限的(这可以将分别得到的-有限分解相交来得到)。那么这就化归回了有限测度的情形,将得到的集中于上的测度和可测函数相加即可得到上所需的结论。
注 1.1. 其实Radon-Nikodým定理还有一个更简单的利用Hilbert内积空间的证明,并且结论更加一般(对复可测函数成立)。
推论 1.7. 若是上的有限测度,则存在上关于Lesbegue测度非负可测的函数和一个关于奇异的测度使得 如果,则.
测度论的其他重要内容(非主线,不讲)
本节内容是测度论的进一步的一些内容。它们在概率论中当然也有用,但我们不打算讲,今后要用到时会承认这些结论,留给感兴趣的同学阅读。
几类子集结构,单调类定理
设是一族子集,我们称它是
一个-集,或者-类,如果保持有限交。
一个单调类,如果保持递增极限和递降极限。
一个-集或者类,如果它是单调类,并且子集之间可以作差(简称为真差),即, 另外还要求.(事实上,由于-集内可以取补,单调类的假设等价于只假定递增极限)
一个环,如果保持作差(不需要是真差)和有限并(从而也包含有限交)。
一个半环,如果保持有限交,并且作差产生的集合是有限个内不交的集合的并。
一个代数,如果保持有限交并补,并且包含.
类似于前面讲过的集合生成的代数,我们分别记生成的-集,单调类,集和代数为.
引理 1.2. 我们有.即如果一个集族既是-类又是-类,那么它是-代数。
Proof. 显然在类中可以取补,于是我们有有限交和有限并。设是一个可数的子集族,我们希望证明的可数并还在中,从而由于可以取补集,就会得到可数交也成立。
我们试图将的并的问题化为一个递增的单调类的问题,那么考虑,由于有限并在内,这个集合也在内。于是由于是一个递增集, ◻
Proof. 根据上面的引理,我们需要证明是一个类,从而, 而 是显然的。 对任意,我们考虑 它显然包含以及,并且保持真差和递增极限。于是我们知道它包含. 这表明 这里我们用表示集族中元素的交构成的集合,区分于集族的交集。 下一步,我们令,考虑 类似的,由我们证明的结果,它显然包含,于是再由集的性质我们推出它包含,因此 至此我们证明了是一个类,从而是-代数,从而包含. ◻
定理 1.11 (单调类定理). 设是一个集,是一个集,那么
推论 1.8 (测度的唯一性).
如果是-代数上的两个测度,并且和在一个类上相等,满足, 那么它们在上相等。
同上,但的条件放宽为,存在可数个递增集使得并且.
Proof.
只需注意到由测度的性质可以推出是一个类,从而包含.
是一个单调类,它包含.为验证它是一个类,只需验证真差。 对任意,考虑 那么此时,而又保持递增极限,因此.
◻
推论 1.9. 对于上的两个测度(定义在Borel可测集上),如果它们在所有有界开区间上有限并相等,那么它们相等。同样的命题对有界的闭区间,有界的左开右闭区间等,都成立。
测度的扩张,Lesbegue测度
乘积测度,Fubini定理
设,是两个测度空间,我们可以定义所谓乘积代数,是由所有形如和生成的-代数,记为. 在这个-代数上,可以定义乘积测度,为 所唯一确定的测度(唯一性由测度的唯一性定理给出)。具体来说,对任意可测子集,我们试图用积分来定义乘积测度 但是这里我们会遇到一个问题:内层积分里可测吗?以及整个积分是否对是可测函数?为此我们需要如下基本的引理
引理 1.4 (截面).
设是上的非负可测函数,那么对任意,函数是上的可测函数。
如果是-有限的,那么 是可测的。
Proof.
命题显然对乘积形示性函数是成立的,这里.设 我们知道所有矩形.由于, , , 我们知道是一个-代数,于是它等于,从而命题对所有示性函数都成立。那么由单调收敛定理可知命题对所有非负可测函数成立。
假定有限。同样可以验证对于乘积形示性函数命题成立, 然后知使命题成立的子集包含由所有矩形生成的-类。由的有限性我们可以做真差,再由单调收敛定理它同时也是一个-类,于是它包含所有矩形生成的-代数,即. 再由单调收敛定理知命题对所有非负可测函数成立。
对于是有限的情形,可以将命题写为可数个有限测度的和。
◻
定理 1.12 (Fubini). 设分别是上的-有限测度,那么存在唯一的上的测度,使得 并且对任意可积函数满足累次积分可交换
Proof. 存在性和唯一性已经证明了。由的-有限性可以推知也是-有限的,故可以假定其有限。此时对于累次积分,先验证乘积形示性函数,再由单调类论证推广到一般的示性函数和非负可测函数上。为推广到可积函数上,注意对有积分有限,故内层积分,关于测度,几乎处处有限。我们可以修改的值使得在这些零测集上,从而是处处有限并不影响积分。那么此时可以对非负函数作差从而得出积分换序对可积函数成立。 ◻
概率空间
回忆一个概率空间是指一个测度为的测度空间,即要求 上的一个随机变量是指一个可测函数. 通常,我们用大写字母如来表示随机变量,而大写字母等则通常表示内的可测集。用小写字母表示空间中的点。
更一般的我们可以考虑一般的可测函数,这里通常是拓扑空间或者度量空间。不过最常用的情形还是所谓的随机向量,即可测函数.这等价于给出个随机变量.
期望值
对于随机变量,如果它是可积的,即,则可以定义它的期望值 换而言之,就是概率空间中的’积分号’。那么期望值的性质就可以直接从积分的性质得到,这包括单调性,线性性,单调收敛定理和控制收敛定理等。一般而言,将期望值视为概率学中积分号的特殊写法即可。
注意到对于任意事件,我们有可测并且 这给出了表达事件概率的期望写法,即的概率等于随机变量的期望。
例 2.1. 设是一个只取有限多个值的随机变量(相当于简单函数),那么设它只取这个值,令我们有 因此
有了期望值之后,可以定义一系列基本的关于随机变量的不变量。我们定义随机变量的方差,记为或者,是指 只要至少有一个可积,那么由于方差里的是非负随机变量,这个积分总是有定义的(可以是),但不一定有限。我们说的方差存在,或者有方差,或者有二阶矩则是指它的方差有限(这蕴含了可积)。
为了衡量两个随机变量的数值正相关性,我们通常引入如下协方差的概念,对于随机变量,我们定义它们的协方差为 由Cauchy不等式显然有 于是我们定义的相关系数为.这是一个之间的实数,它反映之间的正相关性。
命题 2.1 (Markov不等式和Chebyshev不等式). 以下设.
(Markov) 对于非负随机变量,我们有
(Chebyshev) 对于任意随机变量,如果它的方差有限,那么
Proof.
利用上述Markov不等式,取有
◻
练习 2.2. 利用Markov不等式,说明,五倍于平均收入的人不超过. 给出一个直观理解。
条件与独立性
初等条件概率
设是两个事件,满足.那么定义 称作发生时,的条件概率。这可以理解为我们在已知事件发生时,发生的概率(可能)发生了变化。关于条件概率,有一个很简单但有用的式子
例 2.2. 这是一个著名的条件概率问题,小明有两个孩子,其中一个是女孩,请问另一个是男孩的概率是多少?(假定自然出生率各为,实际自然出生率与稍微偏差了一点点.)
可设状态空间为其中每一点都具有的概率,那么相当于在问 这个结论是正确的,但初看起来可能有些反直觉。
练习 2.4. 证明,若,那么 是上的一个概率测度。
练习 2.5 (分布的分解,简单情形).
证明,若,
设是一个取值在可数个离散值上的随机变量,满足每个离散取值的概率.那么证明 说明这如何将概率测度分解为了一些条件概率测度的加权和(加权和也是积分)。这是一个后面要讲到的测度的分解的例子 即在积分的意义下, 这里是一个’概率核’,即它关于是测度,关于是可测函数。
下面一个练习可能会让你们沉思一会
练习 2.6 (). 小明有两个孩子,其中一个是在星期天出生的女孩,请问另一个是男孩的概率是多少? 换成月日呢?改成’知道她的身份证号码’呢?
我们再举一个经典的’Bayes统计推断’的例子。
例 2.3 (Bayes统计推断). 某药物公司开发了一种疾病检测试剂,它对疾病的检测能力具有的敏感度和的确定度,即对阳性病例检测出阳性的几率为,而阴性病例有的概率误判为阳性。假定该疾病在受试对象中的出现率为,现在有一位受试对象被该检测试剂判断为阳性,那么该受试者实际患病的几率是多少?
记为实际是否患病的随机变量,为检测结果的随机变量,分别取值代表阳性和阴性。那么由条件概率公式, 在这个式子中,是我们想了解的对象,是我们获得的数据和信息,叫做’先验分布’,代表我们在获得数据之前对的了解;叫’似然函数’,这个分布需要是已知的。叫’后验分布’,代表获得信息之后我们对于想知道的对象的新的认识;而分母上的在Bayes统计推断中通常被忽略,因为它是一个归一化常数,可以由对分子积分得到。
那么,关于试剂的敏感度和确定度的信息就相当于我们的似然函数,关于疾病在受试者之间的分布就是先验,我们想知道的就是的后验分布。本例中我们可以算出 即由于该疾病在受试者中的密度远低于诊断的精密度,实际上有的概率是假阳性。
练习 2.8. 假设某受试者做了两次独立的检测,结果为,求
事件的独立性
我们称事件是独立的,是指 形象的来说,就是说已知发生并不影响发生的概率,即(但这个式子中需要假定故不作为定义使用),或者已知发生并不影响的概率。 有时记为.
容易验证,能推出 里每一个元素与 里每一个元素独立,即,各自生成的代数互相独立。这启发我们定义,对于两个-代数,,如果对任意 和 总有 ,我们就说与独立,记作.
练习 2.9. 验证,零测集和概率为的集与任何事件都独立。
随机变量的独立性
对于一个随机变量,或者一般的可测函数,我们说生成的代数,记为,是指,即所有Borel集的原象构成的-代数(由于原象的性质,这显然是一个代数)。这个代数可以理解为所有与直接关联的事件,里面包含所有形如这样的事件,.
我们说的两个随机变量,或者更一般的,两个到一般拓扑空间的可测函数,是独立的,是指它们生成的-代数与独立。那么我们很容易想象,要验证独立性,应该只需对一部分Borel子集验证即可。
定理 2.2. 关于两个随机变量,以下说法等价
对任意实数有.
,即.
对任意非负或可积的Borel可测函数成立。
Proof.
():所有形如的集合能生成,能生成.因此可以推出.精确的说,固定任一个,考虑 我们知道它是一个包含了所有的代数,故. 再固定任一个,考虑 我们知道它包含了所有,并且是一个代数,因此包含.这就证明了.
():对任意有,而这就是 考虑都是上的非负Borel简单函数,即 和 那么, 故有 再由单调收敛定理知上式对任意非负Borel可测函数成立。为方便记号,以下将简记为.对于实可积函数的情形,从可积推出非负可积,那么由独立性以及我们刚证明的部分有 从而知可积,同理也都可积。那么从 我们知道可积,故对实可积函数也成立。容易证明对复可积函数也是成立的。
(): 由于中的所有集形如,,取即知.
◻
例 2.4 (三门问题). 这是一个曾经引发大众讨论的著名的问题:在一个电视节目中,你要在三个门中选择一个,有两个门后面是羊,而另一个门后面是大奖。当你选择好一个门准备开奖之后,主持人会为你打开一扇你没有选择的门里面有山羊的一扇门,然后问你:你要不要改选另一扇你和主持人都未选择的门?
事实上,这是一个典型的条件概率问题。并且问题的答案可能没有你想的那么简单。不妨设是三个门的编号,设分别表示大奖,你,主持人选择的门,以及另一扇没选择过的门的编号的随机变量。那么在这个例子中,,但是的选取却与不独立,而则与都不独立。这里我们假定的分布是在三个门之间没有偏好的,均匀的分布。 那么是什么?它就是你选中的门后面有奖的概率。注意到由于,对一个必然事件取条件概率不会改变原有的概率,由的独立性我们有 也就是说,保留原来的门仍然是的概率。同样的论证对于和并不成立,不能误认为它们等于,因为和并不独立。由于一定是的一个置换,我们有 取期望得 从由知.
但是问题到这里还没有结束,仔细观察,其含义是已知主持人选了一个没有大奖的门,然后问你要不要换另一扇主持人和你都没选过的门。这里我们相当于是闭着眼睛参加节目,即不知道主持人选的是什么门的情况下才能算出的概率。如果我们看到主持人具体选了哪扇门,即求,情况可能会发生变化。注意虽然是在测度下独立的,但没有理由它们假定在条件测度下独立,即它们不一定条件独立,因为主持人对门的选取可能有所偏好。当他可以选两扇门时,有可能会对其中一扇更有偏好而不是在两扇门中间平均的选取。我们设 这里当时显然有,而时则在中的两点上的和为. 那么我们计算’后验分布’(这里) 注意对之前的示性函数恒等式乘以然后取期望一样有 于是 我们注意到,尽管主持人的偏好对该概率有影响,但是仍然是无脑换另一个门更好。举例来说明,如果主持人有’小数字偏好’,即当他可以在两扇门中选时,总是倾向于选择编号小的门,即,那么 惊人的现象发生了,主持人的选择倾向极大的改变了该概率,因为在已知主持人存在倾向的情况下,主持人的行为透露了信息:如果,他一定会选号而不是号。但如果你闭上了眼睛,没有得到这个信息,或者主持人没有倾向,即,那就还是.
多个随机变量的独立性
我们说一族-代数是独立的,是指对任意有限个来自不同的子集,都有 而一族随机变量是独立的,则是指它们对应的-代数独立。值得注意的是,这个要求强于假定它们两两独立。
练习 2.10. 找出两两独立,但它们作为一族-代数不独立的例子。
定理 2.3.
若是一族由集合编号的互相独立的代数,是任一个集合的映射,那么 是一族由编号的互相独立的代数。这里表示由右边所有代数生成的代数。
互相独立等价于对任意,
练习 2.11. 如果是有限个两两独立(没有假定互相独立)的随机变量,它们的方差收敛,那么证明
Kolmogorov 0-1律
下一个引理的证明十分简单,我们留作作业。
引理 2.1. 以下说法等价
.
中只有零测和测度为的集合。
任何可测函数都是a.s.常数。
满足该等价关系的-代数叫做平凡的。
定理 2.4 (Kolmogorov 0-1律). 设是一列可数的独立的-代数,令 则是平凡的。
Proof. 从, 出发,对右边取交我们能得到 然后将扩展到,有 从而得到所需结论 ◻
Kolmogorov 0-1律是一个关于独立性的非常有趣的结论,它说的是一列独立事件的尾巴必然是概率0或1,即只要一个事件只依赖于一列独立事件的尾巴,那么它只能以概率0或1发生。虽然它的证明看似简单,但导出的结论常常是非显然的。这也要归功于我们将独立性归结于-代数的系统性的理解。
例 2.5. 设是一列独立的随机变量,那么 要么几乎处处收敛,要么几乎处处发散。事实上,记是一列独立的-代数,那么表示这个和收敛的事件可以分解为 可以看到,这的确是属于的可测集,从而由Kolmogorov 0-1律,或.
例 2.6. (Percolation Theory) 设平面上是一个正方形网格,每条边都独立的具有概率被连起来,概率不连接。那么 是一个与有关的函数,直觉上看应该是随着递增的(这是对的,当然,这并非显然)。由Kolmogorov 0-1律,它只能等于或者.即这个函数当增加时,会在某一临界点突然从跳变到,而完全不会取这样的值!
初等条件期望
我们知道,当时,构成一个测度。那么对这个测度进行积分的话,我们知道 这提示我们.利用简单函数逼近,单调收敛定理,在假定随机变量可积时,这给出了条件期望的如下定义 特别的,如果是一个取值在可数个离散点上的随机变量,满足,那么可以定义 我们发现,成为了一个关于的函数,暂时记该函数为,那么我们定义是如下一个复合的随机变量 以下习题都假定满足初等条件期望所需的假设,即只取可数个离散值并且每个值的概率为正。
练习 2.12. 说明,(初等)条件期望是比(初等)条件概率更一般的对象。并且可以看成一个双变元映射 其中该函数满足:固定第一个变量时,的第二个变量是可测函数。固定第二个变量时,的第一个变量是概率测度。这样的二元映射称作一个概率核(probability kernel).
练习 2.13. 由所有形如的集合生成。证明随机变量 是 可测的。说明,任何可测函数由的值完全决定,即形如.
练习 2.14. 证明,对于初等条件期望假设下的随机变量,成立如下’全期望公式’ 提示:利用
练习 2.15 (). 在可积的假定下,说明是所有上可测函数中,最接近的那一个。即在所有可测函数中,使得最小。
随机变量的分布律
对于一个实值随机变量,利用上的概率测度,它可以诱导一个上的测度,对任意Borel可测集 容易验证上述确实定义了一个上的测度(这里是博雷尔可测集,不是拓扑基)。称之为随机变量的分布,或分布测度。类似的也可以定义一般可测函数的分布,以及随机向量在上诱导的分布测度,通常称为的联合概率分布。在不引起混淆的情况下,我们有时也把分布测度记为或者,满足. 联合概率分布有时记为或者.特别地,对于随机变量和实数,记 称为的分布函数(也叫累计分布函数)。我们说两个随机变量是同分布的,如果他们在上的分布相等,即.
例 2.7. 考虑扔一枚硬币的结果,即一个随机变量满足 那么的分布为一个集中在两点上的离散测度: 其分布函数为
命题 2.2. 同分布,即当且仅当它们的分布函数相等。
Proof. 如果,那么显然
反过来,如果,那我们可以推出对任意区间,有.而所有这些区间构成一个类并且,故由上一章测度的唯一性知道. ◻
定理 2.5 (用分布计算积分). 设是一个随机变量,它具有分布, 是一个Borel可测函数,使可积或者可积。那么
Proof. 对于,等式变为 这显然是成立的。于是等式对非负简单函数成立,由单调收敛定理我们推知该等式对所有非负Borel可测函数成立。故对于可积函数也成立,由此知对于复值函数也是同样成立的。 ◻
连续型分布
记或表示上的Lesbegue测度。如果一个随机变量的分布对绝对连续,即,那我们就说是一个连续型随机变量,对应的分布称作连续型分布。根据Radon-Nikodym定理可知,存在非负可测函数 使得 其含义为,对任意Borel可测集, 此时称是的概率密度函数。这个函数在相差一个Lesbegue-测集的意义下是唯一的,给出这个概率密度函数就唯一确定了其分布。还可以算出,它的分布函数可以由概率密度函数的定积分给出 接下来我们举一些常见的连续型分布的例子。
均匀分布
所谓均匀分布,就是指上这样一个概率测度 记为,这里, 是Lesbegue测度。它的含义是,中的值出现的概率是均匀均等的。举例来说,我们常说’取一个到的随机数’,就是指给一个服从均匀分布的随机变量,使得. 显然,这个测度关于是绝对连续的,因此可以写
Proof. 关于的式子是显然的。我们来计算以下两个积分 从而 上述简单的式子是计算方差的常用方法,在这里我们可以得到 ◻
指数分布
指数分布是指由概率密度函数 确定的分布,即如下关于绝对连续的测度 记为,这里要求参数.
其证明是简单的微积分计算,故留作读者的练习。
例 2.8. 指数分布代表的是在时间轴上以概率密度均匀分布的点态事件之间的等待时间或者间隔时间。准确的讲,是密度为的Poisson过程的等待时间。举例来说明:全球坠机事件的发生可以看成是一个Poisson过程,其发生的可能性以密度为均匀分布在时间轴上,而指数分布就是随机变量从这一次空难开始,到下一次空难的时间间隔的分布。基于它的这个特性,它经常用来代表bug/故障发生的时间间隔等。指数分布的这个解释需要在弄清楚Poisson过程之后我们才能弄明白。
正态分布
关于均值,方差的正态分布是指由如下概率密度函数确定的分布 记为.这个分布十分重要,其原因需要留到后面我们讲中心极限定理时才能知道。可以说这是自然界中最广泛存在的一类连续型分布之一。
命题 2.5. 设,那么 同时,随机变量满足的分布叫做标准正态分布,其分布函数记为.那么我们有
Proof. 利用微积分中的结果 以及(这可由第一式将换成并对求导得出) 并适当换元可得所需结论 对于后面的命题, ◻
Gamma分布
Gamma分布可以视为指数分布的一种形式上的推广,它通常用来作为一种单峰的非负随机变量的经验分布。其概率密度函数为 这里 是Gamma函数。对应的分布记为. 特别的,当时,.
Beta分布
Beta分布则通常用来作为限制在有界区间上的单峰的经验分布。其概率密度函数为 这里 是Beta函数。对应的分布记为.
离散型分布
离散型分布是指这样一种上的概率测度,它在且只在一些孤立点上取正的测度。这些点只能是至多可数个,因为不可数个正数加起来只能是正无穷而不可能是.事实上,设是一族由集合编号的正数,满足 那么设我们有并且,从而是可数的。于是我们可以说离散型分布是一个只集中在一个至多可数的点集 上的概率测度,即满足 如果一个随机变量的分布是一个上的离散概率测度,我们就称是一个离散型随机变量。值得注意的是这个测度是关于互相奇异的。容易看出其分布函数为
接下来我们举一些常见的离散型分布的例子。
Bernoulli二项分布
假设你在投一枚不均匀硬币,每次投出正面的概率是,那么次独立的投掷产生的正面数量的分布就是Bernoulli二项分布,其分布密度为 这个分布记作或者. 具体的来说,如果令表示每次投掷构成的结果的状态空间,令表示每次投掷的结果,那么利用之间的独立性,我们有
几何分布
几何分布可以理解为一种离散版本的指数分布,即相同概率的独立发生的离散事件之间的等待时间。举例来说明,在独立的投掷正面概率为的硬币的时候,令随机变量表示投到正面所需花的次数,那么具有分布 精确的来说,考虑 为投硬币正面与否的无穷序列构成的状态空间,那么 并设 为独立的表示每次硬币的结果的随机变量。 注意可以取值,但对任意成立,于是由独立性, 故.而
Poisson分布
Poisson分布代表的是以一定频率发生的’稀有事件’的次数的分布,由于Poisson极限定律,这也是一个广泛存在的分布,具有很高的实用性。我们说参数为的Poisson分布的分布式为 记为或.其精确解释我们在后面讲到Poisson小数定律时才能解释清楚。举例来说明,假定一个地区平均每年发生一起罕见灾难,那么灾难的发生频率为,时间内平均发生次灾难,时间内灾难发生的次数就服从参数为的Poisson分布。
常见分布总结
名称 |
记号 |
密度函数 |
|
|
均匀分布 |
|
|
|
|
指数分布 |
|
|
|
|
正态分布 |
|
|
|
|
Gamma分布 |
|
|
|
|
Beta分布 |
|
|
|
|
二项分布 |
|
|
|
|
几何分布 |
|
|
|
|
Poisson分布 |
|
|
|
|
由于上述表格中关于期望和方差的简单的计算居多,我们不打算将所有计算过程写下来,感兴趣的读者可以自行去做。
收敛概念
测度的收敛
给定上一族测度,我们称它们弱收敛到,如果对任意有界连续函数都有 记作.
随机变量的收敛
几乎处处收敛
假定我们给了一列随机变量,有很多种不同的概念来描述如何收敛到某一个极限随机变量. 首先想到的是可测函数的逐点收敛,即对几乎每一点,都有,或者说 这时我们就说几乎处处收敛到,记为或者 不收敛的点至多构成一个零测集。我们容易推出以下关于几乎处处收敛的引理
Proof. 如果, 那么级数 几乎处处收敛(有限).于是几乎处处有. ◻
依概率(测度)收敛
如果对任意都有,我们就说依概率收敛到,也叫依测度收敛,记为.
命题 2.7 (依概率收敛). 关于随机变量序列是否依概率收敛,以下说法等价
.
.
对于任意子列, 总存在一个的子列使得
Proof.
如果依概率收敛,那么对任意, 记,有.于是 可得 由的任意性得.
对任意子列,可选取进一步的子列使得和收敛。那么根据之前的命题,该子列几乎处处收敛。
否则,设存在子列使得,那么根据假设,可以取一个进一步的子列使得 a.s.根据控制收敛定理, 这不可能。
◻
推论 2.1. 取为常值随机变量的特殊情形,我们可以得到一个特殊的极限判别法,即等价于对任意子列都有进一步的子列使得.
练习 2.16. 找出一个依概率收敛但不是几乎处处收敛的例子。
依分布收敛(弱收敛)
如果的分布弱收敛到的分布,即,我们就说弱收敛到或者依分布收敛到,记作.
命题 2.8. 关于依分布收敛,以下说法等价
.
对每一个的连续点,即满足的点,有
对每一个端点在的连续点上的区间,有
Proof.
取连续函数满足, . 那么由依分布收敛的定义有 令有 反过来,再考虑连续函数满足, ,有 利用在点处的连续性可得.
由立得。
设,则由前面关于离散分布的论证知是至多可数的。那么由于也是至多可数的,存在一个实数使得,即. 取整数的任一个枚举(比如可取),对任意正整数定义区间 由于任意有界连续函数,可以表示成两个有界非负连续函数的差,故只需对有界非负连续函数证明即可。定义 那么显然有 并且由于连续性,这两列函数以单调的方式逐点收敛到.由函数满足 以及非负我们知道 这表明 取并利用单调收敛定理(或控制收敛定理)可得
◻
命题 2.9.
a.s.收敛依概率收敛依分布收敛。
如果依分布收敛到一个常数,那么.
如果并且,那么.
如果并且,那么.
Proof.
a.s.收敛推出依概率收敛已经证明过了。现假定, 对任意有界连续函数考虑和.由于对任意的子列我们可以取子列使,此时由控制收敛给出.这就证明了的极限是.
显然可以推出对任意,当时,因为常值随机变量只有一个不连续点,故有依概率收敛。反过来,我们在上一条已经证明了依概率收敛可以推出依分布收敛。
我们先对仅在有界区间上非零的所有连续函数(即紧致支集连续函数)证明.这是一个数列的极限,于是可以通过证过证明它的任意子列都有子列收敛到来证明该数列收敛到.由依概率收敛,取任意子列,存在进一步的子列
由于仅在有界区间上非零,是一致连续的。即 故由有界以及控制收敛定理可得 而由定义,显然有.
对于任意有界非负的连续函数,考虑连续函数,利用显然的等式 我们可以将写为至多可数个仅在有界区间上非零的连续函数的和.由于该和是非负的,利用非负函数的积分可加性,的有界性和控制收敛定理给出
最后,对于任意有界连续函数,将它写为正部和负部的差,利用有界性可得所需结论。
与上一个证明类似,我们留作作业。
◻
Poisson小数定律
该定律一般是由特征函数(Fourier变换)得出的,但我们这里给出一个直接证明,一方面是因为可以作为我们刚刚学习的收敛概念的应用,另一方面弄清楚这个详细的过程会提升大家对这个现象的理解。
定理 2.6 (Poisson小数定律(简单版本)). 设是一列非负整数值随机变量,满足固定时,独立,并且存在非负实数使得时满足以下两个条件
记, 有.这里余项需要在时对一致,即要求存在一个非负函数使 其中.
那么,随机变量依分布收敛于.
Proof. 这里, , . 由独立性我们计算对于 类似的,也有另一边的不等式 这表明,即.
对于,由于 我们知道. 于是我们得到. ◻
大数定律
弱大数定律
测度的变换
内容概要:Fourier变换,Laplace变换,中心极限定理,Poisson极限定理(小数定律)。
条件期望
定义
我们已经定义了初等条件概率,这使得我们能谈论诸如, , 等条件概率和条件期望,并且条件概率可以看成是条件期望的一种特殊情形.但是这个式子需要时才有意义,否则完全就是意义不明的’非法操作’。那么如果我们面对的是连续型随机变量,每一点的取值上都等于零怎么办呢?现代概率论的一大重要突破就是将看成一个’信息弱化版’的.其意义为从能获得的信息里面你能获得的关于的全部信息,即将它看成一个可测的随机变量而不是一个数,并在一般的-代数可测的意义下引入了条件期望.
在这个意义下,是’信息最弱’版的,被弱化成了一个常数。而是’未经弱化’的完全体,因为是可测的,所有信息都得到了保留,其条件期望还是它自己。
定义 4.1. 设是一个随机变量,是一个-代数,我们定义的条件期望是指一个可测的随机变量,满足对任意有 对于条件期望我们经常直接记为.
不妨先设是非负的,如果记是限制在上得到的测度,那么上式按积分的意义理解,就是说 换句话说,条件期望就是测度限制在上之后,在下的Radon-Nikodym导数。由于左边的测度显然关于绝对连续,由Radon-Nikodym定理我们知道这个函数是存在的,并且在至多相差一个零测集的意义下唯一。对于一般可积的,我们可以通过作差得到条件期望的存在性。 为了看出的含义,我们先来看一个引理。
引理 4.1. 设是可测空间上的两个可测函数,满足是上可测的,那么 这里是Borel可测函数。
Proof. 首先我们注意到,如果是示性函数即,那么是可测的等价于,这里 那么, 故可取.
于是我们知道,命题对简单函数也成立。如果是非负的,利用简单函数逼近,和单调收敛定理我们知道存在Borel可测函数使得.对于一般的,通过对取正负部并分别利用命题我们得到,即有满足条件。 ◻
推论 4.1. 存在Borel可测函数使得 即需要是一个的函数。我们可以将该函数记为或者.值得注意的是,由于在相差一个零测集的意义下唯一,该函数也是在至多相差一个上的零测集的意义下唯一。(注意该’零测集’可能很’大’,比如的取值如果在之间,那么整个都是-零测集。)
条件分布
接下来的章节计划(考虑,顺序还没确定)
随机过程
鞅,选择停止定理
Markov模型
统计推断
高维Gauss分布
Brown运动与Ito微积分