简介
蒙特卡罗方法也称统计模拟方法,是指使用随机数(或者更常见的伪随机数)来解决很多计算问题的方法。它的工作原理就是两件事:不断抽样、逐渐逼近。
相关数学基础
条件概率
P(A∣B):在随机事件B发生的条件下,随机事件A发生的概率。
全概率公式:P(B)=∑i=1nP(B∣Ai)⋅P(Ai)
- 证明思路:P(B∣Ai)⋅P(Ai)等于P(BAi),再利用概率的可加性进行加和。
贝叶斯(Bayes)公式:P(Ai∣B)=P(B)P(AiB)=∑j=1nP(B∣Aj)⋅P(Aj)P(Bi∣A)P(A)
随机变量的特征值
期望
-
离散分布:E(Y(X))=Y(X)⋅p(Y(X))
-
连续分布:E(Y(X))=∫−∞∞y(x)⋅f(x)dx
方差
D(X)=E[(X−E(X))2]=E(X2)−E2(X)
- 连续分布:D(Y(X))=∫−∞∞(y(x)−E(Y))2⋅f(x)dx=E(Y2)−(E(Y))2
常见分布
二项分布 (Binomial Distribution)
单次实验有两种结果,发生目标事件(概率为p)或者不发生(概率为1−p)。那么N次实验发生k次目标事件的概率、期望、方差为:
P(N,k)=k!(N−k)!N!pk(1−p)N−kE(k)=Np,D(k)=Np(1−p)
泊松分布 (Poisson Distribution)
泊松分布是二项分布的一种特殊极限,当单次实验p→ 0 、n→∞,且Np适中(有限)时,在相同时间内,随机过程发生k次的概率为:
P(X=k)=k!λke−λ,k=0,1,2,…
其中λ>0 为平均发生次数(速率参数)。
泊松分布的方差和期望均是λ。
正态分布 (Normal Distribution)
自然科学中(同时也是生活中)最常见的分布形式?
高斯分布的概率密度函数(PDF):
f(x)=2πσ1e−2σ2(x−μ)2,x∈R
正态分布的期望和方差分别为:
E(X)=μ,D(X)=σ2
中心极限定理
中心极限定理指出,无论原始随机变量的分布如何,其样本均值的标准化形式在样本量 n 足够大时,将近似服从标准正态分布。这是统计学中连接概率分布与正态分布的桥梁。
设 X1,X2,…,Xn 是独立同分布(i.i.d.)的随机变量,且E(Xi)=μ,D(Xi)=σ2<∞。定义样本均值为:Xn=n1∑i=1nXi,则当 n→∞ 时,标准化随机变量:Zn=σ/nXn−μ的分布收敛于标准正态分布 N(0,1),即:
ZndN(0,1)
随机抽样
离散随机变量
离散随机变量的抽样相对简单,我们可以根据各变量的频率及其概率,从 [0,1) 均匀分布中分区间直接抽样。
具体方法:设随机变量为X1,X2,...,Xn,相应概率为P1,P2,...,Pn。
定义累积概率 ξ:ξ0=0,ξi=∑j=1ipj,i=1,2,...,n。接着我们从[0,1)中均匀分布抽样得到x∗,如果满足:
ξk−1<=x∗<=ξk
那么此时抽样的随机变量为Xk。
辅助理解的图例(谢谢伟大的陈海老师的ppt!):
连续随机变量
直接抽样法
变换抽样法
舍选抽样法
蒙特卡洛方法的具体应用
积分运算
一维积分运算
投点法
平均值法
重要抽样法
多维积分运算
统计力学中的运用
Metropolis-Hastings算法
量子力学中的运用
路径积分
模拟退火算法
随机行走的生长模拟