作者 | Long Luo
来源 | 好奇的程序员
相信大家或多或少都听过六西格玛( ) [^1] 这个词,六西格玛是指生产的产品中, 的产品是没有质量问题的,即只有 的不良率。假如一家工厂生产某型号零件,零件的长度要求是 ,允许的标准差是 。根据 原则,零件规格允许的偏差范围是: 。这意味着,零件长度超过 或低于 的概率是非常低的,约为 。如果工厂每天生产 100 万个零件,只允许有 个零件会超出 的范围,几乎可以忽略不计。因此,生产过程是极其稳定和可靠的,达到了六西格玛水平。那么 中 的不良率来自哪里呢?学过中学数学都知道,在正态分布( ) [^2] 中, 的数据位于平均值的一个标准差内, 位于两个标准差内, 位于三个标准差内,这也是著名的 68-95-99.7 Rule [^3] ,如下图 1 所示:如下图 9 所示,设箭头所示落点区域 的概率密度函数为 , 表示有 个输入参数,落点的坐标 和 。
综合上述 2 个公式可得:
假设 轴上距离原点距离为 的点 ,坐标为 ,如下图 11 所示:不妨代入 ,则有:
这里 可以为任意整数 ,则有:
不妨令 ,同时上述公式可以推广至实数域 ,则有:
为了方便和统一,任意指数函数都可以写成以 为底的指数函数:
至此我们就求出了满足函数方程 6 函数 为:
那么常数 是多少呢?根据概率论我们知道:
上式就是大名鼎鼎的高斯积分( ) [^8] ,如何求解高斯积分网上有很多教程,这里不再赘述。
最终我们得出了 维情况下的未归一化的概率密度函数:
更严谨的数学分析法上一节我们使用了不那么严谨的方法得到了正态分布的概率密度函数,下面我们使用另外一种方法求出正态分布的概率密度函数。由落点分布分布在空间上具有旋转对称性,我们可知 轴和 轴具有相同且连续的概率密度函数。设落点 的概率密度函数为 , 轴方向上概率密度函数为 ,则 轴方向上的概率密度函数为 ,那么考虑如下图 12 所示的一个充分小的黄色区域 :飞镖落在黄色区域 的概率为:
将等式左边转换为极坐标形式,
在极坐标下的概率密度函数设为 , 则有:
由条件 , 具有旋转对称性,也就是和 无关,所以
对上述公式两边对 求导,可得:
利用链式法则,有:
上式移项可得:
我们则有:
对上式进行积分,可得:
求解上式可得:
则求得函数 为:
同理 为:
由概率论我们知道 ,同时 ,则:
考虑 维正态分布,并使用极坐标,则有:
令 ,则有:
可得:
所以可求得:
至此,我们只剩下一个未知参数 就得到所求公式。
考虑方差 定义,对于期望 ,则有:
令 , ,则有:
根据分部积分公式:
则对上述公式进行分部积分求解可得:
所以我们求得 为:
即:
将求得 和 代入公式 ,最终我们求得概率密度函数为:
上述公式是期望 的特殊情况,当期望 时,更一般的公式为:
特别地,当 且 ,这个分布被称为标准正态分布:
正态分布公式的几何意义通过 给出的优雅直观方法,仅仅依靠那 个假设条件,我们居然最终求出了正态分布的公式。有没有感觉到数学的美感?最初看到 3Blue1Brown 的这个视频,感觉非常美,正态分布那么复杂的公式居然有这么优雅直观的方式自然而然的出来了!分析正态分布公式,公式中的 意味着空间上的对称性,即点分布距离中心是对称的。而 的出现意味着取了时间上的极限,而这和中心极限定理( ) [^9] 有关,我会在下一篇文章详细解释,敬请期待!参考文献[^1]: 六西格玛 https://en.wikipedia.org/wiki/Six_Sigma
[^2]: 正态分布 Normal distribution https://en.wikipedia.org/wiki/Normal_distribution
[^3]: 68-95-99.7 法则 https://en.wikipedia.org/wiki/68%E2%80%9395%E2%80%9399.7_rule
[^4]: 高斯 Gauss https://en.wikipedia.org/wiki/Carl_Friedrich_Gauss
[^5]: 天文学家赫歇尔 John Herschel https://en.wikipedia.org/wiki/John_Herschel
[^6]: 函数方程 https://en.wikipedia.org/wiki/Functional_equation
[^7]: 指数函数 Exponential function https://en.wikipedia.org/wiki/Exponential_function
[^8]: 高斯积分 Gaussian integral https://en.wikipedia.org/wiki/Gaussian_integral
[^9]: 中心极限定理 Central limit theorem https://en.wikipedia.org/wiki/Central_limit_theorem
转载请注明来自德立,本文标题:《高中正态分布公式(正态分布Normal Distribution公式为什么长这样)》
京公网安备11000000000001号
京ICP备11000001号
还没有评论,来说两句吧...