单峰
单峰概率分布
统计学中,单峰概率分布或单峰分布是具有单一峰值的概率分布。“峰”指分布的任何峰值,不仅仅是统计学中通常的众数。
若只有一个峰,则分布函数就是“单峰”的。除此之外都叫做“多峰”(multimodal)。[2]图 1展示的正态分布、柯西分布、T分布、卡方分布、指数分布等都是单峰分布。离散型分布中,二项分布和泊松分布可视作单峰分布,但对于某些参数可以在两个相邻值上产生相同的概率。
图 2、图 3展示了双峰分布。
其他定义
分布函数的单峰性还有其他定义。
对于连续型分布,单峰性可通过累积分布函数(CDF)的行为定义。[3]若CDF在时是凸的、在时是凹的,则分布就是单峰分布,为众数。需要注意的是,根据这一定义,均匀分布也是单峰分布[4],任何在一定区间内可取到最大分布的也是单峰分布,如梯形分布。这一定义通常允许峰处不连续;在连续分布中,任意单一值的概率通常都是0,而这一定义则允许在峰中存在非零概率点。
单峰的标准也可用分布的特征函数[3]或拉普拉斯-斯蒂尔切斯变换来定义。[5]
定义单峰离散分布的另一种方法是通过概率差序列的变号。[6]离散分布的概率质量函数为,若序列只有一次变号(不计入零),则称为单峰分布。
使用与结果
分布的单峰性之所以重要,是因为它可以得到几个重要的结果。下面给出的几个不等式仅适用于单峰分布,因此评估给定数据集是否来自单峰分布非常重要。双峰分布条目中给出了几种单峰测试法。
不等式
高斯不等式
高斯不等式是第一个重要结果,[7]给出了值与峰的距离超过给定数的概率的上限,其只能用于单峰分布。
维索尚斯基–佩图宁不等式
第二个是维索尚斯基–佩图宁不等式,[8]其是切比雪夫不等式的细化。切比雪夫不等式保证在任何分布中,“几乎所有”值都“接近”均值。而维索尚斯基–佩图宁不等式则将其细化到更接近的值,前提是分布函数为连续单峰的。Sellke与Sellke得出了进一步的结果。[9]
众数、中位数与平均数
高斯在1823年也证明了单峰分布的情形[10]
及
对于单峰分布,可以证明中位数ν与平均值μ在(3/5)1/2 ≈ 0.7746个标准差的范围内。[11]用符号表示,
其中| . |是绝对值。
2020年,Bernard、Kazzi与Vanduffel通过推导对称分位数均值与均值[12]
之间的最大距离,推广了前面的不等式。值得注意的是,时最大距离取得最小(即当对称分位均值),这也是选择中位数为均值的稳健估计值的原因之一。此外,当,边界等于,这时单峰分布中位数和均值距离的最大值。
中位数和众数θ也有类似关系:它们位于31/2 ≈ 1.732个标准差之内:
也可以证明均值和众数相差在31/2之内:
单峰函数
“峰”适用于数据集合概率分布,而非一般函数,所以上述定义并不适用。“单峰”的定义可扩展到实数函数。
通常定义如下:若对某值m,函数f(x)在时单调递增、在时单调递减,则为单峰函数。也就是说,f(x)的最大值为f(m),且没有其他极大值。
证明单峰性通常很难。一种方法是利用定义,但这只适用于简单函数。还有基于导数的通用方法[15],但并不适用于每个函数。
上述情形有时被称为强单调性。如有值m使时,函数f(x)弱单调递增;时,函数f(x)弱单调递减,则称函数为弱单峰函数。这时,x存在可取到最大值f(m)的区间。杨辉三角的每一行都是弱单峰函数。
单峰函数也可以指只有一个极小值的函数。[16]例如,数值优化中的局部单峰抽样经常用这样的函数演示。可以说,这种推广下的单峰函数具有单一局部极值。
其他推广
若施瓦兹导数均为负,则函数f(x)是“S-单峰”(常称为“S-单峰映射”)函数,其中是临界点。[18] 计算几何中,单峰函数可以设计出高效的找到极值的算法。[19]
适用于向量自变量X的函数f(X)的更一般定义是,若存在可微单射X = G(Z)使f(G(Z))为凸函数,则f是单峰函数。通常,我们希望G(Z)连续可微,且有可逆雅各布矩阵。
另见
- 双峰分布
参考文献
- 埃里克·韦斯坦因. . MathWorld.
- 埃里克·韦斯坦因. . MathWorld.
- A.Ya. Khinchin. . Trams. Res. Inst. Math. Mech. (University of Tomsk). 1938, 2 (2): 1–7 (俄语).
- Ushakov, N.G., , Hazewinkel, Michiel (编), , Springer, 2001, ISBN 978-1-55608-010-4
- Vladimirovich Gnedenko and Victor Yu Korolev. . CRC-Press. 1996. ISBN 0-8493-2875-6. p. 31
- Medgyessy, P. . Periodica Mathematica Hungarica. 1972-03, 2 (1–4): 245–257. S2CID 119817256. doi:10.1007/bf02018665.
- Gauss, C. F. . Commentationes Societatis Regiae Scientiarum Gottingensis Recentiores. 1823, 5.
- D. F. Vysochanskij, Y. I. Petunin. . Theory of Probability and Mathematical Statistics. 1980, 21: 25–36.
- Sellke, T.M.; Sellke, S.H. . American Statistician (American Statistical Association). 1997, 51 (1): 34–40. JSTOR 2684690. doi:10.2307/2684690.
- Gauss C.F. Theoria Combinationis Observationum Erroribus Minimis Obnoxiae. Pars Prior. Pars Posterior. Supplementum. Theory of the Combination of Observations Least Subject to Errors. Part One. Part Two. Supplement. 1995. Translated by G.W. Stewart. Classics in Applied Mathematics Series, Society for Industrial and Applied Mathematics, Philadelphia
- Basu, S.; Dasgupta, A. . Theory of Probability & Its Applications. 1997, 41 (2): 210–223 [2023-09-24]. doi:10.1137/S0040585X97975447. (原始内容存档于2019-04-29).
- Bernard, Carole; Kazzi, Rodrigue; Vanduffel, Steven. . Insurance: Mathematics and Economics. 2020, 94: 9–24. doi:10.1016/j.insmatheco.2020.05.013 .
- Rohatgi, Vijay K.; Székely, Gábor J. . Statistics & Probability Letters. 1989, 8 (4): 297–299. doi:10.1016/0167-7152(89)90035-7.
- Klaassen, Chris A.J.; Mokveld, Philip J.; Van Es, Bert. . Statistics & Probability Letters. 2000, 50 (2): 131–135. doi:10.1016/S0167-7152(00)00090-0.
- (PDF). Method in appendix D, Example in theorem 2 page 5. [2013-08-28]. (原始内容存档 (PDF)于2017-08-09).
- . [2020-03-29]. (原始内容存档于2022-03-28).
- Demaine, Erik D.; Langerman, Stefan. . Brodal, Gerth Stølting; Leonardi, Stefano (编). . Lecture Notes in Computer Science 3669. Berlin, Heidelberg: Springer. 2005: 887–898 [2023-09-24]. ISBN 978-3-540-31951-1. doi:10.1007/11561071_78. (原始内容存档于2023-07-09) (英语).
- See e.g. John Guckenheimer; Stewart Johnson. . Annals of Mathematics. Second Series. July 1990, 132 (1): 71–130. JSTOR 1971501. doi:10.2307/1971501.
- Godfried T. Toussaint. . International Journal of Computer and Information Sciences. June 1984, 13 (3): 197–217. S2CID 11577312. doi:10.1007/bf00979872.