統計學的假說檢定中[1][2],顯著性差異(或统计学意义,英語:)是對數據差異性的評價,當某次實驗的结果在虛無假說下不大可能发生时,就認為該結果具有顯著性差異。更準確而言,譬如某項研究設定了一個數值α(顯著水準),表示虛無假說本來正確但卻被拒絕的出錯概率[3](並非虛無假設為真的機率、對立假設為假的機率、實驗再現失敗率[4]),然後用p值表示虛無假說条件为真時得到某結果或更極端结果的概率[5]。當p ⩽ α時,就可以認為結果具有統計學意義,或數據之間具有了顯著性差異。[6][7][8][9][10][11][12]顯著水準應當在開始數據收集前就設定,通常習慣設定為5%[13]或更低,因研究的具體學科領域而異。[14]

- 參與比對的數據是來自不同實驗對象,如比-西一般能力測驗中,大學學歷被試組的成績與小學學歷被試組之間,會存在顯著性差異;
- 也可能是因為實驗處理對實驗對象造成了改變,因而前測、後測的數據會有顯著性差異。例如,記憶術研究發現,被試者學習某記憶法前的成績,和學習記憶法後的記憶成績會有顯著性差異,則這一差異很可能來自於這種記憶法對被試記憶能力的改變。
比如,我們從兩個母體中分別抽取了兩組樣本數據A和B,這兩組數據在顯著水準α = 0.05下具備顯著性差異。這是說,兩組數據所代表的母體具備顯著性差異的可能性為95%;但它們代表的母體仍有5%的可能性是沒有顯著性差異的,這5%是由於抽样误差造成的。也可表述为:
- 如果拒绝“两组数据一致(二者不具备显著性差异)”的零假设(接受“两组数据不一致”的备择假设),此时有5%的可能性犯第一类错误;
- 如果A=两组数据不具备显著差异;B=实际数据具有显著差异,則P(A|B) = 0.05,即統計100次,預期是B情況,但可能出現5次的A情況。
當假說檢定所測得之數據之間具有顯著性差異,實驗的虛無假說就可被推翻,也就是拒絕,接受對立假說(alternative hypothesis,記作或);反之,若數據之間不具備顯著性差異,則拒絕對立假說,不拒絕虛無假說。通常情況下,實驗結果需要證明達到顯著水準α = 0.05或0.01,才可以說數據之間具備了顯著性差異,否則就如上所述,容易作出錯誤的推論。在作結論時,應確實描述方向性(例如顯著大於或顯著小於)。
数学表述为:引入p值作为检验样本(test statistic)观察值的最低顯著水準。在α = 0.01或α = 0.05的条件下,若零假设成立的概率(p)小于α,则表示零假设成立的情况下得到这种观测结果的概率,比1%或5%還低,在该显著性水平下,我们可拒绝该零假设。
为“极显著(extremely significant)”,通常以**
