戴尔指数
戴尔指数(英語:)又稱為泰爾指數[1],是一个衡量经济不平等[2]的统计量。它也曾經用來衡量其他社會不平等現象,如種族隔離[3][4][5]。
戴尔指数主要是利用資訊理論中的資訊熵的概念導出的。戴尔指数等於資訊冗餘,也就是資料最大可能資訊熵減去觀測到的資訊熵,它是广义熵指数的特例,可以被視為冗餘度、單樣性、不平等、非隨機性和可壓縮性的度量。[5]
数学公式
假設一個人口為N的群體,其收入分別為xi (i = 1,...,N),則它的戴爾指數T定義為[6]:
而戴爾指數L則定義為
其中为第个人的收入,为平均收入,为人口数量。加总符号中的第一项可以理解为个人在总收入中所占的比例,第二项为该个人相对于均值的收入。
如果收入分布是個離散分布函數 fk (k = 0,...,W),其中fk是收入為k的人口比例,而W = Nμ 代表總收入,可以得知 。 它的戴爾指數T定義為:
這裡的一樣是收入平均
其中應注意到收入k是一個整數,k=1代表最小收入增量(比如新台幣1元)。
如果收入分布是個連續分布函數f(k),k取值0到無窮,其中f(k) dk 是收入為k 到 k + dk的人口數量,那戴爾指數T定義為:
其中平均為:
一些常見連續概率分佈的戴尔指數如下表所示:
如果每一个人都有相同的收入,即等于均值,则指数为零。如果某个个人拥有所有的收入,则指数为。TT 除以 可以將方程歸一化到0到1的範圍,但這樣違反獨立公理: 並不符合衡量不平等的標準。
信息論推導
其中 是從人群裡找到的機率。是玻爾茲曼常數。在信息論中,當信息以二進制數字給出時,並且對數基底為2。在物理學和戴爾指數的計算中,選擇自然對數作為對數基底。當替換成人均收入時,需要除以總收入達到歸一化。那可以導出,觀察到的信息熵為:
设为戴尔指数,为夏農熵,则有
其中,ln(N)是理論最大熵。香濃根据事件发生概率导出的其熵测度。它可以用戴尔系数解释为自某个特定个人处随机取得一块钱的概率。并与其第一项,即总收入中个人所占份额相同。
符號 | 信息論 | 戴爾指數 TT |
---|---|---|
字符數 | 人口數 | |
某個特定字符 | 某個特定人 | |
第i個字符 character | 第i個人的收入 | |
總字符數 | 總收入 | |
未被使用的資訊空間 | 未使用潛在價格機制 |
可分解性
戴尔指数的一个优点是它是某个子群体中不平等的加权和[1]。例如,美国国内的不平等就是每个州的不平等的加权和,由该州收入相对于国家总收入的比值来加权。
如果人口被划分为个子群体, 为群体 的收入比例,为该子群体的戴尔指数,而 为子群体 的平均收入,则戴尔指数为
因此,我们可以说某个特定群体给总体“贡献了”一定数量的不平等。
另外一个被广泛使用的不平等度量为基尼系数,该系数对于很多人来说由于基于劳伦茨曲线而非常直观。但是它却没有戴尔指数容易分解。
參考文獻
- 徐淑娟. . 西南財經大學出版社. 2018-02-01: 33–34 [2019-01-14]. ISBN 7550428530. (原始内容存档于2019-06-05) (中文(中国大陆)).
- (PDF). [2006-01-15]. (原始内容存档 (PDF)于2005-11-18).
- . geodacenter.asu.edu. [2016-03-18]. (原始内容存档于2012-07-10).
- . www.urban.org. Urban Institute. [5 February 2018]. (原始内容存档于2021-01-19) (英语).
- Parker, Lauren. . PolicyMap. 20 July 2015 [5 February 2018]. (原始内容存档于2019-06-08).
- . [2019-01-11]. (原始内容存档于2020-10-23) (英语).
外部連結
- 德克萨斯大学戴尔指数简介 (页面存档备份,存于)(英文)
- 試算表: Income inequality metrics#Spreadsheet computations
- 免費在線計算器 計算基尼係數,繪製洛倫茲曲線,並為任何數據集計算許多其他濃度測量值
- Free Calculator: Online (页面存档备份,存于) and downloadable scripts (Python and Lua) for Atkinson, Gini, and Hoover inequalities
- Users of the R (页面存档备份,存于) data analysis software can install the "ineq" package which allows for computation of a variety of inequality indices including Gini, Atkinson, Theil.
- MATLAB 不平等包 (页面存档备份,存于)。MATLAB不平等包,其中包括用於計算基尼,阿特金森,泰爾指數和標繪洛倫茨曲線的代碼