雅卡尔指数
雅卡尔指数(英語:),又称为交并比()、雅卡尔相似系数(),是用于比较样本集的相似性与多样性的统计量。雅卡尔系数能够量度有限样本集合的相似度,其定义为两个集合交集大小与并集大小之间的比例:
如果A与B完全重合,则定义J(A,B) = 1。于是有
雅卡尔距离()则用于量度样本集之间的不相似度,其定义为1减去雅卡尔系数,即
此外,亦有人将雅卡尔距离定义两集合对称差的大小与并集大小之间的比例。
参考文献
- Sven Kosub, "A note on the triangle inequality for the Jaccard distance" arXiv:1612.02696 (页面存档备份,存于)
- Lipkus, Alan H, , J Math Chem, 1999, 26 (1-3): 263–265
- Levandowsky, Michael; Winter, David, , Nature, 1971, 234 (5): 34–35, doi:10.1038/234034a0
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.