汉明距离
范例
例如:
10 1 1 1 01 与 10 0 1 0 01 之间的汉明距离是2。
2 14 3 8 96 与 2 23 3 7 96 之间的汉明距离是3。
" t o n e d "与" r o s e s "之间的汉明距离是3。
特性
对于固定的长度 n ,汉明距离是该长度字符向量空间上的度量,很显然它满足非负、唯一及对称性,并且可以很容易地通过完全归纳法证明它满足三角不等式。
两个字 a 与 b 之间的汉明距离也可以看作是特定运算−的 a − b 的汉明重量。
对于二进制字符串 a 与 b 来说,它等于 a 异或 b 以后所得二进制字符串中“1”的个数。另外二进制字符串的汉明距离也等于 n 维超正方体两个顶点之间的曼哈顿距离,其中 n 是两个字串的长度。
历史及应用
汉明距离是以理查德·卫斯里·汉明的名字命名的,汉明在 误差检测与校正码 的基础性论文中首次引入这个概念。在通信中累计定长二进制字中发生翻转的错误数据位,所以它也被称为 信号距离 。汉明重量分析在包括信息论、编码理论、密码学等领域都有应用。但是,如果要比较两个不同长度的字符串,不仅要进行替换,而且要进行插入与删除的运算,在这种场合下,通常使用更加复杂的编辑距离等算法。
参考文献
部分摘自Federal Standard 1037C.
理查德·卫斯里·汉明,误差检测与纠错码(Error-detecting and error-correcting codes), Bell System Technical Journal 29 (2):147-160, 1950.
参见
汉明重量
杰卡德指数
编辑距离,一般化的汉明距离
相似
数值分类学中的相似空间
免责声明:以上内容版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。感谢每一位辛勤著写的作者,感谢每一位的分享。

- 有价值
- 一般般
- 没价值








24小时热门
推荐阅读


关于我们

APP下载


{{item.time}} {{item.replyListShow ? '收起' : '展开'}}评论 {{curReplyId == item.id ? '取消回复' : '回复'}}