![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
2.4 信息论 Information Theory
CongyingWang
咸鱼太闲
展开
-
文本相似度——编辑距离
文章目录1 基本思路2 算法基本步骤3 算法实现3.1 递归3.2 动态规划3.3 Python 使用包 文本相似度计算方法汇总:文本相似度计算方法详解 1 基本思路 定义: 假设字符串SAS_ASA,共mmm 位,即 SA[1]S_A[1]SA[1] 至 SB[m]S_B[m]SB[m] 字符串 SBS_BSB,共nnn位,即SB[1]S_B[1]SB[1]至SB[n]S_B[...原创 2019-04-22 19:29:28 · 2026 阅读 · 0 评论 -
文本相似度——汉明距离
文章目录1 基本思路2 算法实现2.1 Python 实现2.2 Python 包 文本相似度计算方法汇总:文本相似度计算方法详解 1 基本思路 汉明距离定义:在信息论中,两个等长字符串之间的汉明距离(英语:Hamming distance)是两个字符串对应位置的不同字符的个数。换句话说,它就是将一个字符串变换成另外一个字符串所需要替换的字符个数。1 示例: 1011101与1001001之...原创 2019-04-25 17:41:27 · 2798 阅读 · 0 评论