知识:
字符串相似的几个算法:
http://blog.csdn.net/dongle2001/archive/2007/01/02/1472235.aspx
1 编辑距离(Levenshtein Distance)
2 最长公共子串 (LCS)
3 余弦定理 (向量空间算法)
对中文来说是否需要首先切词呢?
知识:
字符串相似的几个算法:
http://blog.csdn.net/dongle2001/archive/2007/01/02/1472235.aspx
1 编辑距离(Levenshtein Distance)
2 最长公共子串 (LCS)
3 余弦定理 (向量空间算法)
对中文来说是否需要首先切词呢?