对于m个样本(x1,y1),(x2,y2)....(xm,ym)
1.TSS (Total Sum of Square) 计算样本的总平方和
TSS/m-1 -> 方差
2.RSS Residual Sum of Square 残差平方和
RSS=SSE (Sum of Square Errors)误差平方和
3.R2=1-RSS/TSS
R2越大,拟合效果越好
4.levenshtein distance 编辑距离
编辑距离(Edit Distance),又称Levenshtein距离,是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。一般来说,编辑距离越小,两个串的相似度越大。