包:Fuzzywuzzy-Levenshtenin distance:
模糊查询和替换,比如用户输入ABCDEF,但是本来的关键词是ABCDEGF,在包中有一个词典,会进行匹配,找到最相似的词。如果距离足够的小,就认为是错误的所有,自动替换。任意添加,替换和删除一个字符,距离就是1,比如真实值是ABCD,用户输入ABD,ABED,ABECD,距离都是1
鸢尾花数据集
鸢尾花有4个特征,不容易画图,我们可以使用PCA降维
因为有 150个数据,每个数据有4个特征,所以是一个(150,4)的矩阵,使用PCA降维,XTX可以得到一个4行4列的矩阵,然后可以得到它的特征值和特征向量,得到特征值λ1,λ2,λ3,λ4和特征向量μ1,μ2,μ3,μ4.将λ从大到小排列,可以找到哪个特征向量μ的方向对结果影响最大,选择前两个μ建立坐标系。将