data1[['品牌标签','仓库标签']].corr(method='pearson')
![](https://i-blog.csdnimg.cn/blog_migrate/76bbb05c9bcbaa0dc14be1e022d9e1c7.png)
data1['品牌标签'].corr(data1['仓库标签'])#对data1中的数值型数据计算相似度
![](https://i-blog.csdnimg.cn/blog_migrate/c03f0990bf39820bd08ceb913f736414.png)
data1['品牌标签'].equals(data1['仓库标签'])#对于类别型的数据计算
![](https://i-blog.csdnimg.cn/blog_migrate/8dbfabe77ddd9379c9a9af424318d292.png)
![](https://i-blog.csdnimg.cn/blog_migrate/7652074cd43cd676f5696c7eaa713809.png)
import pandas as pd
data=pd.read_excel(r'文件路径')
data
![](https://i-blog.csdnimg.cn/blog_migrate/ba6008fe7386f74b379aa477726db156.png)
k = 5
for i in data.colums:
for i in range(len(data)):
if (data[i].isnull())[j]:
print('缺失值所在列:',i)
print('缺失值所在行索引所在位置:',j)
print(data[i].reindex(llist(range(j-k,j))+list(range(j+1,j+1+k))))#获取前后k个值
![](https://i-blog.csdnimg.cn/blog_migrate/75863fd1b9fff498c793d63642c06c5b.png)
k = 5
for i in data.colums:
for i in range(len(data)):
if (data[i].isnull())[j]:
y = data[i].reindex(llist(range(j-k,j))+list(range(j+1,j+1+k)))
y = y[y.notnull()]#删除控制
print(y)
![](https://i-blog.csdnimg.cn/blog_migrate/1ddaf8345eeefec457f5f082c66dcdbe.png)
from scipy.interpolate import lagrange #使用拉格朗日函数
k = 5
for i in data.colums:
for j in range(len(data)):
if (data[i].isnull())[j]:
y = data[i].reindex(llist(range(j-k,j))+list(range(j+1,j+1+k)))
y = y[y.notnull()]#删除控制
print(lagrange(y.index,list(y))) #打印出插值函数
![](https://i-blog.csdnimg.cn/blog_migrate/e6348f1849903e046e15fec2f6230f9a.png)
print(lagrange(y.index,list(y))(j)) #打印出缺失值的销售额
![](https://i-blog.csdnimg.cn/blog_migrate/f732a1f5014484f42f07ba2c1442f9cd.png)
#封装后
from scipy.interpolate import lagrange #使用拉格朗日函数
def inter(da,n,k=5):
y = data[i].reindex(llist(range(j-k,j))+list(range(j+1,j+1+k)))
y = y[y.notnull()]#删除控制
return lagrange(y.index,list(y))(n)
for i in data.columns:
for j in range(len(data)):
if (data[i].isnull())[j]:
sales = inter(data[i],j)
print(sales) #效果同上
![](https://i-blog.csdnimg.cn/blog_migrate/3ccfd569f205c405c316944308daa5be.png)