import pandas as pd
from sklearn.feature_selection import SelectKBest
from sklearn.feature_selection import chi2
data = pd.read_csv('./2013年八城市融合数据.csv',encoding='gbk')
x= data[['归属感有无(0:有 1:无)','户口性质(0:农业 1:非农业)','体制内人员(0:非体制内 1:体制内)','大学以上学历(0:大学以下 1:大学以上)','本地人愿意接受我(0:同意 1:不同意)']]
y = data['本地养老(0:非本地 1:本地)']
selectKBest = SelectKBest(chi2, k=5)
X_new = selectKBest.fit_transform(x, y)
p_values = zip(select_k_best.scores_,select_k_best.pvalues_)
dict_p_values = dict(zip(['归属感有无(0:有 1:无)','户口性质(0:农业 1:非农业)','体制内人员(0:非体制内 1:体制内)','大学以上学历(0:大学以下 1:大学以上)','本地人愿意接受我(0:同意 1:不同意)'],p_values))
sorted(dict_p_scores.items(),key=lambda x:x[1],reverse=False)
for i in list(select_k_best.pvalues_):
if i<0.05:
print('True')