学习笔记

最新推荐文章于 2022-08-07 10:39:12 发布

qq_41235445

最新推荐文章于 2022-08-07 10:39:12 发布

阅读量82

点赞数

本文链接：https://blog.csdn.net/qq_41235445/article/details/87896353

版权

#-- coding:utf-8 --
import pandas as pd
from sklearn import decompositon

#file=‘C:\Users\Administrator\Desktop\shiyan.xlsx’
#df=pd.read_excel(file,index_col=u’nkill’)
df=pd.read_excel(‘C:\Users\Administrator\Desktop\111.xlsx’)
#print(df)

#a=(df-df.min())/(df.max()-df.min()) #最小-最大规范化
#b=(df-df.mean())/df.std() #零-均值规范化
from sklearn.decompositon import PCA
pca=PCA()
pca.fit(df)
c=pca.components_
d=pca.explained_variance_ratio_
print©
print(d)

######################
data=pd.read_excel(‘C:\Users\Administrator\Desktop\test.xlsx’)
data.info()
a=data.corr().head()
b=data.columns
print(a)
print(b)
data.isnull().sum()
c=data[‘nkill’].value_counts().head(11) #nkill中值的个数统计
print©
print(data.groupby(‘weapsubtype1’).size()) #数据分类分布统计

#########
a=data.dropna(subset=[‘nkill’]) #删除缺失值
print(a)
b=a.head()

###########
df=pd.read_excel(‘C:\Users\Administrator\Desktop\test.xlsx’)
le = preprocessing.LabelEncoder()
le.fit(df[“corp1”])
df[“corp1”]=le.transform(df[“corp1”]) #转换字符
print(df)
df.to_csv(‘a.csv’) #生成csv格式

qq_41235445

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
学习笔记

#-- coding:utf-8 --import pandas as pdfrom sklearn import decompositon#file=‘C:\Users\Administrator\Desktop\shiyan.xlsx’#df=pd.read_excel(file,index_col=u’nkill’)df=pd.read_excel(‘C:\Users\Admini...
复制链接

扫一扫