学习笔记

#-- coding:utf-8 --
import pandas as pd
from sklearn import decompositon

#file=‘C:\Users\Administrator\Desktop\shiyan.xlsx’
#df=pd.read_excel(file,index_col=u’nkill’)
df=pd.read_excel(‘C:\Users\Administrator\Desktop\111.xlsx’)
#print(df)

#a=(df-df.min())/(df.max()-df.min()) #最小-最大规范化
#b=(df-df.mean())/df.std() #零-均值规范化
from sklearn.decompositon import PCA
pca=PCA()
pca.fit(df)
c=pca.components_
d=pca.explained_variance_ratio_
print©
print(d)

######################
data=pd.read_excel(‘C:\Users\Administrator\Desktop\test.xlsx’)
data.info()
a=data.corr().head()
b=data.columns
print(a)
print(b)
data.isnull().sum()
c=data[‘nkill’].value_counts().head(11) #nkill中值的个数统计
print©
print(data.groupby(‘weapsubtype1’).size()) #数据分类分布统计

#########
a=data.dropna(subset=[‘nkill’]) #删除缺失值
print(a)
b=a.head()

###########
df=pd.read_excel(‘C:\Users\Administrator\Desktop\test.xlsx’)
le = preprocessing.LabelEncoder()
le.fit(df[“corp1”])
df[“corp1”]=le.transform(df[“corp1”]) #转换字符
print(df)
df.to_csv(‘a.csv’) #生成csv格式

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值