Python 实战总结1

使用pandas读入csv文件

import pandas as pd

读取csv文件数据

读取train.csv数据:

train_df = pd.read_csv(r'C:\Users\86177\Desktop\大二资料\大数据导\experiment\train.csv')

查看数据信息

 print(train_df)

查看前五个数据

print(train_df.head())

数据描述信息

train_df.describe( )

查看是否有空值

train_df.isnull( ).any( )

统计空值数目 重置索引

将空值的数目进行统计,并且重置索引,使得missing_value数据有两列:column_name和null_count:

missing_values = train_df.isnull( ).sum( )

missing_values = missing_values.reset_index( )

missing_values.columns = ['column_name','missing_count']

missing_value

挑选属性

第一种:

挑选这些属性Survived,Pclass,Sex,SibSp,Parch,Embarked,Age,Fare,组成datalist:

datalist = train_df.names = ["Survived“,”Pclass“,”Sex“,”SibSp“,“Parch”,”Embarked“,”Age“,"Fare"]

train_df2 = train_df[datalist]

train_df2.head( )

将数据年收入(Annual Income (k$))和消费习惯(Spending Score (1-100))字段提出,赋给X(dataset为接收数据的)

b=dataset.names = ['Annual Income (k$)‘,'Annual Income (k$)']

X=dataset[b]

print(X.head())

第二种:

将数据年收入(Annual Income (k$))和消费习惯(Spending Score (1-100))字段提出,赋给X(dataset为接收数据的)

X=dataset.loc[:,['Annual Income (k$)‘,'Annual Income (k$)']]

print(X.head())

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值