python数据描述(1)

1.读取数据

import pandas as pd
data=pd.read_csv('CTGNM.csv')
columns= data.columns.tolist()
columns # 显示变量信息

['LB',
 'AC',
 'FM',
 'UC',

2 .更详细的信息


data.info()

如下:

RangeIndex: 2126 entries, 0 to 2125
Data columns (total 23 columns):
LB          2126 non-null float64
AC          2126 non-null float64
FM          2126 non-null float64
UC          2126 non-null float64

依次为变量名,数据个数,是否有缺失,数据类型


3 .也可以只检查是否要有缺失值

import numpy as np
np.isnan(data).any()

如果print 出来的是 False,则说明没有缺失值

LB          False
AC          False
FM          False

4.查看数据矩阵

data.shape


5 .查看所有变量的前5个数据

data.head()


6 .把变量的数据类型统一成float64

data[0:23] = data[0:23].astype('float64')


7 .自变量和因变量的定义

(input output矩阵定义)

columns=data.columns.tolist()

#读取其中的前22个变量作为自变量
feature=columns[0:22]
print feature  #打印

#读取最后一个特征作为因变量
y_var=columns[22:23] 
print y_var


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值