Pandas读取.csv文件

最新推荐文章于 2024-07-09 16:25:58 发布

XAL1

最新推荐文章于 2024-07-09 16:25:58 发布

阅读量2.2w

点赞数 11

文章标签： python pandas csv

本文链接：https://blog.csdn.net/weixin_45607635/article/details/117290532

版权

文章目录

导入数据
- 方法一
- 方法二
相关基本属性

导入数据

方法一

import pandas as pd
# 按文件名读取整个文件
data = pd.read_csv("churn-bigml-80.csv") 
data.head()     # 展示前几行数据，通常为展示前5行

结果如图所示：
在这里插入图片描述

方法二

# 按列标题读取每列数据
feature_name = ['State', 'Account length', 'Area code', 'International plan', 'Voice mail plan',
                        'Number vmail messages', 'Total day minutes', 'Total day calls', 'Total day charge',
                        'Total eve minutes', 'Total eve calls', 'Total eve charge', 'Total night minutes',
                        'Total night calls', 'Total night charge', 'Total intl minutes', 'Total intl calls',
                        'Total intl charge', 'Customer service calls']
target_name = ['Churn']
x_data = pd.read_csv("churn-bigml-80.csv", encoding='utf-8', usecols=feature_name)
y_data = pd.read_csv("churn-bigml-80.csv", encoding='utf-8', usecols=target_name)

print(x_data)

结果如下图所示：
在这里插入图片描述

相关基本属性

data.head( r )，data.tail( r )分别返回开头r行和末尾r行数据

若不传入数据r来指定返回行数，则默认返回前5行数据。
若不传入数据r来指定返回行数，则默认返回最后5行数据。

head_data = data.head()
tail_data = data.tail(3)

print('Default first few lines of data:\n', head_data)
print('\nLast 3 lines of data：\n', tail_data)

运行结果：
在这里插入图片描述

data.shape返回数据尺寸

s = data.shape
print(s)

运行结果：

(2666, 20)

shape[0] = 2666，即行数
shpae[1] = 20，即列数

data.dtypes返回每个属性的数据类型

ty = data.dtypes
print(ty)

运行结果：
在这里插入图片描述

data.values 返回ndarray类型的对象

value = data.values
ty = type(value)
print(ty)
print(value)

运行结果：
在这里插入图片描述

data.nunique()返回每一列中是唯一值的个数

value = data.nunique()
num_list = data.nunique().tolist()
key_list = data.nunique().keys().tolist()

print('number of unique: \n', value)
print('\nkey list: \n', key_list)
print('\nonly value list: \n', num_list)

运行结果：
在这里插入图片描述
可以看出，单独代用dataframe的属性，返回的数据类型并不是list，因此可以通过加上.tolist()来将数据转化成list，便于后续操作。

data.index返回行索引

row_index = data.index
ty = type(row_index)
row_index_list = data.index.tolist()

print('rows index: \n', row_index)
print('\ntype: \n', ty)
print('\nlist: \n', row_index_list)

运行结果：
在这里插入图片描述

data.columns返回列索引

col_index = data.columns
ty = type(col_index)
col_index_list = data.columns.tolist()

print('rows index: \n', col_index)
print('\ntype: \n', ty)
print('\nlist: \n', col_index_list)

运行结果：

这里是引用

在这里插入图片描述

data.iloc[行序号，列序号]返回元素

x1 = data.iloc[0, 0]
print(x1)

运行结果：

KS

data.loc[行索引，列索引]返回元素

x1 = data.loc[0, 'State']
print(x1)

运行结果：

KS

XAL1

关注

11
点赞
踩
108

收藏

觉得还不错? 一键收藏
0
评论
Pandas读取.csv文件

文章目录导入数据方法一方法二相关基本属性data.head( r )，data.tail( r )分别返回开头r行和末尾r行数据data.shape返回数据尺寸data.dtypes返回每个属性的数据类型data.values 返回ndarray类型的对象data.nunique()返回每一列中是唯一值的个数data.index返回行索引data.columns返回列索引data.iloc[行序号，列序号]返回元素data.loc[行索引，列索引]返回元素导入数据方法一import pandas as
复制链接

扫一扫